سامانه مانیتورینگ سلامت سرویسها و زیرساخت HM
عنوان کامل پروژه
سامانه مانیتورینگ سلامت سرویسها و زیرساخت
نام اختصاری
Healthy Monitoring
نام کارفرما
همراه اول
سال تولید
1401
زمینه محصول
داشبورد مدیریت و مانیتورینگ
توصیف محصول
سامانه مانیتورینگ سلامت سرویسها و زیرساخت، سامانهای است که میتواند وضعیت سلامت سرویسهای عملیاتی، وضعیت عملکرد و سلامت کسبوکار، وضعیت سلامت و عملکرد شاخصها و KPI ها و وضعیت عملکرد و سلامت منابع و زیر ساختهای همراه اول را به صورت مداوم و آنلاین پایش نموده و نتیجه آن را به صورت نمودارها و اعدادی قابل درک، نمایش دهد. این سامانه حاوی بیش از 40 نوع جدول و نمودار است که هر یک اطلاعاتی در خصوص وضعیت آنلاین سلامت سرویسها و سلامت منابع سازمان را پایش نموده و به کاربر ارائه مینماید. مخاطب سامانه 3 طیف مختلف از کاربران هستند اول) مدیران سطح بالا برای درک سریع وضعیت سازمان در یک نگاه توسط داشبورد مدیریت، دوم) مدیریان میانی با بررسی اجمالی نمودارهای سطح یک و آمارها و سوم) کارشاناسان تخصصی با بررسی نمودارها، آمارها و جداول.
کاربردهای سامانه
- پایش و مانیتورینگ وضعیت سلامت سرویسها و سامانههای همراه اول
- پایش و مانیتورینگ وضعیت سلامت زیرساختهای همراه اول
- پایش و مانیتورینگ دیتاسنترهای همراه اول بر روی نقشه
ویژگیهای سامانه
- دارابودن Ui قوی و منحصر بفرد
- امکان مشاهده وضعیت کلی سلامت سرویسها و سایر پایشها در یک نظر از طریق داشبورد مدیریت
- امکان بزرگنمایی، حرکت و جابهجایی روی نمودارها
- امکان ترسیم خط آستانه روی نمودارهای KPI
- امکان Drill Down روی نمودارهای مهم
تاریخچه سامانه مانیتورینگ در جهان
سامانههای مانیتورینگ سلامت سرویسها و زیرساختها (Service and Infrastructure Health Monitoring Systems) بهمنظور پایش وضعیت و عملکرد سامانههای مختلف IT طراحی شدهاند و در هر سازمانی که بهنوعی از خدمات فناوری اطلاعات استفاده میکند، نقش حیاتی دارند. این سامانهها به مدیران وکارشناسان فناوری اطلاعات کمک میکنند که وضعیت سلامت سرویسها و سلامت زیرساختهای خود را بهطور مداوم تحت نظر داشته باشند، از بروز مشکلات جلوگیری کنند و کیفیت و پایداری خدمات را تضمین نمایند.
دهه ۱۹۶۰ و ۱۹۷۰، با گسترش استفاده از کامپیوترها در سازمانها، اولین سیستمهای نظارت بر شبکه بهمنظور مانیتورینگ سختافزار و شناسایی اختلالات به وجود آمدند. این سیستمها اغلب بهصورت دستی و بسیار محدود عمل میکردند و اطلاعات کمی را جمعآوری میکردند.
دهه ۱۹۸۰، با پیشرفت شبکههای کامپیوتری و معرفی پروتکلهایی مانند SNMP (Simple Network Management Protocol)، سیستمهای مانیتورینگ پیشرفتهتری به وجود آمدند. این پروتکل امکان مانیتورینگ خودکار و نظارت بر تجهیزات شبکه مانند روترها و سوئیچها را فراهم کرد و باعث شد سازمانها بتوانند به شکل موثرتری وضعیت شبکههای خود را پایش کنند.
دهه ۱۹۹۰، با گسترش اینترنت و ورود سیستمهای پیچیده، نیاز به نظارت بر سرویسها و نرمافزارها افزایش یافت. نرمافزارهای مانیتورینگ مانند Nagios و MRTG معرفی شدند که امکانات بیشتری برای مانیتورینگ اجزای شبکه، سرورها و سرویسهای مختلف داشتند.
دهه ۲۰۰۰، با رشد فناوریهای مجازیسازی و پردازش ابری، نیاز به سیستمهای مانیتورینگ جامعتر برای نظارت بر محیطهای چندلایه بیشتر شد. در این دوره، ابزارهایی مانند Zabbix و Splunk معرفی شدند که امکان جمعآوری، پردازش و تحلیل دادهها از منابع متنوع را فراهم کردند. همچنین با توجه به گسترش اپلیکیشنهای تحت وب، ابزارهای مانیتورینگ سرویسهای وب مانند New Relic و AppDynamics به وجود آمدند.
دهه ۲۰۱۰ به بعد، با گسترش تکنولوژیهای نوین مانند Docker، Kubernetes و محیطهای میکروسرویس، مانیتورینگ به یک بخش جداییناپذیر در مدیریت زیرساختها تبدیل شد. ابزارهای مدرن مانند Prometheus، Grafana و ELK Stack برای پایش و بصریسازی دادهها توسعه یافتند. این ابزارها امکان مانیتورینگ دقیقتر و تحلیل بلادرنگ از وضعیت زیرساختها و سرویسها را فراهم کردند.
امروزه، سیستمهای مانیتورینگ به سطوح پیشرفتهای از خودکارسازی و یادگیری ماشین رسیدهاند. با استفاده از هوش مصنوعی، این سامانهها میتوانند مشکلات را پیشبینی کرده و حتی به صورت خودکار اقدام به رفع آنها کنند. همچنین، با توسعه فناوری اینترنت اشیا (IoT)، بسیاری از سازمانها نیاز به مانیتورینگ گستردهتر برای دستگاههای متصل به شبکه دارند.
تاریخچه سامانه مانیتورینگ در ایران
سامانههای مانیتورینگ سلامت سرویسها و زیرساختها در ایران، با گسترش فناوری اطلاعات و نیاز به نظارت دقیق بر شبکهها و سرویسهای حیاتی، به بخش مهمی از زیرساختهای IT در سازمانهای مختلف تبدیل شدهاند. این سامانهها از نظر کاربردی برای مدیران فناوری اطلاعات، تیمهای عملیاتی و مدیران کسبوکار اهمیت بالایی دارند، زیرا با پایش و تحلیل وضعیت سرویسها، از وقوع مشکلات جلوگیری میکنند و تضمین میکنند که سرویسها و زیرساختها همیشه در بهترین حالت ممکن باشند.
در دهه ۱۳۷۰ با ورود شبکههای کامپیوتری به سازمانها و ارگانهای بزرگ دولتی و خصوصی در ایران، نیاز به پایش و نظارت بر زیرساختهای شبکه و سرورها افزایش یافت. در این زمان از ابزارهای ابتدایی مانیتورینگ استفاده میشد که بیشتر برای پایش وضعیت شبکه و سرورها به کار میرفت. این ابزارها عمدتاً بهشکل وارداتی بودند و از پروتکلهای استاندارد مانند SNMP استفاده میکردند تا اطلاعات پایهای را از دستگاهها دریافت کنند.
در دهه ۱۳۸۰ با گسترش اینترنت و زیرساختهای شبکهای، سازمانها به سیستمهای مانیتورینگ جامعتر و پیشرفتهتری نیاز پیدا کردند. در این دوره، نرمافزارهای خارجی همچون Nagios و MRTG بهطور گسترده توسط سازمانهای ایرانی مورد استفاده قرار گرفتند. همچنین، برخی از شرکتهای ایرانی شروع به توسعه نرمافزارهای بومی برای مانیتورینگ شبکه و زیرساخت کردند. این راهکارهای بومی معمولاً نسخههای سادهای از سیستمهای خارجی بودند و قابلیتهای محدودی داشتند.
دهه ۱۳۹۰ را میتوان دوره رشد و پیشرفت قابلتوجه سامانههای مانیتورینگ بومی در ایران دانست. با افزایش نیاز سازمانها به نظارت دقیقتر و پایش بلادرنگ سرویسها و زیرساختها، شرکتهای ایرانی شروع به تولید و توسعه نرمافزارهای مانیتورینگ پیشرفته کردند. در این دوره نرمافزارهایی مانند “پاد”، “سمکا” و “ناظرانت” معرفی شدند که قابلیت مانیتورینگ شبکه، سرورها و سرویسهای نرمافزاری را به سازمانها ارائه میدادند.
در دهه ۱۴۰۰ با افزایش استفاده از فناوریهای نوین مانند کانتینرها، میکروسرویسها و پردازش ابری، سامانههای مانیتورینگ در ایران نیز پیشرفت قابلتوجهی کردهاند. بسیاری از شرکتهای فناوری اطلاعات داخلی به ارائه راهکارهای پیشرفتهتری پرداختهاند که قابلیتهای بلادرنگ، پایش گسترده و هوش مصنوعی را شامل میشوند. نرمافزارهای مانیتورینگ بومی در ایران اکنون توانایی نظارت بر محیطهای پیچیده و گسترده را دارند و بسیاری از آنها از قابلیتهایی مانند پیشبینی خرابیها، تحلیل دادههای تاریخی و نظارت بر زیرساختهای مجازی بهره میبرند.
هدف از تولید محصول
همراه اول، از تولید سامانه مانیتورینگ سلامت اهداف زیر را دنبال میکند:
- اطلاع مدیران سطح بالا و میانی از وضعیت کلی سلامت سرویسها و سامانهها
- اطلاع کارشناسان تخصصی از ریز اشکالات سلامت سرویسها و منابع با عمیق شدن در هر مشکل کلی
- امکان تحلیل مشکلات توسط مدیران میانی از کنارهم قراردادن نمودارها و نتایج پایشها
- جمعآوری داده سلامت سرویسها و سامانهها برای انجام تحلیلهای کسبوکار و توسعههای آتی
این ماژول بخشی از سامانه است که وظیفه نمایش اطلاعات کلی و خلاصه شده از وضعیت عملکرد و سلامت سرویسها، وضعیت دیتاسنترها روی نقشه و عملکرد و وضعیت سلامت کسبوکارهای مهم را بر عهده داد. از ویژگیهای مهم این ماژول UI خاص مدیریتی، اطلاع رسانی حداکثری با یک نظر دیدن و سادگی فهم آن است.
کاربرد این ماژول در اطلاعرسانی به مدیران سطح بالا از وضعیت کلی سامانهها و سرویسها است. این اطلاعرسانی بهگونهای است که حداکثر دادهها در حداقل زمان و با فهم سریع و ساده باید اتفاق بیفتد چرا که مدیران اغلب زمان و حوصله و حتی نیاز به اطلاعات جزئیات نداشته و برای آنها کلیات و اهم وقایع اولویت دارد.
وظیفه این ماژول نمایش نمودار وضعیت KPI های سازمان است به نحوی که هر KPI به صورت یک نمودار منحنی در طول زمان نمایش داده میشود. اغلب KPI ها حاوی یک مقدار(تعداد تراکنش) هستند ولی در عین حال تعدادی از KPI ها حاوی 3 مقدار(تعداد کل تراکنش، تعداد تراکنشهای موفق و تعداد تراکنشهای ناموفق) هستند که این 3 مقدار با 3 رنگ مختلف بر روی یک نمودار نمایش داده میشوند.
از این ماژول برای درک وضعیت استفاده کاربران از سرویسهای عموماً خدماتی سامانهها در طول زمان استفاده میشود. این نمودارها نشان میدهند که هر سرویس خدماتی در طول زمان چند بار توسط کاربران استفاده شده است. همچنین با تعیین خطوط آستانه روی هر نمودار میتوان متوجه شد در چه زمانهائی این سرویسها کمتر با بیشتر از حد مورد هدف سازمان استفاده شدهاند.
وظیفه این ماژول نمایش سلامت سرویسها و نحوه ارتباط آنها با مرکز ESB است. این ماژول کلیه سرویسهای مهم سازمان را در یک نمودار نمایش داده و میزان سلامت آنها را بر اساس تعداد تراکنشهای موفق و نسبت آن به کل تراکنشها را محاسبه و نمایش میدهد.
از این ماژول برای نمایش وضعیت و میزان سلامت سرویسهای مهم سازمان استفاده میشود. کاربر با دیدن این نمودار در یک نگاه می تواند درصد سلامت هر سرویس را که حاصل نسبت تعداد تراکنشهای موفق از کل تراکنشها است را مشاهده و در صورت رویت اختلال در وضعیت سلامت سرویسها نسبت به رفع آن اقدام نماید.
ماژول پایش کسبوکار حاوی چندین باکس است که هر باکس بهصورت کلی یک کسبوکار همراه اول را نمایش میدهد. منظور از کسبوکار در اینجا سرویسهایی است که همراه اول از محل آنها درآمد کسب مینماید. هر باکس شامل یک عدد بهعنوان میزان سلامت کلی آن کسبوکار است و نسبت تعداد تراکنشهای موفق آن کسبوکار به کل تراکنشها است. در داخل هر باکس نیز سرویسهای داخلی همراه اول هستند که همراه با هم آن کسبوکار را پوشش میدهند. این ریز سرویسها نیز یک عدد بین 1 تا 100 به عنوان درصد سلامت دارند.
از این ماژول برای مشاهده وضعیت سلامت سرویسهای درآمدزائی همراه اول استفاده میشود و میتوانیم با دیدن هر کدام میتواند متوجه شویم کدام کسبوکار همراه اول دچار نقص در سرویسدهی شده است. درصورتیکه هر کدام از سرویسها سلامتی کمتر از 100 داشته باشند میتوانیم با مشاهده سلامت اجزاء آن سرویس، نقطه و ریزسرویس دارای اشکال را تشخیص دهیم.
از این ماژول برای اطلاع از 2 بخش عمده از میزان مصرف منابع استفاده میشود اول) میزان سلامت هر دیتاسنتر که بر اساس میزان تراکنشهای موفق آن دیتاسنتر نسبت به کل تراکنشهای آن محاسبه میشود و دوم) میزان استفاده شده از منابع دیتاسنتر شامل میزان استفاده از CPU و حافشه اصلی و حافظه جانبی میباشد.
مزیتهای رقابتی محصول (نسبت به سایرین)
- دارابودن Ui قوی و منحصر بفرد
- امکان مشاهده وضعیت کلی سرویسها و سایر پایشها در یک نظر
- امکان بزرگنمایی و زوم روی نمودارها
- امکان ترسیم خط آستانه روی نمودارهای KPI







