سامانه مانیتورینگ سلامت سرویس‌ها و زیرساخت HM

عنوان کامل پروژه

سامانه مانیتورینگ سلامت سرویس‌ها و زیرساخت

نام اختصاری

Healthy Monitoring

نام کارفرما

همراه اول

سال تولید

1401

زمینه محصول

داشبورد مدیریت و مانیتورینگ

توصیف محصول

سامانه مانیتورینگ سلامت سرویس‌ها و زیرساخت، سامانه‌ای است که می‌تواند وضعیت سلامت سرویس‌های عملیاتی، وضعیت عملکرد و سلامت کسب‌وکار، وضعیت سلامت و عملکرد شاخص‌ها و KPI ها و وضعیت عملکرد و سلامت منابع و زیر ساخت‌های همراه اول را به صورت مداوم و آنلاین پایش نموده و نتیجه آن را به صورت نمودارها و اعدادی قابل درک، نمایش دهد. این سامانه حاوی بیش از 40 نوع جدول و نمودار است که هر یک اطلاعاتی در خصوص وضعیت آنلاین سلامت سرویس‌ها و سلامت منابع سازمان را پایش نموده و به کاربر ارائه می‌نماید. مخاطب سامانه 3 طیف مختلف از کاربران هستند اول) مدیران سطح بالا برای درک سریع وضعیت سازمان در یک نگاه توسط داشبورد مدیریت، دوم) مدیریان میانی با بررسی اجمالی نمودارهای سطح یک و آمارها و سوم) کارشاناسان تخصصی با بررسی نمودارها، آمارها و جداول.

کاربردهای سامانه

  • پایش و مانیتورینگ وضعیت سلامت سرویس‌ها و سامانه‌های همراه اول
  • پایش و مانیتورینگ وضعیت سلامت زیرساخت‌های همراه اول
  • پایش و مانیتورینگ دیتاسنترهای همراه اول بر روی نقشه

ویژگی‌های سامانه

  • دارابودن Ui قوی و منحصر بفرد
  • امکان مشاهده وضعیت کلی سلامت سرویس‌ها و سایر پایش‌ها در یک نظر از طریق داشبورد مدیریت
  • امکان بزرگ‌نمایی، حرکت و جابه‌جایی روی نمودارها
  • امکان ترسیم خط آستانه روی نمودارهای KPI
  • امکان Drill Down روی نمودارهای مهم

تاریخچه سامانه مانیتورینگ در جهان

سامانه‌های مانیتورینگ سلامت سرویس‌ها و زیرساخت‌ها (Service and Infrastructure Health Monitoring Systems) به‌منظور پایش وضعیت و عملکرد سامانه‌های مختلف IT  طراحی شده‌اند و در هر سازمانی که به‌نوعی از خدمات فناوری اطلاعات استفاده می‌کند، نقش حیاتی دارند. این سامانه‌ها به مدیران وکارشناسان فناوری اطلاعات کمک می‌کنند که وضعیت سلامت سرویس‌ها و سلامت زیرساخت‌های خود را به‌طور مداوم تحت نظر داشته باشند، از بروز مشکلات جلوگیری کنند و کیفیت و پایداری خدمات را تضمین نمایند.

دهه ۱۹۶۰ و ۱۹۷۰، با گسترش استفاده از کامپیوترها در سازمان‌ها، اولین سیستم‌های نظارت بر شبکه به‌منظور مانیتورینگ سخت‌افزار و شناسایی اختلالات به وجود آمدند. این سیستم‌ها اغلب به‌صورت دستی و بسیار محدود عمل می‌کردند و اطلاعات کمی را جمع‌آوری می‌کردند.

دهه ۱۹۸۰،  با پیشرفت شبکه‌های کامپیوتری و معرفی پروتکل‌هایی مانند SNMP (Simple Network Management Protocol)، سیستم‌های مانیتورینگ پیشرفته‌تری به وجود آمدند. این پروتکل امکان مانیتورینگ خودکار و نظارت بر تجهیزات شبکه مانند روترها و سوئیچ‌ها را فراهم کرد و باعث شد سازمان‌ها بتوانند به شکل موثرتری وضعیت شبکه‌های خود را پایش کنند.

دهه ۱۹۹۰، با گسترش اینترنت و ورود سیستم‌های پیچیده، نیاز به نظارت بر سرویس‌ها و نرم‌افزارها افزایش یافت. نرم‌افزارهای مانیتورینگ مانند Nagios و MRTG معرفی شدند که امکانات بیشتری برای مانیتورینگ اجزای شبکه، سرورها و سرویس‌های مختلف داشتند.

دهه ۲۰۰۰، با رشد فناوری‌های مجازی‌سازی و پردازش ابری، نیاز به سیستم‌های مانیتورینگ جامع‌تر برای نظارت بر محیط‌های چندلایه بیشتر شد. در این دوره، ابزارهایی مانند Zabbix و Splunk معرفی شدند که امکان جمع‌آوری، پردازش و تحلیل داده‌ها از منابع متنوع را فراهم کردند. همچنین با توجه به گسترش اپلیکیشن‌های تحت وب، ابزارهای مانیتورینگ سرویس‌های وب مانند New Relic و AppDynamics به وجود آمدند.

دهه ۲۰۱۰ به بعد، با گسترش تکنولوژی‌های نوین مانند Docker، Kubernetes و محیط‌های میکروسرویس، مانیتورینگ به یک بخش جدایی‌ناپذیر در مدیریت زیرساخت‌ها تبدیل شد. ابزارهای مدرن مانند Prometheus، Grafana و ELK Stack برای پایش و بصری‌سازی داده‌ها توسعه یافتند. این ابزارها امکان مانیتورینگ دقیق‌تر و تحلیل بلادرنگ از وضعیت زیرساخت‌ها و سرویس‌ها را فراهم کردند.

امروزه، سیستم‌های مانیتورینگ به سطوح پیشرفته‌ای از خودکارسازی و یادگیری ماشین رسیده‌اند. با استفاده از هوش مصنوعی، این سامانه‌ها می‌توانند مشکلات را پیش‌بینی کرده و حتی به صورت خودکار اقدام به رفع آن‌ها کنند. همچنین، با توسعه فناوری اینترنت اشیا (IoT)، بسیاری از سازمان‌ها نیاز به مانیتورینگ گسترده‌تر برای دستگاه‌های متصل به شبکه دارند.

تاریخچه سامانه مانیتورینگ در ایران

سامانه‌های مانیتورینگ سلامت سرویس‌ها و زیرساخت‌ها در ایران، با گسترش فناوری اطلاعات و نیاز به نظارت دقیق بر شبکه‌ها و سرویس‌های حیاتی، به بخش مهمی از زیرساخت‌های IT در سازمان‌های مختلف تبدیل شده‌اند. این سامانه‌ها از نظر کاربردی برای مدیران فناوری اطلاعات، تیم‌های عملیاتی و مدیران کسب‌وکار اهمیت بالایی دارند، زیرا با پایش و تحلیل وضعیت سرویس‌ها، از وقوع مشکلات جلوگیری می‌کنند و تضمین می‌کنند که سرویس‌ها و زیرساخت‌ها همیشه در بهترین حالت ممکن باشند.

در دهه ۱۳۷۰ با ورود شبکه‌های کامپیوتری به سازمان‌ها و ارگان‌های بزرگ دولتی و خصوصی در ایران، نیاز به پایش و نظارت بر زیرساخت‌های شبکه و سرورها افزایش یافت. در این زمان از ابزارهای ابتدایی مانیتورینگ استفاده می‌شد که بیشتر برای پایش وضعیت شبکه و سرورها به کار می‌رفت. این ابزارها عمدتاً به‌شکل وارداتی بودند و از پروتکل‌های استاندارد مانند SNMP استفاده می‌کردند تا اطلاعات پایه‌ای را از دستگاه‌ها دریافت کنند.

در دهه ۱۳۸۰ با گسترش اینترنت و زیرساخت‌های شبکه‌ای، سازمان‌ها به سیستم‌های مانیتورینگ جامع‌تر و پیشرفته‌تری نیاز پیدا کردند. در این دوره، نرم‌افزارهای خارجی همچون Nagios و MRTG به‌طور گسترده توسط سازمان‌های ایرانی مورد استفاده قرار گرفتند. همچنین، برخی از شرکت‌های ایرانی شروع به توسعه نرم‌افزارهای بومی برای مانیتورینگ شبکه و زیرساخت کردند. این راهکارهای بومی معمولاً نسخه‌های ساده‌ای از سیستم‌های خارجی بودند و قابلیت‌های محدودی داشتند.

دهه ۱۳۹۰ را می‌توان دوره رشد و پیشرفت قابل‌توجه سامانه‌های مانیتورینگ بومی در ایران دانست. با افزایش نیاز سازمان‌ها به نظارت دقیق‌تر و پایش بلادرنگ سرویس‌ها و زیرساخت‌ها، شرکت‌های ایرانی شروع به تولید و توسعه نرم‌افزارهای مانیتورینگ پیشرفته کردند. در این دوره نرم‌افزارهایی مانند “پاد”، “سمکا” و “ناظرانت” معرفی شدند که قابلیت مانیتورینگ شبکه، سرورها و سرویس‌های نرم‌افزاری را به سازمان‌ها ارائه می‌دادند.

در دهه ۱۴۰۰ با افزایش استفاده از فناوری‌های نوین مانند کانتینرها، میکروسرویس‌ها و پردازش ابری، سامانه‌های مانیتورینگ در ایران نیز پیشرفت قابل‌توجهی کرده‌اند. بسیاری از شرکت‌های فناوری اطلاعات داخلی به ارائه راهکارهای پیشرفته‌تری پرداخته‌اند که قابلیت‌های بلادرنگ، پایش گسترده و هوش مصنوعی را شامل می‌شوند. نرم‌افزارهای مانیتورینگ بومی در ایران اکنون توانایی نظارت بر محیط‌های پیچیده و گسترده را دارند و بسیاری از آن‌ها از قابلیت‌هایی مانند پیش‌بینی خرابی‌ها، تحلیل داده‌های تاریخی و نظارت بر زیرساخت‌های مجازی بهره می‌برند.

هدف از تولید محصول

همراه اول، از تولید سامانه مانیتورینگ سلامت اهداف زیر را دنبال می‌کند:

  • اطلاع مدیران سطح بالا و میانی از وضعیت کلی سلامت سرویس‌ها و سامانه‌ها
  • اطلاع کارشناسان تخصصی از ریز اشکالات سلامت سرویس‌ها و منابع با عمیق شدن در هر مشکل کلی
  • امکان تحلیل مشکلات توسط مدیران میانی از کنارهم قراردادن نمودارها و نتایج پایش‌ها
  • جمع‌آوری داده سلامت سرویس‌ها و سامانه‌ها برای انجام تحلیل‌های کسب‌وکار و توسعه‌های آتی

این ماژول بخشی از سامانه است که وظیفه نمایش اطلاعات کلی و خلاصه شده از وضعیت عملکرد و سلامت سرویس‌ها، وضعیت دیتاسنترها روی نقشه و عملکرد و وضعیت سلامت کسب‌وکارهای مهم را بر عهده داد. از ویژگی‌های مهم این ماژول UI خاص مدیریتی، اطلاع رسانی حداکثری با یک نظر دیدن و سادگی فهم آن است.

کاربرد این ماژول در اطلاع‌رسانی به مدیران سطح بالا از وضعیت کلی سامانه‌ها و سرویس‌ها است. این اطلاع‌رسانی به‌گونه‌ای است که حداکثر داده‌ها در حداقل زمان و با فهم سریع و ساده باید اتفاق بیفتد چرا که مدیران اغلب زمان و حوصله و حتی نیاز به اطلاعات جزئیات نداشته و برای آنها کلیات و اهم وقایع اولویت دارد.

وظیفه این ماژول نمایش نمودار وضعیت KPI های سازمان است به نحوی که هر KPI به صورت یک نمودار منحنی در طول زمان نمایش داده می‌شود. اغلب KPI ها حاوی یک مقدار(تعداد تراکنش) هستند ولی در عین حال تعدادی از KPI ها حاوی 3 مقدار(تعداد کل تراکنش، تعداد تراکنش‌های موفق و تعداد تراکنش‌های ناموفق) هستند که این 3 مقدار با 3 رنگ مختلف بر روی یک نمودار نمایش داده می‌شوند.

از این ماژول برای درک وضعیت استفاده کاربران از سرویس‌های عموماً خدماتی سامانه‌ها در طول زمان استفاده می‌شود. این نمودارها نشان می‌دهند که هر سرویس خدماتی در طول زمان چند بار توسط کاربران استفاده شده است. همچنین با تعیین خطوط آستانه روی هر نمودار می‌توان متوجه شد در چه زمان‌هائی این سرویس‌ها کمتر با بیشتر از حد مورد هدف سازمان استفاده شده‌اند.

وظیفه این ماژول نمایش سلامت سرویس‌ها و نحوه ارتباط آنها با مرکز ESB است. این ماژول کلیه سرویس‌های مهم سازمان را در یک نمودار نمایش داده و میزان سلامت آنها را بر اساس تعداد تراکنش‌های موفق و نسبت آن به کل تراکنش‌ها را محاسبه و نمایش می‌دهد.

از این ماژول برای نمایش وضعیت و میزان سلامت سرویس‌های مهم سازمان استفاده می‌شود. کاربر با دیدن این نمودار در یک نگاه می تواند درصد سلامت هر سرویس را که حاصل نسبت تعداد تراکنش‌های موفق از کل تراکنش‌ها است را مشاهده و در صورت رویت اختلال در وضعیت سلامت سرویس‌ها نسبت به رفع آن اقدام نماید.

ماژول پایش کسب‌وکار حاوی چندین باکس است که هر باکس به‌صورت کلی یک کسب‌وکار همراه اول را نمایش می‌دهد. منظور از کسب‌وکار در اینجا سرویس‌هایی است که همراه اول از محل آنها درآمد کسب می‌نماید. هر باکس شامل یک عدد به‌عنوان میزان سلامت کلی آن کسب‌وکار است و نسبت تعداد تراکنش‌های موفق آن کسب‌وکار به کل تراکنش‌ها است. در داخل هر باکس نیز سرویس‌های داخلی همراه اول هستند که همراه با هم آن کسب‌وکار را پوشش می‌دهند. این ریز سرویس‌ها نیز یک عدد بین 1 تا 100 به عنوان درصد سلامت دارند.

از این ماژول برای مشاهده وضعیت سلامت سرویس‌های درآمدزائی همراه اول استفاده می‌شود و می‌توانیم با دیدن هر کدام می‌تواند متوجه شویم کدام کسب‌وکار همراه اول دچار نقص در سرویس‌دهی شده است. درصورتی‌که هر کدام از سرویس‌ها سلامتی کمتر از 100 داشته باشند می‌توانیم با مشاهده سلامت اجزاء آن سرویس، نقطه و ریزسرویس دارای اشکال را تشخیص دهیم.

وظیفه این ماژول نمایش میزان استفاده از منابع زیر ساخت دیتا سنترها و همچنین میزان سلامت و استفاده هر سامانه از منابع دیتا سنترها را بر عهده دارد.

از این ماژول برای اطلاع از 2 بخش عمده از میزان مصرف منابع استفاده می‌شود اول) میزان سلامت هر دیتاسنتر که بر اساس میزان تراکنش‌های موفق آن دیتاسنتر نسبت به کل تراکنش‌های آن محاسبه می‌شود و دوم) میزان استفاده شده از منابع دیتاسنتر شامل میزان استفاده از CPU و حافشه اصلی و حافظه جانبی می‌باشد.

وظیفه این ماژول اطلاع‌رسانی نسبت به سوابق دریافت اطلاعات به تفکیک 2 منبع اصلی یعنی اول) فایل‌های اکسل دریافتی از Ftp که حاوی تراکنش سرویس‌ها هستند و دوم) اطلاعت دریافتی از Api ها که حاول اطلاعات KPIها هستند.
با استفاده از این ماژول کاربر سامانه می‌تواند نسبت به بررسی زمان‌ها و نتایج دریافت و واکشی اطلاعات از مبدأ اقدام نموده و در صورت مشاهده اختلال در آنها وضعیت را بررسی و رفع نماید.

مزیت‌های رقابتی محصول (نسبت به سایرین)

  • دارابودن Ui قوی و منحصر بفرد
  • امکان مشاهده وضعیت کلی سرویس‌ها و سایر پایش‌ها در یک نظر
  • امکان بزرگ‌نمایی و زوم روی نمودارها
  • امکان ترسیم خط آستانه روی نمودارهای KPI