بررسی load average و مانیتورینگ در لینوکس

در این مقاله به یکی از مهمترین و چالش برانگیزترین وظایف یک مدیر سرور می پردازیم که باید به صورت دائمی و مرتب آن را بررسی کنید و آن هم بررسی load average و مانیتورینگ در لینوکس می باشد.

 

قبل از پرداختن به ادامه آموزش لازم هستش دو مورد مهم را برای شما شرح دهیم :

 

System load/CPU Load بررسی میزان حداکثر و حداقل استفاده از cpu در سیستم های لینوکسی، تعداد پروسه هایی که cpu در حال پاسخ دهی به آنها و یا در حالت انتظار می باشد.

 

Load average متوسط مقدار مصرف cpu توسط سیستم در بازه های 1 دقیقه، 5 دقیقه و پانزده دقیقه است. به صورت تکنیکال load average میزان مصرف منابع سرور توسط پروسه ها در سطح کرنل لینوکس می باشد.

 

نحوه مانیتورینگ load average در لینوکس

 

روشهای متفاوتی برای مانیتورینگ سرویس ها و پروسه ها در لینوکس وجود دارد همانند دستور uptime که نمایش دهنده مدت زمان بالا بودن سرور، تعداد یوزرها و load average می باشد.

 

در عکس زیر خروجی این دستور را مشاهده می کنید

 

 

بررسی load average و مانیتورینگ در لینوکس

 

 

همانطور که مشاهده می کنید مقدار متوسط مصرف سرور من از منابع cpu به ازای هر دقیقه در حدود 0.00 و برای 5 و 15 دقیقه برابر 0.03 و 0.05 می باشد که نشان دهنده طبیعی بودن فرآیند سرور و پروسه هاست و فشاری بر روی سرور وجود ندارد اگر این اعداد به 2 برابر مقدار تعداد هسته های cpu شما رسید نشان دهنده بروز مشکل جدی و عدم توانایی سرور شما برای هندل پروسه ها خواهد بود و مشکل overload رخ داده است و باید سریعا رسیدگی شود.

حتما بخوانید :  آموزش مانیتورینگ سرور mysql توسط دستور mytop

 

دستور کاربردی و مهم بعدی top هستش که اطلاعات دقیقتری از سرور در اختیار ما قرار می دهد.

 

دستور مانیتورینگ top

 

در عکس بالا همانطور که مشاهده می کنید نقاط مهمی که باید به آنها توجه کنید وحاوی اطلاعات مهم هستند مشخص شده است.

 

همچنین در فایل proc/loadavg/ می توانید میزان load average سرور را مشاهده کنید.

 

 

همیشه برای بررسی load average و مانیتورینگ در لینوکس به عنوان مدیر سرور باید ابتدا فایل موجود حاوی اطلاعات سرور خودتان را با دستور زیر بررسی کرده و تعداد core و یا هسته های سی پیو سرور خودتان را پیدا کنید و سپس بر اساس منابع موجود مبنا را بر دو برابر تعداد core قرار بدید و با خروجی دستور uptime مطابقت دهید اگر اعداد موجود بیش از دو برابر بود حتما سرور خودتان را مورد بررسی دقیق قرار دهید تا مشکل اصلی آن را پیدا کنید.

1 ستاره2 ستاره3 ستاره4 ستاره5 ستاره (امتیاز بدهید)
Loading...