Základní nástroje pro monitoring serveru

Základní nástroje pro monitoring serveru

Sledování dění na serveru a stavu, v němž se operační systém nachází, je klíčové nejen při diagnostice již nastalých problémů, ale také k prevenci jejich vzniku.

Obsazenost diskového prostoru, využití operační paměti či přehled aktuální zátěže serveru jsou proto základními ukazateli, které by měl být administrátor schopen si zobrazit.

Využití diskové kapacity

Přehled všech připojených souborových systémů i s jejich obsazeností si můžeme vypsat příkazem df (zkratka disk free). Tento příkaz ovšem ve výchozím režimu zobrazuje údaje v blocích – pro srozumitelnější zobrazení v jednotkách KB, MB, GB apod. je vhodné použít přepínač -h:

$ df -h
Souborový systém Velikost Užito Volno Užito Připojeno do
/dev/vda2 99G 20G 75G 21% /

V případě, že je připojeno více souborových systémů (například externí disky nebo další diskové oddíly), můžeme v posledním sloupci vždy vidět cestu, jejímž prostřednictvím lze k tomuto systému přistupovat (o připojování souborových systémů si povíme později).

Využití operační paměti

Podobně, jako můžeme zjistit obsazenost diskového prostoru, lze si vypsat také využití operační paměti. K tomu slouží příkaz free. Ten ve výchozím stavu zobrazuje hodnoty pro změnu v bajtech, takže pro zobrazení v inteligentním formátu využijeme přepínač -m, který nám zobrazí hodnoty v MB:

$ free -m
total used free shared buffers cached
Mem: 4962 3376 1586 0 210 1871
-/+ buffers/cache: 1295 3667
Swap: 3813 219 3594

Výpis nepotřebuje dalšího komentáře. Pro úplnost pouze uveďme, že zde máme zobrazené hodnoty jak operační paměti (Mem:), tak odkládacího diskového oddílu (Swap:).

Vytíženost serveru

Posledním ze „svaté trojice“ je pak příkaz top. Díky němu zjistíme jak je na tom operační systém s celkovou zátěží. Zobrazí jednak přehled spuštěných úloh s informacemi o jejich paměťových a procesorových nárocích a dále obecné informace o loadu (zatížení) serveru:


top – 12:22:49 up 2 days, 18:00, 1 user, load average: 0.09, 0.20, 0.22
Tasks: 140 total, 1 running, 139 sleeping, 0 stopped, 0 zombie
Cpu(s): 0.2%us, 0.4%sy, 0.0%ni, 99.2%id, 0.0%wa, 0.0%hi, 0.1%si
Mem: 5081960k total, 3692364k used, 1389596k free, 216320k buffers
Swap: 3905532k total, 224640k used, 3680892k free, 1953192k cached


SHR S %CPU %MEM TIME+ COMMAND
9305 web98 20 0 326m 40m 26m S 1 0.8 0:07.71 php-cgi
510 syslog 20 0 243m 2228 180 S 0 0.0 0:59.11 rsyslogd
2555 list 20 0 59844 1936 852 S 0 0.0 0:33.12 python
3073 root 20 0 479m 4024 1360 S 0 0.1 2:48.59 fail2ban-server
11303 root 20 0 17340 1308 944 R 0 0.0 0:00.12 top
11313 www-data 20 0 414m 4772 2088 S 0 0.1 0:00.01 apache2

Údaj o loadu serveru ukazuje průměrné množství procesů, které jsou ve stavu, kdy by chtěli nějakým způsobem využít procesorovou jednotku a udávají, jak moc je systém zaneprázdněn v čase. Údaj loadu serveru se průměruje přes 3 časové intervaly a to 1, 5 a 15 minut. Jelikož tento údaj není nijak normalizován, je na správci serveru, aby tuto hodnotu správně interpretoval. Bližší informace lze nalézt v manuálové stránce příkazu uptime.

Představili jsme si tři klíčové příkazy pro základní monitoring serveru. Později se společně podíváme také na pokročilejší nástroje jako htop, dmesg, lsmod a jiné.

Autor: Jirka Dvořák

Nejlepší články

úložné boxy pro součástky a komponenty
Supermicro server s AMD CPU
Chladící infrastruktura s technologií freecooling