{autotoc}

Mi is az a hálózatfelügyelet?

Hálózatfelügyelet alatt kiszolgálók és kliensgépek felügyeletét értjük, melynek célja, hogy folyamatosan elérhetőek és használhatók legyenek az azokon futtatott szolgáltatások. Ennek során figyelni kell az operációs rendszert éppúgy, mint a futó szolgáltatásokat, és a használt hálózatot.

A NAGIOS

A legnépszerűbb felügyeleti eszköz a Nagios, mely hosszú évek óta jelen van a nyílt forráskódú szoftverek között. Nem is olyan régen még NetSaint-nek hívták, azonban az 1.0-s verziót elérve a vezető programozó úgy döntött, hogy a rengeteg változás miatt új nevet ad a szoftvernek, mivel az szinte nem is hasonlított a régi verziókra.

A Nagios futtatásához Linux vagy valamilyen UNIX variáns szükséges, valamint egy C fordító. Ha a szoftver grafikus szolgáltatásait is igénybe szeretnénk venni, akkor egy webkiszolgáló alkalmazást (ajánlott az Apache) is telepítenünk kell. Természetesen rendelkeznünk kell TCP/IP támogatással is, mivel a legtöbb lekérdezés általában hálózaton keresztül történik.

Kiegészítőként kapható a Nagios-szal tökéletesen integrálható hardver, melynek segítségével többek között nyomon követhető a szerverszoba hőmérséklete és sok más adat is. A szoftver maga tökéletesen moduláris, és nem elhanyagolható előny a kitűnő webes felület, melyet hatékonyan egészít ki a WAP-os felület, hogy minden igényt kielégítsen.

A monitorozó rendszer erőforrásigénye kicsi, azonban a helyes konfigurálásához tapasztalt rendszergazda szükséges.

A NAGIOS lehetőségei

  • szolgáltatások távoli felügyelete, kiszolgálók erőforrásainak megtekintése
  • adatbázis-kapcsolat a konfigurációs fájlok tárolására
  • csoportosítható szolgáltatás- és kiszolgáló felügyelet
  • csoportosítható felügyeleti személyek, csoportok
  • értesítés nem csak e-mailben, hanem akár sms-en vagy azonnali üzenetküldő szolgáltatáson keresztül
  • korszerű bővítménykezelés további szolgáltatások felügyeletére
  • eseménykezelő rendszer a problémák azonnali elhárítására
  • web- és WAP-alapú megjelenítési rendszer
  • hardver integráció
  • elosztott felügyelet
  • klaszterek felügyelete

A NAGIOS felépítése és működése

A Nagios tulajdonképpen egy mag, mely önmagában nem lenne használható. Ez a mag nem képes szolgáltatások ellenőrzésére, adatok elemzésére, egyszerűen csak a megkapott adatokat jeleníti meg, illetve reagál ezek szerint. Hogyan lesz mégis használható? A munka legnagyobb részét a modulok végzik, melyek beépülnek a Nagios-ba. Ezek ellenőrzik a szolgáltatásokat, és jelentenek a Nagios-nak. Ezeken kívül, gyakorlatilag a legfelső szinten jelenik meg a web- és WAP-alapú felület, ahol a legjobban értelmezhető módon, vizuálisan jelenik meg az információ. Opcionális a hardverelem, amely szintén bővítmény használatával adja át az adatokat. Külön osztályt alkotnak a kiegészítők, melyek nem a felügyeleti gépen futó alkalmazások, azonban mégis a Nagios-hoz tartoznak és a távoli gépek erőforrás-kihasználtságát vagy a szolgáltatások állapotát közvetítik. A rendszer rugalmasságát növeli, hogy a rengeteg beépített funkció mellett saját magunk által írt pluginokat is használhatunk.

A hibák meghatározása

A felügyelt szolgáltatásoknál fontos kérdés, hogy ha nem tudunk egy adott szolgáltatásról információt szerezni, akkor az a kiszolgáló, az adott szolgáltatás vagy a hálózat hibája-e. Ha egy kiszolgálón futó szolgáltatás hibáját érzékeli a Nagios, akkor megvizsgálja, hogy a kiszolgáló egyáltalán működik-e. Amennyiben nem, akkor felesleges a szolgáltatások hibájáról értesítést küldenie, hiszen mindegyik hibás lesz.

Amennyiben a kiszolgáló működik, kiküldi a hibajelentést. Ha a kiszolgáló elérhetetlen, akkor felmerül a kérdés, hogy hardver vagy hálózati hiba okozza-e a kiesést. A Nagios számára a hálózat felépítése a következő: amelyik felügyelt géppel azonos hálózaton van, illetve közvetlenül eléri azt, akkor azt a számítógépet helyi gépnek tekinti. Minden más felügyelt gép a Nagios szempontjából távolinak tekintendő. Hogy miért is fontos ez? Ha több számítógépen érjük el a felügyelt kiszolgálókat, akkor lehetséges, hogy egy közbülső, összekötő gép esett ki. A gépek közötti reláció meghatározására a Nagios bevezette a számítógépek közötti függőségeket és a szülő-gyermek kapcsolatot. Ezáltal ha kiesik egy kiszolgáló, de már a szülője sem elérhető, akkor feltételezhetjük, hogy a szülő kiesése okozta a problémát. Ha több úton is el tudunk jutni egy adott szolgáltatásig, akkor ennek segítségével még könnyebben meghatározható, hogy valóban a közbülső számítógép esett-e ki. A hibák meghatározását elvégzi helyettünk a Nagios, ennek az eredményét tekinthetjük meg a web-es felületen.

Amennyiben hiba lép fel, akkor felmerül a kérdés, miként is osztályozhatók ezek a problémák. A Nagios két hibatípust ismer:

  1. Soft: az enyhe hiba kategória, amikor még nem bizonyosodott be teljesen, hogy hibás a szolgáltatás.
  2. Hard: súlyos hiba, amikor bebizonyosodott, hogy a szolgáltatás vagy a kiszolgáló hibás.

Hogy mikor válik bizonyossá egy szolgáltatás vagy kiszolgáló hibája, az a konfigurációs paraméterek beállításával szabályozható. Ehhez hasznos segítséget nyújt a Nagios dokumentációja.

A Nagios eseménykezelője

Amennyiben a Nagios valós hibát észlel, akkor még az értesítés előtt megpróbál beavatkozni. Erre valók az eseménykezelők. Amennyiben azonos gépen fut a Nagios és a szolgáltatás, akkor egy eseménykezelővel rengeteg dolgot el tudunk érni. Futtathatunk további ellenőrzéseket és a válaszok alapján dönthetünk a további teendőkről. Akár újra is indíthatjuk a szolgáltatást, hogy a szolgáltatás kiesésének idejét minél lejjebb szorítsuk. Ha egy szolgáltatáshoz eseménykezelő is hozzá van rendelve, akkor az mindig előbb hajtódik végre, mint a riasztás. Mindez egyrészt a Nagios beavatkozása miatt történik, másrészt ezzel a hibáról küldött üzenetben benne lehet, hogy már el is lett hárítva – amennyiben sikeres lett az esemény lekezelése.

A rendszer riasztási módja

A Nagios minden olyan esetben riasztást küld ki, amikor a hiba súlyos minősítést kap, vagy a súlyos hibaminősítést kapott szolgáltatás vagy kiszolgáló adott időn belül nem kerül"enyhe hiba" vagy "minden rendben" állapotba. Hogy kik kapjanak ilyenkor értesítést, azt előre meg kell állapítani. Mielőtt egy levél elküldésére sor kerülne, a rendszer a következő ellenőrzéseket hajtja végre:

  • Senki ne kapjon kétszer meg egy levelet
  • A riasztások küldése globálisan engedélyezve van-e
  • A szolgáltatás vagy kiszolgáló váltogatja-e az állapotát (ha igen, akkor a rendszer nem küld értesítőt)
  • Ellenőrzi az állapotokra vonatkozó beállításokat, hogy mikor kell üzenetet küldenie
  • Engedélyezett időpontban küldi-e a riasztást. Ha nem, akkor az első érvényes időpontra tolja azt.
  • A megadott intervallumon belül esik-e a riasztás, azaz nem túl gyakori-e

Azonban az, hogy ezeken a szűrőkön "átment" egy riasztás, nem azt jelenti, hogy minden, az értesítési láncban szereplő személy megkapja, mivel személyenként is beállíthatók a fenti szűrések. Azok a riasztások, melyek átjutnak az előbb felsorolt szűrőfeltételeken, a következőképpen juthatnak el a címzetthez:

  • SMS
  • Pager
  • ICQ, Yahoo, MSN azonnali üzenetküldés
  • Hang alapú riasztás

Időzített kimaradások

A Nagios képes kezelni az olyan eseteket, melyben mi magunk állítjuk le a szolgáltatásokat és a kiszolgálókat. Ha tudjuk előre, hogy valamely szolgáltatás le fog állni, akkor arról nekünk nem kell értesítést küldenie a rendszernek. Minden ilyen időzített leállítást előre be tudunk állítani. Ez a lehetőség pontosabb statisztikák elkészítését is lehetővé teszi, hiszen nem jelennek meg az akár több órás időzített kiesések hibaként.

A web-es felület

A felügyelő rendszer rendkívül jól felszerelt web-es felülettel rendelkezik, melynek segítségével egy böngészőn keresztül nyomon tudjuk követni a szolgáltatások és kiszolgálók állapotát, készíthetünk kimutatásokat rengeteg más lehetőség mellett. A rendszer látványos grafikonokat generál, három dimenzióban ábrázolja a kiszolgálókat (a rajtuk futó operációs rendszerekkel együtt). A web-es felület a http://localhost/nagios címen érhető el. Egy identifikációs eljárás után (ami felhasználónév és jelszó megadásából áll) elkezdhetjük a kimutatások, lekérdezések készítését.