Przejdź do treści
Nextriv

Monitoring temperatury w serwerowni — hot aisle, cold aisle w praktyce

Monitoring temperatury w serwerowni w praktyce: układ hot aisle / cold aisle, zalecenia ASHRAE 18–27 °C, czujnik na wlocie szafy i progi z eskalacją.

Zespół Nextriv4 min czytania

Okładka artykułu: Monitoring temperatury w serwerowni — hot aisle, cold aisle w praktyce

Monitoring temperatury w serwerowni wciąż bywa realizowany jednym czujnikiem przy klimatyzatorze i zieloną kontrolką w BMS. Problem w tym, że serwerownia nie ma jednej temperatury: między zimnym a gorącym korytarzem różnice sięgają kilkunastu stopni, a przegrzanie zaczyna się lokalnie — od pojedynczej szafy, której nikt nie mierzy. Poniżej pokazujemy, jak układ hot aisle / cold aisle przekłada się na rozmieszczenie czujników, jakie progi alarmowe wynikają z zaleceń ASHRAE i co zrobić, żeby alarm o przegrzaniu znalazł właściwą osobę również o trzeciej w nocy.

Hot aisle, cold aisle — dlaczego serwerownia ma wiele temperatur

Serwer zasysa chłodne powietrze od frontu i wyrzuca gorące z tyłu. Gdy szafy rack ustawi się frontami do siebie, powstają naprzemienne korytarze: zimne, do których trafia schłodzone powietrze z jednostek klimatyzacji (często przez perforowane płyty podłogi technicznej), i gorące, którymi ciepło wraca do chłodzenia. Ten układ porządkuje przepływ powietrza i ogranicza mieszanie strumieni — to fundament efektywnego chłodzenia każdej większej serwerowni.

Dla monitoringu wynikają z niego dwie zasady. Po pierwsze: temperaturą, która decyduje o życiu sprzętu, jest ta na wlocie serwera, czyli w zimnym korytarzu. Wytyczne ASHRAE TC 9.9 zalecają na wlocie sprzętu IT zakres 18–27 °C (zakresy dopuszczalne są szersze i zależą od klasy sprzętu). Pomiar w gorącym korytarzu też ma wartość — mówi o sprawności odbioru ciepła — ale nie zastąpi pomiaru tam, gdzie powietrze faktycznie wchodzi do serwerów.

Po drugie: średnia z sali kłamie. Czujnik pod sufitem pokaże spokojne 23 °C, podczas gdy szafa na końcu korytarza, z gorszym przepływem powietrza, pracuje już na granicy specyfikacji. Hot spot to zjawisko lokalne — i lokalnie trzeba go mierzyć. Jeden czujnik na salę nie spełnia tego warunku z definicji.

Monitoring temperatury w serwerowni: gdzie powiesić czujniki

Sprawdzony punkt startowy wygląda tak:

  • Zimny korytarz, wloty szaf — czujnik temperatury i wilgotności na froncie szafy, co 3–4 szafy. To pomiar wprost pod zalecenia ASHRAE i pod progi SLA.
  • Strefa gorąca — co najmniej jeden czujnik, by widzieć różnicę temperatur między korytarzami; jej zmiana w czasie zdradza problemy z przepływem powietrza.
  • Punkty newralgiczne instalacji — przemysłowe sondy temperatury w kanałach nawiewu, na wymiennikach i instalacji wody lodowej, gdzie liczy się dokładność i odporność na warunki.
Schemat rozmieszczenia czujników w układzie hot aisle / cold aisle
Schemat rozmieszczenia czujników w układzie hot aisle / cold aisle

Cała instalacja obywa się bez okablowania: czujniki komunikują się łącznością radiową dalekiego zasięgu, której sygnał przechodzi przez stropy i ściany, a wymienne baterie pracują latami. Bramkę podłącza się do zasilania i sieci, czujniki montuje na taśmę lub wkręty — automatyczne wykrywanie urządzeń zgłasza je w platformie w 30–180 sekund od włączenia.

Na wlotach szaf sprawdza się uniwersalny czujnik mierzący temperaturę z dokładnością ±0,3 °C, w szczelnej obudowie IP67. Ważny szczegół na wypadek przerwy w łączności: lokalny bufor około 2800 pomiarów z automatyczną retransmisją oznacza, że historia — a więc i dowód dotrzymania SLA — nie ma dziur.

Produkt NextrivNextriv Sense EssentialNX-SN-ESSUniwersalny czujnik temperatury i wilgotności w obudowie IP67 — do wnętrz i na zewnątrz. Certyfikat EN12830 dla łańcucha chłodniczego.Zobacz kartę produktu

Tam, gdzie pomiar dotyczy samej instalacji chłodzenia, lepszym narzędziem jest przemysłowa sonda platynowa: Nextriv Probe PT100 mierzy z dokładnością ±0,5 °C, a sonda na przewodzie pozwala trzymać nadajnik poza kanałem czy wymiennikiem. Bateria wystarcza nawet na 10 lat pracy.

Produkt NextrivNextriv Probe PT100NX-PR-PT100Przemysłowa sonda temperatury PT100 z transmisją radiową dalekiego zasięgu — warianty zakresów od −200 °C do +800 °C, dokładność ±0,5 °C, nadajnik IP67 z baterią na lata pracy.Zobacz kartę produktu

Progi alarmowe pod ASHRAE — cztery wartości zamiast jednej

Dobre progi to nie jedna liczba, lecz cztery: w Nextriv każda metryka ma osobny próg ostrzegawczy i krytyczny, dolny i górny. Dla temperatury na wlocie szafy naturalny układ wygląda tak:

PrógWartośćReakcja
ostrzegawczy dolny18 °Csprawdzić nastawy chłodzenia — przechłodzona sala to czysta strata energii
ostrzegawczy górny27 °Cweryfikacja chłodzenia i obciążenia, zanim zrobi się gorąco naprawdę
krytyczny górny32 °Cnatychmiastowa reakcja dyżurnego, ryzyko dla sprzętu

Każde przekroczenie otwiera zdarzenie z unikalnym kodem (np. ALM-4F2K81) i poziomem ważności, a deduplikacja pilnuje, by jeden problem był jednym zdarzeniem — nie lawiną identycznych powiadomień. Scenariusz nocnej awarii chłodzenia wygląda wtedy tak: czujnik na wlocie szafy raportuje 27,5 °C, platforma wysyła e-mail i powiadomienie Teams do dyżurnego, a na pulpicie odzywa się alarm dźwiękowy. Brak potwierdzenia przez 10 minut uruchamia eskalację — SMS do inżyniera dyżurnego. Gdy temperatura osiąga próg krytyczny, powiadomienia idą poziom wyżej, a webhook może otworzyć zgłoszenie w systemie ticketowym.

Jest jeszcze jeden próg, o którym łatwo zapomnieć: cisza. Najgroźniejszy alarm to ten, który nigdy nie przyszedł, bo czujnik przestał nadawać. Nextriv oznacza czujnik jako offline po dwukrotności jego interwału raportowania, a bramkę po 15 minutach bez kontaktu — i również o tym powiadamia.

Od wykresu do dowodu: historia, raporty, SLA

Pomiar per szafa generuje dziesiątki wykresów — a umowa z klientem kolokacji operuje zwykle jedną liczbą. Czujniki wirtualne liczą np. średnią temperaturę zimnego korytarza jako osobną metrykę: to na nią patrzy NOC i to ją raportuje się klientowi. Harmonogram raportów generuje PDF-y z podpisem SHA-256, kodem QR i adresem weryfikacji — dokument, który można przekazać klientowi lub audytorowi bez dyskusji o jego wiarygodności. Surowe pomiary przechowywane są nawet 1825 dni (5 lat), więc pytanie o warunki sprzed trzech kwartałów przestaje być problemem.

Pełny scenariusz wdrożenia — od hot spotów, przez wycieki pod podłogą techniczną, po zgodność z EN 50600 i ISO/IEC 27001 — opisujemy na stronie rozwiązania dla serwerowni i data center.

Zacznij od jednego korytarza

Nie trzeba od razu instrumentować całej sali. Pilotaż to jedna bramka i kilka czujników w najbardziej obciążonym korytarzu: montaż na taśmę, automatyczne wykrycie urządzeń i progi 18/27/32 °C ustawione w kilka minut. Plan FREE obejmuje 10 czujników, jedną bramkę i rok historii pomiarów — na małą serwerownię wystarcza bez żadnej subskrypcji.

Porównaj plany w cenniku albo umów prezentację — pokażemy na żywych danych, jak wygląda alarm o przegrzaniu szafy razem z eskalacją i raportem dla klienta.

Zobacz te dane na własnych czujnikach

Plan FREE: 10 czujników, bramka i pełny rok historii pomiarów — bez karty płatniczej.