Strona Główna
Programy
Tuning
Zabezpieczenia
Konserwacja
Tajemnice Windows
 Aktualizacja bazy danych z dnia 17 Luty 2007

Inne: SMART

Poświęćmy chwilę uwagi niedocenianemu przez wielu użytkowników systemowi monitorowania, analizowania i raportowania o błędach wykorzystywany w dyskach twardych. Technologia S.M.A.R.T (Self-Monitoring, Analysis, and Reporting Technology) po raz pierwszy pojawiła się w dyskach twardych zgodnych ze standardem ATA-3. System ten sam potrafi monitorować, na bieżąco oceniać stan techniczny dysku twardego i w razie jakiś problemów poinformować użytkownika o zbliżającej się awarii. Większość awarii dysków nie dzieje się nagle, lecz wszystko zaczyna się powoli, a koniec może w wielu wypadkach być przewidziany właśnie przez ten system. S.M.A.R.T rozwinął się z technologii firmy IBM zwanej PFA (Predictive Failure Analysis) oraz IntelliSafeTM pomysłu firmy Compaq.
Awarie dysków można podzielić na dwa rodzaje: te które można przewidzieć i te których przewidzieć nie można. Awarie przewidywalne zazwyczaj rozwijają się powoli i można "zobaczyć" pewne ich symptomy, do takich awarii należą głównie awarie mechaniczne. Na przykład można przewidzieć awarię łożysk dysku, gdyż z biegiem czasu, będzie wzrastał pobór prądu, będzie wydłużał się czas dostępu itd. Najtrudniej przewidzieć jest awarie elektroniki dysku, uszkodzenia takie jak spalenie się układów scalonych następują nagle, w większości przypadków nie da się tego przewidzieć.
S.M.A.R.T podczas monitoringu uzyskuje wiele danych które następnie porównuje z określonymi wartościami normy producenta, jeśli uzyskane przez system dane mieszczą się w określonym przedziale to nic nie wskazuje na zbliżającą się awarie. Jeśli natomiast któryś z badanych parametrów odbiega od normy odpowiedni "alarm" zapisywany jest w tak zwanym S.M.A.R.T status register skąd następnie może być odczytany przez odpowiedni software monitorujący.


Self-Monitoring
Podczas pracy dysku system S.M.A.R.T na bieżąco monitoruje istotne parametry, każdy z nich może przyjąć następujące stany:
-Pre-failure warranty attribute (PW) - wskazuje warunek przed awaryjny, może uchronić od straty wielu danych
-Online collection attribute (OC) - oznacza, że wartości są obliczane podczas pracy dysku
-Performance attribute (PE) - oznacza pogorszenie spowodowane zużyciem lub wiekiem dysku
-Error rate attribute (ER) - oznacza parametr czestości pomiaru błędów
-Error count attribute (EC) - oznacza parametr ilości zmierzonych błędów
-Self-preserving attribute (SP) - oznacza parametr który jest automatycznie ustawiany podczas testu S.M.A.R.T

Monitorowane parametry:
-Raw Read Error Rate - częstotliwość pojawiania się błędów podczas odczytu RAW
-Throughput Performance - średnia wydajność dysku
-Spin Up Time - czas potrzebny do "rozkręcenia" talerzy dysku
-Start/Stop Count - ilość cykli start/stop
-Reallocated Sector Count - ilość realokowanych sektorów
-Read Channel Margin - rezerwa kanału podczas odczytu
-Seek Error Rate - częstotliwość błędów podczas pozycjonowania
-Seek Time Performance - średnia wydajność podczas pozycjonowania
-Power-On Hours Count - liczba godzin pracy dysku
-Spin-up Retry Count - liczba prób uruchomienia osi napędowej dysku
-Calibration Retry Count - liczba prób kalibracji
-Power Cycle Count - ilość skończonych operacji start/stop
-Soft Read Error Rate - częstotliwość występowania błędów programowych podczas operacji odczytu
-G-Sense Error Rate - częstotliwość występowania błędów spowodowanych wstrząsem
-Power-Off Retract Cycle - ilość naprawionych cykli wyłączenia
-Load/Unload Cycle Count - ilość cykli do tak zwanej "Landing Zone"
-HDA Temperature - temperatury dysku (ogólna)
-Hardware ECC Recovered - częstotliwość występowania "błędów w locie"
-Reallocated Event Count - liczba remapowanych operacji
-Current Pending Sector Count - liczba sektorów niestabilnych (oczekujących na remapowanie)
-Off-line Scan Uncorrectable Count - ilość nie naprawionych błędów
-UltraDMA CRC Error Rate - liczba błędów CRC podczas pracy w trybie Ultra DMA
-Write Error Rate - liczba błędów zapisu
-Soft Read Error Rate - liczba "off track errors"
-Data Address Mark Errors - częstotliwość występowania błędów "Data Address Mark"
-Run Out Cancel - częstotliwość występowania błędów ECC
-Soft ECC Correction - ilość błędów ECC skorygowanych przez software
-Thermal Asperity Rate - częstotliwość występowania "błędów termicznych"
-Flying Height - wysokość głowicy ponad powierzchnie zapisu
-Spin High Current - najwyższa wartość prądu potrzebna do "rozkręcenia" talerzy dysku
-Spin Buzz - ilość "buzz routines" potrzebna do "rozkręcenia" talerzy dysku
-Offline Seek Performance - wydajność wyszukiwania podczas operacji offline
-Disk Shift - przesunięcie dysku, jest możliwe podczas nagłego wstrząsu lub może być spowodowane nadmierną temperaturą
-G-Sense Error Rate - błędy spowodowane na przykład upuszczeniem dysku
-Loaded Hours - czas operacji dysku
-Load/Unload Retry Count - ilość obciążeń spowodowanych operacjami odczytu, zapisu, pozycjonowania
-Load Friction - obciążenie spowodowane tarciem mechanicznych części
-Load/Unload Cycle Count - ilość cykli obciążenia
-Load-in Time - całkowity czas obciążenia dla dysku
-Torque Amplification Count - liczba prób rotacji dysku
-Power-Off Retract Count - liczba naprawionych wyłączeń dysku
-GMR Head Amplitude - amplituda drgań podczas pracy
-Temperature - temperatura napędu
-Head Flying Hours - czas w którym głowica jest pozycjonowana
-Read Error Retry Rate - częstotliwość występowania błędów podczas odczytu


Analysing
Pracując, system S.M.A.R.T może wykonywać różnego rodzaju testy pomagające określić stan dysku twardego. Testy te możemy podzielić na dwie podstawowe grupy:
-Testy przeprowadzane w trybie CAPTIVE (na czas trwania testu dysk zostaje wyłączony z użycia kontrolera)
-Testy przeprowadzane w trybie IDLE (testy przeprowadzane są w czasie, gdy dysk nie jest zajęty innymi operacjami "zleconymi" przez kontroler)

Rodzaje testów:
-Immediate Offline Test (czas trwania poniżej pięciu minut), podstawowy test dysku, jest szybki i wykrywa najpoważniejsze problemy
-Short Self Test (zwykle trwa poniżej dziesięciu minut), krótki test wykrywający większość problemów
-Extended Self Test (trwa kilkadziesiąt minut) długi test wykrywa wszystkie problemy jakie podsystem S.M.A.R.T. danego dysku jest w stanie rozpoznać
-Conveyance Self Test (od kilku do kilkunastu minut), ten test ma za zadanie wykryć uszkodzenia powstałe podczas transportu urządzenia (test nośnika magnetycznego)
-Select - przeznaczony do testowania części dysku, dzięki niemu można wykonać test jednej partycji

Dyski ATA/IDE
W tym środowisku software interpretuje sygnały S.M.A.R.T i jeśli są one rozbieżne z wcześniej ustaloną normą informuje o tym użytkownika/system.

Dyski SCSI
W tym przypadku sygnały o błędach interpretowane są już na poziomie samego dysku, a użytkownik jedynie podejmuje decyzję co z danym "fantem" zrobić.

Linki
-HDD Health http://www.panterasoft.com/
-Smartmontools http://smartmontools.sourceforge.net/
           


© Mariusz Kidacki ,,Tajemnice Windows"