Newcomposers.ru

IT Мир
0 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Smart таблица жесткого диска

Системное администрирование и мониторинг Linux/Windows серверов и видео CDN

Статьи по настройке и администрированию Windows/Linux систем

  • Полезное
    • Карта сайта
    • Мой сайт-визитка
  • Рубрики
    • Linux
      • VoIP
      • Безопасность
      • Видеопотоки
      • Системы виртуализации
      • Системы мониторинга
    • Windows
    • Интересное
    • Сеть и Интернет
  • Мета
    • Войти
    • RSS Feed

S.M.A.R.T. (часть 3). Расшифровка и понимание SMART атрибутов

Маленький рассказ об S.M.A.R.T. атрибутах, их важности и понимании. В статье пойдет речь об расшифровке всех smart атрибутов ATA дисков. В предыдущих статьях речь шла об мониторинге BBU и жестких SCSI дисков и их атрибутов под Megaraid контроллером. Теперь хочу немного описать атрибуты обычных АТА дисков на примере Seagate Barracuda ES.2 (ST31000340NS). Так же определим самые важные атрибуты, на которые нужно обращать внимание при мониторинге дисков используя smartctl. Для начала, можно убедиться, что наш диск поддерживает смарт

Две последние строки свидетельствуют о том, что диск поддерживает smart и можно посмотреть значение всех его атрибутов и их интерпретация будет корректной(интерпретация RAW_VALUE) . В данном случаи тип интерфейса (устройства) не указывался явно (не было указанно атрибут «-d»), по этому smartctl автоматически определил тип устройства и сказал, что «SMART support is: Enabled». Но если используются, к примеру массивы дисков (RAID контроллер), то smartctl может сказать, что смарт не поддерживается:

Но на самом деле, нужно просто знать (или подбирать) какие дисковые массивы используются, и тогда можно получить желаемый результат явно указав тип устройства:

Также может быть проблема в версии smartctl ибо не все жесткие диски добавляются в базу SMART сразу после выхода в мир нового HDD или RAID контроллера. Или же в BIOS отключено поддержку (нужно включить). Так же может быть проблема в прошивке (firmware) самого жесткого диска. Можете также стоит для начала попытаться включить SMART командой:

Следующая, интересующая нас часть вывода покажет суммарный результат проверки статуса здоровья диска (Если не Passed – нужно проводить замену диска). Так же выводится дополнительные характеристики диска и предполагаемое время выполнения коротких и длинных тестов.

В нашем случаи тип устройства определился автоматически и теперь можно вывести самое интересное — список атрибутов.

Используя SMART можно предугадать с довольно большой вероятностью проблемы связанные с:

  • Магнитными головками диска
  • Физическими повреждениями диска
  • Логическими ошибками
  • Механическими проблемами (проблемы привода, системы позиционирования)
  • Подачей питания (платы)
  • Температурой

Расшифруем полученный вывод.


Каждый атрибут имеет группу значений:

  • ID# — идентификационный номер атрибуты (детали здесь). Каждый атрибуты имеет свой уникальный ID, который должен быть одинаковым для всех фирм производителей дисков.
  • ATTRIBUTE_NAME – название атрибута. Так как разные фирмы производители дисков могут называть атрибуты по своему (сокращать, синонимы), лучше всего ориентироваться по ID атрибута.
  • FLAG (Status flag) – каждый атрибут имеет определенный флаг, назначенный фирмой разработчиком диска. В ОС с графическим интерфейсом значения этого флага предоставляется в виде набора буквенных обозначений – w,p,r,c,o,s (расшифровка ниже). И эти наборы предоставляются в виде шестнадцатеричного числа которые вы видели выше.
  1. Warranty: Указывает на жизненно важный атрибут диска и покрывается гарантией. Если этот флаг установлен и значение атрибута с этим флагом достигнет порогового (threshold) значения, в то время, когда диск еще на гарантии, то фирма должна будет заменить диск бесплатно.
  2. Performance: Указывает на атрибут, который представляет показатель производительности диска – не критический.
  3. Error Rate: Атрибут с частотой ошибок.
  4. Count of occurrences: Атрибут-счетчик происшествий.
  5. Online test: Атрибут, который обновляет значения только через on-line тесты. Если не указан, то обновляется через off-line тесты.
  6. Self preserving: Указывает на атрибут который может собирать и сохранять данные о диска, даже если S.M.A.R.T. отключен.
  • Value – Текущее значение атрибута(оценка атрибута диска на основе Raw_value). Низкое значение говорит о быстрой деградации диска или о возможном скором сбое. т.е. чем выше значение Value атрибута, тем лучше. Это значение атрибута нужно сравнивать с пороговым (threshold) значением. Если это критический атрибут и значение ниже порогового — нужно проводить замену диска.
  • Worst – Самое низкое значение атрибута за жизненный цикл диска. Значение может изменяться на протяжении жизни диска, и не должно быть ниже или равным пороговому значению (threshold).
  • Thresh (Threshold) – Пороговое значения атрибута назначенное создателем диска. Значение не меняется за жизненный цикл диска. Если значение Value атрибута станет равным или меньше порогового – появиться уведомление в колонке WHEN_FAILED. И диск нужно заменить.
  • Type – тип атрибута. Может быть критическим (pre-fail), который указывает на предстоящий отказ диска из-за ошибок или не критический, указывающий на достижение конца жизненного цикла диска.
  • Raw_value – Объективное значения атрибута, которое показывается в десятичном формате (вычисляется firmware диска) и известных только производителю единицах (имеет связь с Value, Threshold и Worst значениями).
  • WHEN_FAILED – Указывает на проблемы с атрибутом.

Атрибут диска примет значение failed, в случаи:

Value = f(Raw_value) ArmorDulo :

254(FE) Free Fall Event Count — содержит зафиксированное электроникой количество ускорений свободного падения диска, которым он подвергался, т.е. проще говоря, показывает, сколько раз диск падал.

Здравствуйте!
И все таки не ясно, как понимать «Value – …Низкое значение говорит о быстрой деградации диска или о возможном скором сбое. т.е. чем выше значение Value атрибута, тем лучше.» и тут же (по табличке) «↓ Чем ниже значение Value, тем лучше состояние диска». Противоречие.
Например имеем Reallocated Sectors Count. Value 168, Wors 168, Thresh 140, Raw 250.
Victoria говорит GOOD, а CrystalDiskInfo кричит Тревога! по секторам 200ms=274, 600ms-14, >-0, Err-0.
Поди пойми…Менять?

Понял вопрос. В статье есть 2 таблички, в одной нарисована стрелочка вниз, вверх и описание. Во второй табличке, описаны сами атрибуты и в колонке «Лучше если …» есть стрелочка вниз или вверх. Например, в атрибута Reallocated Sectors Count стрелочка вниз, что значит, чем ниже значение, тем лучше

Возможно путаница из-за того, что во второй таблице речь идет все же о RAW значении атрибутов. Тогда совпадает: чем выше Value и ниже Raw, тем лучше.

Что такое SMART HDD (жёсткого диска)

Что такое SMART HDD (жёсткого диска) и что нужно делать, если компьютер выдаёт надпись «smart status bad backup and replace».

Во всех современных накопителях последних лет абсолютно любого производителя присутствует система SMART (self-monitoring, analysis and reporting technology — технология предупреждения, анализа и самопроверки) жесткого диска, очень тесно связанная с функционированием накопителя.

Современные технологии SMART осуществляют: мониторинг различных параметров состояния диска, сканирование поверхности жесткого диска с дальнейшей автоматической заменой нечитаемых секторов и занесение их в error-log, т.н. список, где номера этих секторов хранятся в виде таблицы, периодическое повторное сканирование «ненадежных» секторов из error-log и, если система определяет, что данный сектор исправен — то исключает его из данного списка и он становится доступен на поверхности для пользовательской информации (но также помечается для дальнейшей перепроверки при следующем сканировании поверхности), либо, если сектор не прочитывается несколько раз подряд, не переписывается, то он отправляется в следующий дефект-лист,именуемый у разных производителей по-разному, но имеющий одинаковое предназначение — этот лист является как бы посредником между error-log таблицей и финальным G-листом, где дефект уже будет занесен в G-лист навсегда, станет отображаться в SMART, в строке current pending sectors/offline UNC sectors.

Из статуса current pending поврежденный сектор после очередной перепроверки на «живучесть», если не прошел чтение/запись, то окончательно отправляется в статус переназначенных и там уже остается. Диск в дальнейшей работе его уже не использует, не тестирует повторно на чтение/запись.

В строке reallocated sector count изменяется значение с N на N+1.

Если накопитель имеет уже серьёзные повреждения, то при загрузке компьютера может выводиться надпись: «smart status bad backup and replace». Это значит, что статус SMART жёсткого диска изменился из состояния GOOD в состояние BAD, на диске как минимум имеются BAD-блоки и состояние диска продолжает ухудшаться. Пользователю рекомендуется сохранить свои данные, если они ещё доступны для чтения и заменить жёсткий диск на новый.

SMART ВЫГЛЯДИТ ТАК:

Выводится в виде таблицы со следующими столбцами:

ID – ИДЕНТИФИКАЦИОННЫЙ НОМЕР ПАРАМЕТРА

Name – выводимое программой имя параметра

VAL – НОРМАЛИЗОВАННОЕ ЗНАЧЕНИЕ ПАРАМЕТРА (НОРМАЛИЗОВАННОЕ ЗНАЧИТ, В ДАННОМ СЛУЧАЕ, ЧТО ВНУТРЕННЕЕ (RAW) ЗНАЧЕНИЕ ПАРАМЕТРА ПРЕОБРАЗОВАНО ПО ОПРЕДЕЛЁННОМУ АЛГОРИТМУ ДЛЯ БОЛЕЕ УДОБНОГО И ПОНЯТНОГО ПРОСМОТРА ЗНАЧЕНИЯ. НАПРИМЕР, ВНУТРЕННИЙ ПАРАМЕТР ВСЕГДА УВЕЛИЧИВАЕТСЯ И МОЖЕТ ПРИНИМАТЬ ЗНАЧЕНИЕ В НЕСКОЛЬКО ТЫСЯЧ ЕДИНИЦ, А ВЫВОДИМОЕ ЗНАЧЕНИЕ ИЗМЕНЯЕТСЯ ОТ 100 ДО 0 И ОТОБРАЖЕНИЕ ВНУТРЕННЕГО ДИАПАЗОНА ИЗМЕНЕНИЯ ПАРАМЕТРА НА ВЫВОДИМЫЙ И ЕСТЬ, В ДАННОМ СЛУЧАЕ, НОРМАЛИЗАЦИЯ)

Wrst – худшее значение параметра за отрезок времени время

Thresh – пороговое значение, при достижении которого диск рекомендуется заменить

РАССМОТРИМ, КАКИЕ СУЩЕСТВУЮТ ПАРАМЕТРЫ В СИСТЕМЕ SMART. НАБОР ОТСЛЕЖИВАЕМЫХ ПАРАМЕТРОВ ЗАВИСИТ ОТ ПРОИЗВОДИТЕЛЯ ДИСКА И НЕ ВСЕ ИЗ ПЕРЕЧИСЛЕННЫХ БУДУТ ПРИСУТСТВОВАТЬ В ВАШЕМ СЛУЧАЕ.

Атрибуты SMART:

1 Raw read error rate — количество ошибок при считывании секторов с пластин.

2 Throughput Performance — общая производительность диска в относительных единицах.

3 Spin-up time — время раскрутки пластин от нуля до номинальной скорости вращения в миллисекундах

4 Number of spin-up times — количество циклов раскрутки/остановки пластин; отражает механический ресурс диска из-за ограниченного количества циклов запуска/останова.

5 Reallocated sector count — параметр отражает количество запасных секторов; когда диск находит ошибку чтения/записи/проверки, он переназначает плохой сектор на хороший из запасной зоны; нормализованное значение атрибута уменьшается по мере убывания запасных секторов; RAW-значение показывает количество преназначенных секторов, которое в норме должно быть ноль; на SSDRAW значение показывает количество неисправных блоков флеш-памяти.

6 Read Channel Margin — данный атрибут не используется в современных накопителях.

7 Seek error rate — количество ошибок позиционирования магнитных головок.

8 Seek Time Performance — средняя скорость позиционирования привода магнитных головок на указанный сектор; в SSDпараметр не используется

9 Power-on time — ожидаемое время жизни диска, основанное на времени, проведённом во включённом состоянии; нормализованное значение уменьшается со 100 до 0, связано с ресурсом диска; уменьшение этого параметра косвенно говорит о состоянии механики диска

10 Spin-up retries — количество попыток раскруток пластин при условии, что первая попытка была неудачная; считается с момента начала использования; на SSD не используется

12 Start/stop count — ожидаемое время жизни, основанное на количестве пусков/остановов пластин; каждый диск имеет ограниченное количество пусков/остановов, параметр уменьшается со 100 до 0; RAW значение показывает число включений/выключений

13 Soft Read Error Rate — у одних производителей этот параметр описывается, как указывающий на количество ошибок, не восстановленных ECC, а у других наоборот — восстановленных

100 Erase/Program Cycles — общее количество циклов чтения/записи для всей флеш-памяти за весь срок службы; SSD имеет ограничение на количество циклов чтения/записи, конкретное значение зависит от типа и производителя микросхем флеш-памяти

103 Translation Table Rebuild — количество событий перестроения внутренней таблицы адресов блоков при её повреждении и восстановлении; RAW значение показывает актуальное количество данных событий

170 Reserved Block Count — описывает состояние пула резервных блоков в SSD, показывает процент оставшихся блоков; RAW значение иногда показывает количество использованных резервных блоков

171 Program Fail Count — количество случаев неудавшейся записи блока флеш-памяти

172 Erase Fail Count — количество случаев неудавшейся операции стирания блока флеш-памяти

173 Wear Leveller Worst Case Erase Count — максимальное количество операций стирания, произведённых над блоком флеш-памяти

178 Used Reserved Block Count — описывает состояние пула резервных блоков в SSD, показывает процент оставшихся блоков; RAW значение иногда показывает количество использованных резервных блоков

180 Unused Reserved Block Count — описывает состояние пула резервных блоков в SSD, показывает процент оставшихся блоков; RAW значение иногда показывает количество неиспользованных резервных блоков

183 SATA Downshifts — показывает, как часто требовалось понизить скорость передачи по SATA (с 6Гб/c до 3Гб/с или 1.5Гб/с) для успешной передачи данных, при уменьшении значения атрибута следует заменить кабель

184 End-to-End error — количество ошибок, возникших в буфере диска; часть технологии HP SMART IV; может свидетельствовать о неисправности RAM-буффера диска

185 Head Stability — по атрибуту нет достоверной информации

186 Induced Op-Vibration Detection — по атрибуту нет достоверной информации

187 Reported UNC error — количество нескорректированных ошибок чтения

188 Command timeout — количество невыполненных диском команд из-за истечения времени ожидания

189 High Fly writes — количество ошибок записи, вызванных неправильной высотой полёта магнитной головки над поверхностью

190 Airflow temperature — температура воздуха внутри гермоблока HDD

191 G-Sense Errors — указывает сколько раз диск прерывал работу из-за ударов или вибрации

192 power-off retract cycles — количество неожиданных пропаданий питания, когда оно пропадало прежде, чем была получена команда на отключение диска; у hdd срок службы при неожиданном отключении значительно меньше, чем при нормальном; у ssd есть риск потери таблицы внутреннего состояния при неожиданном пропадании питания

193 load/unload cycles — количество перемещений бмг между зоной парковки и зоной данных; значение уменьшается от 100 до 0, raw содержит актуальное количество перемещений

194 hda temperature- температура блока магнитных головок

195 hardware ecc recovered- количество ошибок чтения, скорректированных кодом коррекции ошибок

196 reallocation events — общее количество переназначений секторов, включает и off-line сканирование и обычную работу

197 current pending sectors- количество нестабильных секторов, ожидающих перепроверки и, возможно, переназначения

198 offline scan unc sectors- количество плохих секторов, найденных диском при фоновом самосканировании; ухудшение этого параметра говорит о быстрой деградации поверхности

199 ultra dma crc errors- количество ошибок при передаче данных между диском и материнской платой; при ухудшении этого параметра стоит заменить кабель

200 write error rate — частота возникновения ошибок при записи

202 data address mark errors — количество ошибок при поиске запрошенного сектора

203 run out cancel — количество ошибок, вызванных неверной контрольной суммой при попытке коррекции ошибки

204 soft ecc corrections — количество ошибок, скорректированных кодом коррекции

206 flying height — девиация высоты полёта головки над поверхностью относительно оптимального значения; если головка слишком низко, она может повредить поверхность, если слишком высоко — увеличивается количество ошибок чтения

207 spin high current — величина тока, требуемая для раскрутки пластин

209 offline seek performance — производительность подсистемы поиска при выполнении off-line сканирования

220 disk shift — расстояние, на которое сместился пакет пластин относительно теоретического положения в результате механического повреждения или перегрева

227 torque amplification count — показывает сколько раз требовалось подавать увеличенный ток для раскрутки пластин

230 gmr head amplitude — амплитуда колебаний головок бмг

233 media wearout indicator — остаток ресурса памяти в ssd

240 head flying hours- время, проведённое головками в зоне пользовательских данных; значение уменьшается, обычно от 100 до 0

241 total lbas written — количество 512-и байтных блоков, записанных за всю жизнь устройства

242 total lbas read — количество 512-и байтных блоков, считанных за всю жизнь устройства

250 read error retry rate

Сложность интерпретации значений smart состоит в том, что ни на количество, ни на тип, ни на значения, ни на единицы измерения отслеживаемых параметров нет единого стандарта. поэтому реализация smart всегда зависит от конкретного производителя. нормализацию raw-значений в показатели атрибутов все делают по-своему, а результатом является статус проверки smart good или bad. поэтому достоверный вывод о состоянии диска можно сделать только проверив его поверхность какой-либо диагностической программой. но если нужно быстро оценить состояние диска и возможные проблемы, нужно обратить внимание на несколько основных, самых информативных атрибутов.

Наиболее важные аттрибуты smart:

5 reallocated sectors count — количество переназначенных секторов; рост значения этого атрибута свидетельствует об ухудшении состояния поверхности диска

7 seek error rate — частота ошибок позиционирования бмг (блока магнитных головок); чем больше, тем хуже состояние механики и поверхности жёсткого диска

11 recalibration retries — количество неудачных попыток калибровки бмг;

184 end-to-end error — количество ошибок возникших в буфере диска

187 reported unc errors — количество нескорректированных ошибок чтения

191 g-sense error rate — количество ударов диска во время работы

196 reallocation event count — общее количество переназначенных секторов

197 current pending sector count — количество нестабильных секторов, кандидаты в бэды, чем больше, тем хуже диск

198 uncorrectable sector count — количество плохих секторов, найденных при off-line сканировании, чем их больше, тем хуже поверхность

199 ultradma crc error count — количество ошибок передачи между диском и компьютером, при увеличении или отличном от нуля параметре стоит заменить кабель

HDD – атрибуты S.M.A.R.T. (расшифровка параметров S.M.A.R.T. жёсткого диска)

S.M.A.R.T. (self-monitoring, analysis and reporting technology) — технология оценки состояния жёсткого диска встроенной аппаратной части самодиагностики, а также механизм предсказания времени выхода его из строя.

Информация S.M.A.R.T. содержит историю изменения большого количества параметров, отслеживаемых винчестером в процессе своего функционирования. Каждый атрибут имеет свой идентификатор (номер атрибута от 0 до 255 в десятичном значении), название (условное имя атрибута), тип (критический, показатель производительности, счетчик ошибок, счетчик событий), текущее значение, пороговое значение (наибольшее или наименьшее критическое значение), максимальное или минимальное зафиксированное значение в процессе работы. Ниже приведены описание атрибутов, параметров и значения S.M.A.R.T.

01 (01) Raw Read Error Rate — Частота ошибок при чтении данных с диска, происхождение которых обусловлено аппаратной частью диска.

02 (02) Throughput Performance — Общая производительность диска.

03 (03) Spin-Up Time — Время раскрутки пакета дисков из состояния покоя до рабочей скорости.

04 (04) Start/Stop Count — Полное число циклов запуск-остановка шпинделя.

05 (05) Reallocated Sectors Count — Число операций переназначения секторов.

06 (06) Read Channel Margin — Запас канала чтения.

07 (07) Seek Error Rate — Частота ошибок при позиционировании блока магнитных головок.

08 (08) Seek Time Performance — Средняя производительность операции позиционирования магнитными головками.

09 (09) Power-On Hours (POH) – Время, проведённое во включенном состоянии.

10 (0А) Spin-Up Retry Count — Число повторных попыток раскрутки дисков до рабочей скорости в случае, если первая попытка была неудачной.

11 (0В) Recalibration Retries — Количество повторов запросов рекалибровки в случае, если первая попытка была неудачной.

12 (0С) Device Power Cycle Count — Количество полных циклов включения-выключения диска.

13 (0D) Soft Read Error Rate — Число ошибок при чтении, по вине программного обеспечения, которые не поддались исправлению.

180 (B4) Unused Reserved Block Count Total — кол-во резервных секторов, доступных для ремапа.

183 (B7) SATA Downshift Error Count — содержит количество неудачных попыток понижения режима SATA.

184 (B8) End-to-End error — после передачи через кэш памяти буфера данных паритет данных между хостом и жестким диском не совпадают.

185 (B9) Head Stability — Стабильность головок (Western Digital).

187 (BB) Reported UNC Errors — Ошибки, которые не могли быть восстановлены, используя методы устранения ошибки аппаратными средствами.

188 (BC) Command Timeout — содержит количество операций, выполнение которых было отменено из–за превышения максимально допустимого времени ожидания отклика.

189 (BD) High Fly Writes — содержит количество зафиксированных случаев записи при высоте головки выше расчётной.

190 (BE) Airflow Temperature (WDC) — Температура воздуха внутри корпуса жёсткого диска.

191 (BF) G-sense error rate — Количество ошибок, возникающих в результате ударных нагрузок.

192 (C0) Power-off retract count (Emergency Retry Count) — суммарное количество парковок БМГ диска в аварийных ситуациях или суммарное количество циклов включения/выключения питания диска.

193 (C1) Load/Unload Cycle — Количество циклов перемещения блока магнитных головок в парковочную зону / в рабочее положение.

194 (C2) HDA temperature — Здесь хранятся показания встроенного температурного датчика для механической части диска.

195 (C3) Hardware ECC Recovered — Число коррекции ошибок аппаратной частью диска.

196 (C4) Reallocation Event Count — содержит количество операций переназначения секторов.

197 (C5) Current Pending Sector Count — содержит количество секторов-кандидатов на переназначение в резервную область.

198 (C6) Uncorrectable Sector Count — Число неисправимых ошибок при обращении к сектору.

199 (C7) UltraDMA CRC Error Count — содержит количество ошибок, возникших по передаче по интерфейсному кабелю в режиме UltraDMA.

200 (C8) Write Error Rate / Multi-Zone Error Rate — Показывает общее количество ошибок, происходящих при записи сектора, а так же общее число ошибок записи на диск.

201 (C9) Soft read error rate — Частота появления «программных» ошибок при чтении данных с диска.

202 (CA) Data Address Mark errors — Number of Data Address Mark (DAM) errors (or) vendor-specific.

203 (CB) Run out cancel — Количество ошибок Error Correcting (ECC).

204 (CC) Soft ECC correction — Количество ошибок ECC, скорректированных программным способом.

205 (CD) Thermal asperity rate (TAR) — Количество ошибок из-за повышенной температуры.

206 (CE) Flying height — Высота между головкой и поверхностью диска.

207 (CF) Spin high current — Величина силы тока при раскрутке диска.

208 (D0) Spin buzz — Кол-во попыток раскрутки шпинделя из-из недостаточной мощности питателя.

209 (D1) Offline seek performance — Производительность поиска во время офлайновых операций (Drive’s seek performance during offline operations).

210 (D2) Vibration During Write — вибрация во время записи.

211 (D3) Vibration During Write — вибрация во время записи.

212 (D4) Shock During Write — удары во время записи.

220 (DC) Disk Shift — Дистанция смещения блока дисков относительно шпинделя.

221 (DD) G-Sense Error Rate — Число ошибок, возникших из-за внешних нагрузок и ударов. Атрибут хранит показания встроенного датчика удара.

222 (DE) Loaded Hours — Время, проведённое блоком магнитных головок между выгрузкой из парковочной области в рабочую область диска и загрузкой блока обратно в парковочную область.

223 (DF) Load/Unload Retry Count — Количество новых попыток выгрузок/загрузок блока магнитных головок в/из парковочной области после неудачной попытки.

224 (E0) Load Friction — Величина силы трения блока магнитных головок при его выгрузке из парковочной области.

225 (E1) Load Cycle Count — Количество циклов перемещения блока магнитных головок в парковочную область.

226 (E2) Load ‘In’-time — Время, за которое привод выгружает магнитные головки из парковочной области на рабочую поверхность диска.

227 (E3) Torque Amplification Count — Количество попыток скомпенсировать вращающий момент.

228 (E4) Power-Off Retract Cycle — Количество повторов автоматической парковки блока магнитных головок в результате выключения питания.

230 (E6) GMR Head Amplitude — Амплитуда «дрожания» (расстояние повторяющегося перемещения блока магнитных головок).

231 (E7) Temperature — Температура жёсткого диска.

232 (E8) SSD Endurance Remaining — Количество завершенных физических циклов стирания на диске в процентах от максимально возможного.

232 (E8) Intel SSD Available Reserved Space — доступное резервное пространство в процентах от общего резервного пространства.

233 (E9) Power-On Hours — количество часов во включённом состоянии.

233 (E9) Intel SSD Media Wearout Indicator — индикатор износа носителя (100% для нового).

240 (F0) Head flying hours — Время позиционирования головки (для Fujitsu — Transfer Error Rate — частота ошибок передачи).

241 (F1) Total LBAs Written — количество записанных LBA.

242 (F2) Total LBAs Read — колисество считанных LBA.

250 (FA) Read error retry rate — Число ошибок во время чтения жёсткого диска.

254 (FE) Free Fall Event Count — содержит зафиксированное электроникой количество ускорений свободного падения диска, которым он подвергался, т.е. проще говоря, показывает, сколько раз диск падал.

Параметры SMART и признаки сбоя жёсткого диска

Читайте о S.M.A.R.T. параметрах жесткого диска, которые предупреждают об износе или сбоях в работе устройства. Система S.M.A.R.T. (или SMART) была разработана производителями жёстких дисков с целью унифицировать доступ к системной информации диска, касающейся его надёжности и производительности. Многочисленные параметры, доступные через систему S.M.A.R.T., позволяют определить признаки скорой поломки диска на ранней стадии. В то же время число доступных параметров настолько велико, что получить из них какую-либо полезную информацию нелегко.

В данной статье рассматриваются наиболее важные параметры S.M.A.R.T., правильное понимание которых позволит узнать о скором выходе жесткого диска из строя, вовремя заменить изношенное устройство и избежать необходимости восстановления удаленной информации.

Инструментарий

Многие производители жёстких дисков (к примеру AData, PQI, Transcend) предлагают собственные инструменты, интерпретирующие данные, предоставляемые системой S.M.A.R.T. С одной стороны, пользоваться такими инструментами легко и удобно: они дают чёткую и однозначную оценку состояния диска. Программы от производителей знают, как правильно интерпретировать данные из той или иной переменной (как мы увидим ниже, это не так просто сделать). С другой стороны, информации, предоставляемой такими инструментами, часто не хватает для вдумчивого анализа, а оценке, базирующейся на неизвестных данных, обработанных неизвестными алгоритмами, не стоит доверять безоговорочно.

Альтернатива – сторонние инструменты, подобные бесплатному CrystalDiskInfo. Программа выглядит следующим образом (кстати, в ней предусмотрена возможность переключения на русский язык):

Параметры S.M.A.R.T.

Рассмотрим подробнее жесткий диск компании WD на 2Tb. Итак, мы видим список из множества параметров. На что стоит обратить внимание с точки зрения надёжности диска?

Посмотрим, как S.M.A.R.T. программы вычисляют индекс надёжности устройства. Для жёстких дисков программа отслеживает такие параметры, как Reallocated Sectors Count, Current Pending Sectors Count и Uncorrectable Sector Count.

  • Перемещенные сектора (англ. Reallocated Sectors Count). Этот параметр отслеживает количество ненадёжных и сбойных секторов, переадресованных контроллером диска в специальную резервную область. На качественных новых дисках этот параметр должен равняться нулю, но иногда попадаются экземпляры с ненулевым значением счётчика прямо из коробки. Само по себе наличие небольшого числа (т.е. гораздо ниже порогового значения, определяемого производителем) таких секторов не является признаком серьёзной угрозы целостности ваших данных, но постепенный (а тем более – быстрый) рост числа перемещенных секторов указывает на чрезмерный или преждевременный износ пластин диска, и является прямым показанием к замене такого диска.
  • Помеченные к переадресации сектора (англ. Current Pending Sector Count). Производители жёстких дисков трактуют данный параметр по-разному; в некоторых моделях помеченные секторы могут быть признаны годными к дальнейшему использованию. В других моделях такие секторы со временем переходят в режим «перемещенных». В любом случае, большое значение этого счётчика указывает на необходимость замены диска, а его рост со временем – на необходимость срочной замены.
  • Сбойные сектора (англ. Uncorrectable Sector Count). Если данные не удается прочесть после множества попыток, перемещать такой сектор бессмысленно – он помечается как сбойный. Наличие заметного числа таких секторов – признак износа или неисправности диска.


Что такое S.M.A.R.T. жестких дисков

Новейшие накопители представлены интеллектуальными устройствами, способными анализировать свое состояние и своевременно информировать пользователя о неполадках. Для этого аппаратная часть включает оригинальную опцию S.M.A.R.T.

Назначение технологии SMART.

Львиная доля дисковых накопителей последних лет, функционирует с использованием технологии S.M.A.R.T. Сочетание расшифровывается как self-monitoring, analysis and reporting technology , что на русском звучит как механизм самоконтроля, анализа и отчетности. Ее первые разработки увидели свет в 1995 году и с тех пор технология постоянно совершенствуется.

С момента производства дисковый накопитель начинает считывать свое текущее состояние, определяя его с помощью специальных параметров или атрибутов. Они располагаются в служебной зоне накопителя, доступ к которой имеет лишь встроенная программа. Просмотреть параметры позволяет отдельное ПО, чаще всего представленное утилитами от разработчиков конкретного жесткого диска. Через них в накопитель подаются вводные, после чего в журнале статистики появится информация о текущем состоянии диска.

В процессе эксплуатации накопителя, данные представленные в рамках параметров значения постоянно меняются. Параметры проходят путь с максимальных показателей, гарантирующих высокую производительность и эффективность до минимальных значений, связанных с высокой вероятностью выхода накопителя из строя.

Все представленные в рамках технологии S.M.A.R.T атрибуты имеет цифровой идентификатор. Как правило, он общий для накопителей различных версий, однако имеют место исключения. В данном отношении выделяется цифра 7, демонстрирующая ошибки в размещении головок на дисковую поверхность. Для накопителей формата SSD цифровой идентификатор неактуален. В отличие от 7-ки, цифра 9, которая показывает общий период непосредственной работы накопителя за срок использования, ее поддерживают все типы дисков HDD и SSD.

Структура параметров, представлена несколькими полями, демонстрирующих состояние диска и его разделов в конкретный период. Предназначенные для считывания информации утилиты выводят на экран следующие параметры:

  • ID – идентификационный номер
  • name – название атрибута
  • VAL – его текущее состояние
  • Wrst – наихудший показатель за период эксплуатации
  • Thresh – минимальный порог работоспособности

Показатели S.M.A.R.T

Существует несколько самых распространенных параметров. Они, за редким исключением, объединяют накопители большинства производителей, итак:

  • Raw Read Error Rate – показатель числа ошибок считывания
  • Throughput Performance – рабочая эффективность. Ее снижение указывает на необходимость замены
  • Spin Up Time – период развертывания накопителя в рабочее состояние. Рост параметра демонстрирует изношенность или недостаток питания
  • Start/Stop Count – показатель количества моментов развертывания диска, которое изначально ограничено его механической структурой
  • Reallocated Sectors Count – атрибут отражает число запасных участков. Туда при неполадках перенаправляется информация. В идеале количество подобных действий должно составлять 0
  • Read Channel Margin – канальный резерв. В наше время накопители обходятся без него
  • Seek Error Rate – Отражение механического состояния накопителя, в числе прочего демонстрирует излишнюю вибрацию и перегрев
  • Seek Time Performance – уровень оперативных возможностей, актуален лишь для дисков HDD
  • Power-on Time – прогноз продолжительности функционирования накопителя исходя из периода эксплуатации. Максимальные показатели составляют 100 и с течением времени снижаются до 0
  • Spin-Up Retry Count – количество дублирующих операций запуска. Их увеличение говорит об ошибках в механической структуре

Эти и другие атрибуты, идущие красным фоном, говорят о его критическом состоянии накопителя, что предполагает скорую поломку. Конкретного стандарта, объединяющего показатели параметров от различных производителей, не существует. В каждом случае нормальные значения индивидуальны, отражаясь в виде фона или статуса, где

  • Good – хороший показатель
  • Bad – плохой показатель.

Наряду с уже упомянутыми атрибутами следует уделять внимание таким параметрам как:

  • Recalibration Retries – число дублей при рекаблировке. Их повышение свидетельствует о неполадках механики
  • End-to-End error – Недостатки обменных операций
  • Reported UNC Errors – неполадки, чье устранение ведется с помощью аппаратных средств
  • G-sense error rate – количество механических воздействий на диск. Фиксирует неаккуратную установку, столкновения
  • Reallocation Event Count – общий показатель операций перенаправления информации. Фиксирует удачные и неудачные операции
  • Current Pending Sector Count – количество потенциальных участков накопителя, подлежащих замене
  • Uncorrectable Sector Count – количество неисправных секторов, неподлежащих восстановлению
  • UltraDMA CRC Error Count – неполадки перенаправления данных между накопителем и ПК
Читать еще:  Какие бывают жесткие диски
Ссылка на основную публикацию
Adblock
detector