Как скрыть BAD-блоки на жестких дисках

Автор Ruterk, 27 февраля 2013, 21:31:45

« назад - далее »

0 Пользователи и 1 гость просматривают эту тему.

Ruterk

Вопрос: На харде появилось несколько бэд блоков. Что делать? Может низкоуровневое форматирование? Как его осуществить?
Вопрос: Где взять программу для скрытия бэд-блоков у винтов ******* ? А то на официальном сайте ничего нет!


Ответ: Винчестер - одно из самых ненадежных устройств в компьютере. Ведь кроме сложной электроники он содержит непрерывно работающие механические части. Со временем они изнашиваются, и начинаются различные проблемы, самая распространенная из которых - появление BAD-блоков. Многих пользователей это застает врасплох, и они не знают, что делать дальше. Поэтому и была написана эта статья. В ней мы рассмотрим все доступные в домашних условиях способы избавления от этих проблем.

1. Немного истории

Bad-секторы (от англ. «BAD» - плохой, негодный) есть на любых винчестерах. Как бы тщательно не были изготовлены их диски, на каждом из них найдется несколько мест, запись или чтение которых сопровождается ошибками. Кроме того, встречаются и просто глючные участки поверхности, которые могут со временем перерасти в дефекты, что для пользователя недопустимо. Поэтому каждый накопитель после изготовления на заводе, проходит тщательное тестирование, в процессе которого выявляются испорченные секторы. Они помечаются как негодные и заносятся в специальную таблицу - дефект-лист.

Самые первые винты имели дефект-лист в виде бумажной наклейки, в которую на заводе вписывали адреса нестабильных участков. Эти устройства, представляющие собой слегка измененную копию обычного флоппи-дисковода, могли работать только под своими физическими параметрами: число дорожек, секторов и головок, указанное в их паспорте, точно совпадало с их реальным количеством. Приобретая такой девайс, пользователь читал наклейку и сам заносил адреса убитых участков в FAT. После этого операционная система переставала замечать эти дефекты, точно так же, как она не замечает бэд-блоки на дискетах, если они были убраны scandisk'ом. Вероятно, в те далекие времена и появился термин «бэд-блок»: блоком называли кластер - минимальную единицу логического дискового пространства. На физическом уровне кластер состоит из нескольких секторов, и при повреждении одного сектора ОС объявляет негодным весь кластер. Никаких других методов скрытия дефектов в то время не существовало. А когда появились способы скрывать отдельные секторы, люди не стали выдумывать новые понятия, и до сих пор успешно продолжают пользоваться словом «блок».

Прошло совсем немного времени, прежде чем изготовители додумались до очень интересной вещи: если пользователь все равно помечает bad-блоки, как ненужные, рассудили они, то почему бы не пометить их прямо на заводе? Но как это сделать, если на винте нет никакой файловой системы, и неизвестно, какая будет? Вот тогда и придумали хитрую штуку, называемую «транслятор»: на блины стали записывать специальную таблицу, в которой отмечалось, какие секторы следует спрятать от пользователя, а какие - оставить ему. Транслятор стал своеобразным промежуточным звеном, соединяющим физическую систему «диски-головки» с интерфейсом накопителя. Предполагалось, что при включении винт сначала прочитает свои внутренние таблицы, скрывая отмеченные в них адреса дефектов, а уже затем допустит к себе BIOS, ОС и прикладные программы. А чтобы пользователь случайно не затер транслятор во время работы, он был помещен в специальную область диска, недоступную обычным программам. Только контроллер винта мог получить доступ к ней. Это событие произвело настоящий переворот в винчестеростроении, и ознаменовало появление нового поколения накопителей - со служебной зоной. Для того, чтобы все винты одной модели, но с разным количеством дефектов, имели одинаковую емкость, на каждом из них стали оставлять запасные дорожки - резерв, специально предусмотренный для выравнивания емкости однотипных накопителей до стандартной заявленной величины. Его стали располагать в конце диска, возле его центра, и он тоже был недоступен пользователю. Такие винчестеры при выходе с завода не имели не одного видимого bad-сектора. Если в процессе эксплуатации появлялись новые дефекты, пользователь мог сделать низкоуровневое форматирование универсальной утилитой из BIOS материнской платы, и попытаться их скрыть. Иногда, как и на дискетах, это удавалось. Но если «нечисть» была физической, то это не помогало: добавить новые дефекты в таблицу и переписать транслятор без специальных программ было невозможно. Поэтому bad-блоки на многих старых винтах (до 1995 года), приходилось скрывать все тем же, устаревшим способом - через FAT. И лишь фирмы Seagate, Maxtor и Western Digital выпустили утилиты для скрытия дефектов с замещением их из резерва (они и по сей день валяются на некоторых ftp и называются sgatfmt4.exe, mformat2.exe и wddiag.exe соответственно).

Прошло время, и винты еще больше изменились. Стремясь увеличить плотность записи, разработчики стали применять различные нестандартные ухищрения: на пластины стали наносить сервометки, предназначенные для более точного попадания головок на дорожки. Появилась технология зонно-секционной записи (ZBR), смысл которой заключался в разном количестве секторов на внешних и внутренних дорожках. Изменился привод головок - вместо шагового двигателя стали применять позиционер в виде подвижной катушки. Да и сами головки и диски изменились настолько, что каждая фирма разработала свою структуру формата нижнего уровня, заточенную только под их технологии. Это сделало невозможным применение универсальных утилит низкоуровневого форматирования из-за того, что транслятор таких винтов научился скрывать физический формат накопителей, переводя его в виртуальный.

Написанное на корпусе винта число цилиндров, секторов и головок, перестало соответствовать своим истинным значениям, и попытки отформатировать такой винт старыми утилитами, как правило, заканчивались неудачно: его контроллер отвергал стандартную ATA-команду 50h, или просто имитировал форматирование, заполняя винт нулями. Это было специально оставлено для совместимости со старыми программами. По этой же причине процедура Low-Level Format была исключена из BIOS современных материнских плат. А чтобы сделать таким винтам настоящее низкоуровневое форматирование, нужно было обойти транслятор, получив прямой доступ к физическим дорожкам и головкам. Для этого стали использовать технологическую утилиту, запускающую специальный микрокод, записанный в ПЗУ накопителя. Команда вызова этого микрокода - уникальна для каждой модели винта, и относится к технологическим командам, которые фирмой не разглашаются. Часто такое форматирование нельзя было сделать через стандартный IDE-интерфейс: многие модели винтов выпуска 90-х годов - Conner, Teac и др., а также все современные Seagate, требуют подключения отдельного разъема к терминалу через COM-порт.

Что касается технологических утилит, то они никогда широко не распространялись и обычному пользователю были недоступны. Для широкого применения были написаны программы-дурилки, осуществляющие псевдо-форматирование через интерфейс: заполнение диска нулями для очистки его от информации. Это видно даже из названий этих утилит, которые можно найти на сайтах производителей хардов: wdclear, fjerase, zerofill и т.д. Естественно, никаких технологических команд в этих программах нет, и поэтому их можно применять к любым винчестерам. Такие утилиты часто оказываются полезны, помогая избавиться от некоторых видов BAD'ов, о чем мы поговорим чуть позже.

Почему же производители поступили так жестоко, лишив нас возможности делать правильное низкоуровневое форматирование, и скрывать дефекты самостоятельно? На этот вопрос до сих пор не существует единого мнения, но официальный ответ большинства фирм звучит примерно так: «это настолько сложная и опасная операция, что рядового пользователя до нее допускать нельзя, иначе многие винты будут попросту убиты. Поэтому низкоуровневое форматирование можно делать только на заводе, или в фирменном сервис-центре».

Попробуем разобраться, так ли это на самом деле. А заодно рассмотрим, что же такое настоящее низкоуровневое форматирование современных винчестеров, можно ли его делать самому, и что самое главное - нужно ли нам оно?

2. Подготовка винчестера на заводе.

Перед скрытием bad'ов на заводе очень важно выявить все, даже очень маленькие дефекты, а также нестабильные участки, которые могут со временем перерасти в bad'ы. Ведь если такое случится в процессе эксплуатации, пользователь может лишиться важного файла, да и репутация фирмы, выпустившей такой «недоделанный» накопитель, будет испорчена. Поэтому тестирование винчестеров перед скрытием дефектов занимает очень много времени, как минимум несколько часов, и выполняется в технологическом режиме. Это сделано для исключения временных задержек, неизбежно возникающих при работе транслятора, пересылке данных через кэш и интерфейсную логику. Поэтому на заводе поверхность сканируют только по физическим параметрам. Обычно этим занимается не внешняя программа, а специальный модуль в ПЗУ винта, работающий без участия интерфейса. Конечным результатом такого тестирование становится получение дефект-листа - электронного списка негодных областей дискового пространства. Он заносится в служебную зону винта и храниться там на протяжении всего срока эксплуатации накопителя.

Современные винчестеры имеют два основных дефект-листа: один заполняется на заводе при изготовлении накопителя и называется P-list («Primary»-первичный), а второй называется G-list (от слова «Grown» - растущий), и пополняется в процессе эксплуатации винта, при появлении новых дефектов. Кроме того, некоторые винты (в частности - Quantum Fireball серий ST и TM), имеют еще и лист серво-дефектов (сервометки, наносимые на пластины винчестеров, тоже иногда имеют ошибки), а многие современные модели содержат еще и список временных (pending) дефектов. В него контроллер заносит «подозрительные» с его точки зрения секторы, например те, что прочитались не с первого раза, или с ошибками.

Получив дефект-лист, приступают к скрытию дефектов. Существует несколько способов их скрытия, каждый из которых имеет свои особенности. Теоретически можно просто переназначить адреса испорченных секторов в резерв и брать их оттуда, но это вызовет потерю производительности винта, так как он, каждый раз обнаруживая сектор, помеченный как негодный, будет вынужден перемещать головки в резервную область, которая может находиться далеко от места дефекта. Если переназначенных секторов будет много - производительность накопителя очень сильно упадет, так как большую часть времени он будет затрачивать на бесполезное дёрганье головками. Более того, быстродействие винтов с разным количеством дефектов будет сильно различаться, что конечно же, при массовом производстве недопустимо. Такой метод скрытия дефектов получил название «метод замещения» или ремап (от английского «re-map»: перестройка карты секторов).

Из-за многочисленных недостатков, присущих ремапу, при промышленном изготовлении винтов такой метод никогда не применяют, а используют другой алгоритм: после выявления всех дефектов, адреса всех исправных секторов переписываются заново, так, чтобы их номера шли по порядку. Плохие сектора просто игнорируются и в дальнейшей работе не участвуют. Резервная область также остается непрерывной и ее часть присоединяется к концу рабочей области - для выравнивания объема. Такой способ скрытия бэдов сложнее в реализации, чем ремап, но результат стоит затраченных на него усилий - при любом количестве неисправных секторов, замедления работы накопителя не происходит. Этот, второй основной тип скрытия дефектов получил название «метод пропуска сектора». (Существуют и другие алгоритмы заводского скрытия дефектов, например путем исключения целой дорожки, или при помощи запасного сектора на каждой дорожке, но они имеют недостатки и поэтому в современных накопителях практически не используются).

Процесс пересчета адресов с пропуском дефектов получил название «внутреннее форматирование». Внутреннее - потому, что весь процесс происходит полностью внутри винта, по физическим адресам и без участия интерфейса. В это время винт находится под управлением встроенной в его ПЗУ микропрограммы, которая анализирует дефект-лист и управляет форматированием. Внешними командами прервать ее нельзя. По окончании форматирования микропрограмма автоматически пересчитывает транслятор (или создает его заново), и винт становится готов к употреблению. После этого он, без единого бэд-блока, поступает с завода к покупателю.

3. Новые технологии

Теперь понятно, почему фирменные утилиты не делают никаких операций, связанных с прямым доступом к служебной области. Ведь скрытие дефектов форматированием - это практически полный ремонтный цикл, основанный на внешних параметрах и связанный с четким пониманием каждого шага. И достаточно сделать что-то неправильно, чтобы угробить накопитель. Приведем простой пример: пользователь решил сделать «настоящее» низкоуровневое форматирование путем запуска подпрограммы ПЗУ в технологическом режиме. Процесс обычно длится 10-60 минут, но тут случается перебой с питанием или банальное зависание - и винт остается без транслятора, т.к. просто не успевает его заново создать. Это означает, что к дальнейшей работе такой девайс будет непригоден - его просто не увидит ни ОС, ни BIOS. Страшно даже представить, сколько накопителей может быть убито таким образом, из простого любопытства или по ошибке. Особенно, если эти утилиты попадут в руки чайников, запускающих на своих компах все подряд и нажимающих RESET вместо «any key». Конечно, диск портится не безвозвратно, и повторным запуском форматирования можно вернуть его к жизни. Но мышление у большинства пользователей устроено так, что столкнувшись с проблемами (не определяющийся в BIOS труп вместо винта), многие впадают в панику, обвиняя во всем производителей. А им лишний геморрой, естественно не нужен - гораздо важнее заставить винт отработать гарантийный срок.

Поэтому несколько лет назад в накопители стали закладывать возможность самостоятельно «ремонтировать» сбойные участки - делать ремап. Как было сказано раньше, ремап не нашел применения при заводской подготовке накопителей, но оказался очень удачным решением для скрытия дефектов в бытовых условиях. Преимущества ремапа перед внутренним форматированием - отсутствие перевода винта в технологический режим, быстрота проведения и безопасность для накопителя. Кроме того, во многих случаях ремап можно делать без сноса файловой системы, и без связанного с этим уничтожения данных. Эта технология получила название automatic defect reassignment (автоматическое переназначение дефектов), а сам процесс - reassign. Таким образом remap и reassign - это по большому счету одно и тоже, хотя термин reassign обычно применяют к отдельному сектору, а remap - ко всему диску.

Работает ремап следующим образом: если при попытке обращения к сектору происходит ошибка, «умный» контроллер понимает, что данный сектор неисправен, и «на лету» помечает его как BAD. Его адрес тут же заносится в таблицу дефектов (G-list). У многих винтов это происходит настолько быстро, что пользователь даже не замечает обнаружение дефекта и его скрытие. Во время работы винт постоянно сравнивает текущие адреса секторов с адресами из таблицы и не обращается к дефектным секторам. Вместо этого он переводит головки в резервную область и читает сектор оттуда. К сожалению, из-за времени, затрачиваемого на дальнее позиционирование, такие секторы будут выглядеть, как небольшие провалы на графике чтения. Тоже самое будет и при записи. Поэтому инженеры фирмы Quantum пошли еще дальше и почти устранили основной недостаток ремапа, воплотив свои идеи во многих моделях серии Fireball: у этих накопителей имеется по одному запасному сектору на каждой дорожке, ремап происходит в этот сектор, и задержки практически отсутствуют.

Если ошибка возникает во время обычной работы ОС, автоматический ремап происходит крайне редко. Это связано с тем, что, на большинстве хардов, reassign срабатывает только при записи. А многие ОС перед записью проверяет сектор на целостность, и обнаруживая ошибку, отказывается в него писать. Поэтому, в большинстве случаев для производства ремапа винт надо об этом «попросить» - произвести принудительную низкоуровневую перезапись сектора в обход стандартных функций ОС и BIOS. Это делается программой, способной обращаться к винту напрямую через порты IDE-контроллера. Если во время такой записи возникнет ошибка, контроллер автоматически заменит этот сектор из резерва, и BAD исчезнет.

На этом принципе основана работа большинства утилит так называемого «низкоуровневого форматирования» от производителей. Все они, при желании, могут использоваться для винтов других фирм (если такие проги отказываются работать с чужими хардами - это сделано по маркетинговым соображениям. Такой жадностью страдает, например фирма Fujitsu). И конечно же, функции ремапа присутствуют во многих универсальных и бесплатных программках, особенности использования которых мы рассмотрим чуть позже. А пока - еще немного теории :)

Наиболее распространенным мифом среди пользователей является утверждение, что для каждого винта нужна своя, «особая» программа скрытия дефектов, а также то, что ремап - это низкоуровневое форматирование. На самом деле это не так. Ремап - это всего лишь разновидность записи информации стандартными средствами, и в большинстве случаев любые утилиты для ремапа могут применяться к любым винтам. Ремап делают не внешние программы, а контроллер винта. Только он принимает решение о переназначении дефектных секторов. Испортить накопитель «чужие» программы тоже не могут, так как технологические команды в них не используются, а в обычном режиме винт никогда не позволит сделать с собой ничего, кроме стандартных операций чтения-записи. Единственное различие между фирменными утилитами заключается в количестве попыток записи/чтения/верификации для разных винтов. Для того, чтобы контроллер «поверил», что в секторе имеется подлежащий скрытию BAD, некоторым хардам достаточно одного цикла, а другим - нескольких.

4. Снова о S.M.A.R.T.

Почти все винчестеры, выпущенные после 95-го года, имеют систему оперативного наблюдения за своим состоянием - S.M.A.R.T. (Self Monitoring And Reporting Technology). Эта технология позволяет в любое время оценить такие важные параметры накопителя, как количество отработанных часов, число возникших в процессе чтения/записи ошибок и многое другое. Первые винчестеры, оснащенные этой системой (например WD AC21200) имели очень несовершенный SMART из четырех-шести атрибутов. Но вскоре был разработан стандарт SMART-II, и с момента его появления в большинстве накопителей появилась такая особенность, как внутренняя диагностика и самоконтроль. Эта функция основана на проведении серии автономных внутренних тестов, которые можно запустить стандартными ATA-командами, и предназначена для углубленного контроля за состоянием механики накопителя, поверхности дисков и многих других параметров. После выполнения тестов, накопитель в обязательном порядке обновляет показания во всех SMART-атрибутах, в соответствии со своим текущим состоянием. Время тестирования может варьироваться от нескольких секунд (Quantum) до 54 минут (Fujitsu MPG). Активизировать тесты SMART можно, например, программой MHDD: (консольная команда "smart test"). После запуска тестов возможны «странные» явления, очень похожие на те, что возникают при работе дефрагментатора: непрерывное горение индикатора HDD и звук интенсивного движения головок. Это нормальное явление: винт сканирует поверхность для поиска дефектов. Нужно просто подождать некоторое время, пока самотестирование закончится, и винт успокоится.

Более подробно ознакомиться с новинками технологии S.M.A.R.T. можно здесь: http://yusoft.kulichki.com/russian/doc/smartdoc.htm.

Совсем недавно появилась спецификация SMART-III, в которой имеется не только функция обнаружения дефектов поверхности, но и возможность их восстановления «на лету» и многие другие новшества. Одной из его разновидностей стала система Data Lifeguard, применяемая в новых накопителях Western Digital. Ее суть заключается в следующем: если к винту не происходит никаких обращений, он начинает самостоятельно сканировать поверхность, выявляя нестабильные секторы, и при их обнаружении переносит данные в резервную область. После чего делает ему reassign. Таким образом данные оказываются спасены еще до того, как на этом месте возникнет настоящий BAD. В отличие от SMART-мониторинга, Data Lifeguard не может быть отключен внешними командами и работает постоянно. Поэтому «видимые» BAD-блоки на современных винчестерах Western Digital практически никогда не появляются.

Для просмотра smart-статуса жесткого диска используют программы, называемые smart-мониторами. Один из них входит в состав комплекса HddUtil для DOS и называется smartudm. Скачать его можно здесь: www.sysinfolab.com/files/smartudm.zip. Эта программа работает с любыми жесткими дисками и контроллерами. Кроме того, в комплекте с этой прогой идет подробная документация с описанием всех атрибутов. Существуют SMART-мониторы и для Windows 9x, например, очень популярны SiGuardian (http://www.siguardian.ru/) и SmartVision (www.acelab.ru/products/pc/utility.smart203.zip), но они могут не работать на некоторых системах. Объясняется это тем, что программы работают с винтом напрямую, через порты, а bus mastering-драйвера некоторых чипсетов мешают этому. Обладателям Windows XP стоит обратить внимание на монитор SmartWiew www.upsystems.com.ua/support/alexmina/click.php?url=SmartView.zip - прога корректно работает в этой системе даже на чипсетах VIA.

Между атрибутами SMART и состоянием поверхности существует некоторая взаимосвязь. Рассмотрим те из них, которые имеют прямое отношение к bad-блокам:

Reallocated sector count и Reallocated event count: число переназначенных секторов. Эти атрибуты показывают количество секторов, переназначенных ремапом в Grown дефект-лист. У новых винтов они обязательно должны быть равны нулю! Если их значение отличается от нуля, то это означает, что винт уже был в употреблении, на нем появлялись бэды, и ему был сделан ремап. А у винтов Fujitsu эти атрибуты могут самопроизвольно увеличиваться из-за некачественного питания. Будьте внимательны при покупке б/у!

Raw read error rate: количество ошибок чтения. У многих хардов (например у Seagate и Fujitsu) они всегда выше нуля, но если значение Value находится в пределах нормы (зеленая зона), опасаться нечего. Это «мягкие» ошибки, успешно скорректированные электроникой накопителя и не приводящие к искажению данных. Опасно, когда этот параметр резко снижается за короткий срок, переходя в желтую зону. Это говорит о серьезных проблемах в накопителе, о возможном появлении бэдов в ближайшее время, и о том, что пора делать backup важных данных.

Current Pending Sector: этот атрибут отражает содержимое «временного» дефект-листа, присутствующего на всех современных накопителях, т.е. текущее количество нестабильных секторов. Эти секторы винт не смог прочесть с первого раза. Поле raw value этого атрибута показывает общее количество секторов, которые накопитель в данный момент считает претендентами на remap. Если в дальнейшем какой-то из этих секторов будет прочитан (или переписан) успешно, то он исключается из списка претендентов. Постоянное значение этого атрибута выше нуля говорит о неполадках в накопителе.

Uncorrectable Sector: показывает количество секторов, ошибки в которых не удалось скорректировать ECC-кодом. Если его значение выше нуля, это означает, что винту пора делать ремап: не исключено, что во время записи данных ОС нарвется на этот сектор и в результате какая-нибудь важная инфа или системный файл окажутся испорчены. Однако, у некоторых винтов, например у Fujitsu MPG, этот атрибут почему-то не сбрасывается и после ремапа, поэтому доверять его показаниям необязательно.

5. Виды дефектов и причины их появления

Настало время разобраться, а отчего, собственно, возникает такая неприятность, как бэды? В UPGRADE #49 мы рассмотрели лишь внешние причины, способствующие их возникновению. А теперь пришло время взглянуть на проблему с другой точки зрения - со стороны самого винчестера. Для этого рассмотрим структуру сектора, в том виде, каким его видит электроника винта «изнутри»:

[attachimg=1]

Рис. 1. Упрощенная структура сектора жесткого диска.

Как видно из рисунка 1, все намного сложнее, чем могло показаться на первый взгляд, даже с помощью дискового редактора. Сектор состоит из заголовка-идентификатора и области данных. Начало сектора помечается специальным байтом - адресным маркером (1). Он служит для сообщения контроллеру о том, что сектор находится под головкой. Затем следуют ячейки, в которых содержится уникальный адрес сектора в формате CHS (2) и его контрольная сумма - для проверки целостности записанного адреса (3). 512 байт данных пользователя помещаются в отдельном поле (4), к которому при записи добавляется несколько десятков байт избыточной информации, предназначенной для коррекции ошибок чтения с помощью ECC-кода (5). Рядом с данными размещается 4 байта циклической контрольной суммы (CRC) данных, которая служит для проверки целостности данных пользователя, и сообщения системе коррекции ошибок при ее нарушении (6). Для более надежной работы сектора при колебаниях скорости вращения имеются байты-пробелы (7). У некоторых винчестеров имеется дополнительный байт после AM - в нем сектор помечается как BAD.

Структура низкоуровневого формата сильно различается у разных моделей накопителей, и определяется типом используемого контроллера, его микропрограммой и изобретательностью разработчиков. Например, у новых винчестеров фирмы IBM используются секторы без служебных заголовков - NoID. Его устройство подробно описано на сайте IBM: http://www.storage.ibm.com/hdd/ipl/oem/tech/noid.htm.

Пока структура формата не нарушена, винчестер работает исправно, четко выполняя свои обязанности - хранение информации. Но стоит вмешаться злым силам - и в зависимости от вида разрушений, они проявляются как BAD'ы разной степени тяжести.

Дефекты можно разделить на две большие группы: физические и логические. Рассмотрим каждый их вид подробно.

Физические дефекты

Дефекты поверхности. Возникают при механическом повреждении магнитного покрытия внутри пространства сектора, например из-за царапин, вызванных пылью, старением блинов или небрежным обращением с винтом. Такой сектор должен быть помечен как негодный и исключен из обращения.

Серво-ошибки. У всех современных накопителей для перемещение головок используется система, получившая название «voice coil» (звуковая катушка), которая в отличие от шагового двигателя старых винтов, не имеет какой-либо дискретности перемещения. Для точного попадания головок на дорожки в винтах используется система с обратной связью, которая ориентируются по специальным магнитным сервометкам, нанесенным на диск. Сервометки имеются на каждой стороне каждого диска. Они расположены равномерно вдоль всех дорожек, и строго радиально, как спицы в колесе, образуя сервоформат. Он не относится к формату нижнего уровня и на рисунке не показан, но имеется абсолютно у всех современных винчестеров, и играет важнейшую роль. По сервометкам происходит стабилизация скорости вращения двигателя и удержание головки на заданном треке, независимо от внешних воздействий и тепловой деформации элементов.

Однако в процессе эксплуатации винта, некоторые сервометки могут оказаться разрушены. Если дохлых сервометок станет слишком много, в этом месте начнут происходить сбои при обращении к информационной дорожке: головка, вместо того, чтобы занять нужное ей положение и прочитать данные, начнет шарахаться из стороны в сторону. Это будет выглядеть как жирный и особо наглый BAD, или даже как группа BAD'ов. Их присутствие часто сопровождается стуком головок, зависанием накопителя и невозможностью исправить его обычными утилитами. Устранение таких дефектов возможно только специальными программами, путем отключения дефектных дорожек, а иногда и всей дисковой поверхности. Для этих целей в некоторых накопителях имеется серводефект-лист, хранящий информацию о плохих сервометках. В отличие от P- и G-листа, серводефект-лист используется не транслятором, а всей микропрограммой винта. К секторам, имеющим дефектные сервометки, блокируется доступ даже по физическим параметрам, что позволяет избежать стуков и срывов при обращении к ним. Самостоятельно винт восстановить сервоформат не может, это делается только на заводе.

Аппаратные BAD'ы. Возникают из-за неисправности механики или электроники накопителя. К таким неполадкам относятся: обрыв головок, смещение дисков или погнутый вал в результате удара, запыление гермозоны, а также различные глюки в работе электроники. Ошибки такого типа обычно имеют катастрофический характер и не подлежат исправлению программным путем.

Логические дефекты

Эти ошибки возникают не из-за повреждения поверхности, а из-за нарушений логики работы сектора. Их можно разделить на исправимые и неисправимые. Логические дефекты имеют такие же внешние проявления, как и физические, и отличить их можно только косвенно, по результатам различных тестов.

Исправимые логические дефекты (софт-бэды): появляются, если контрольная сумма сектора не совпадает с контрольной суммой записанных в него данных. Например из-за помех или отключения питания во время записи, когда винт уже записал в сектор данные, а контрольную сумму записать не успел (рис 1). При последующем чтении такого «недописанного» сектора произойдет сбой: винт сначала прочитает поле данных, потом вычислит их контрольную сумму и сравнит полученное с записанным. Если они не совпадут, контроллер накопителя решит, что произошла ошибка и сделает несколько попыток перечитать сектор. Если и это не поможет (а оно не поможет, так как контрольная сумма заведомо неверна), то он, используя избыточность кода, попытается скорректировать ошибку, и если это не получится - винт выдаст ошибку внешнему устройству. Со стороны операционной системы это будет выглядеть как BAD. Некоторые винты имели повышенную склонность к образованию софт-бэдов из-за ошибок в микропрограмме - при определенных условиях контрольные суммы вычислялись неправильно; у других это происходило из-за дефектов механики. Например, у IBM DTLA периодически нарушался контакт между платой и гермоблоком, что приводило к пропаданию питания гермоблока в самое неподходящее время, в том числе и при записи.

Операционная система или BIOS не могут исправить логический дефект самостоятельно, так как прежде чем писать в сектор, они проверяют его на целостность, нарываются на ошибку и отказываются писать. При этом контроллер винта эту ошибку скорректировать тоже не может: он тщетно пытается прочитать этот сектор со второй, с третьей попытки, и когда это не получается - он всеми силами пытается себе помочь, на ходу подстраивая канал чтения и сервосистему. При этом и раздается тот самый душераздирающий скрежет, так хорошо знакомый владельцам бэдастых «дятлов». Этот скрип производят не «головки по поверхности», как многие привыкли думать, а всего лишь катушка позиционера, из-за специфической формы тока, протекающего через нее, и он абсолютно безопасен. Адрес непрочитанного сектора попадает во временный дефект-лист, изменяя значение атрибута Current Pending Sector в SMART, и сохраняется в нем. Ремапа при чтении не происходит.

И только принудительная низкоуровневая перезапись этого сектора специальной программой в обход BIOS приводит к автоматическому перерасчету и перезаписи контрольной суммы, т.е. бэд бесследно исчезает. Переписать его можно дисковым редактором, способным работать с винтом непосредственно через порты, но обычно «переписывают» весь диск, заполняя его секторы нулями. Утилиты, делающие это, свободно распространяются производителями хардов, и часто неправильно называются «программами для низкоуровневого форматирования». На самом деле это - простые «обнулители», что нисколько не мешает им избавлять винт от бэдов: при удачной записи софт-бэды исчезают, а при неудачной - бэд считается физическим, и происходит авторемап.

Неисправимые логические ошибки. Это ошибки внутреннего формата винчестера, приводящие к такому же эффекту, как и дефекты поверхности. Возникают при разрушении заголовков секторов, например из-за действия на винт сильного магнитного поля. Но в отличие от физических дефектов, они поддаются исправлению программным путем. А неисправимыми они названы только потому, что для их исправления необходимо сделать «правильное» низкоуровневое форматирование, что обычным пользователям затруднительно из-за отсутствия специализированных утилит. Поэтому в быту такой сектор отключается так же, как и физический - с помощью ремапа. В настоящее время все большее количество винтов выпускается по технологии ID-less (сектора без заголовков), поэтому скоро этот вид ошибок станет неактуальным.

«Адаптивные» бэды. Несмотря на то, что винты является очень точными устройствами, при их массовом производстве неизбежно возникает разброс параметров механики, радиодеталей, магнитных покрытий и головок. Старым накопителям это не мешало, но у современных винтов с их огромной плотностью записи, малейшие отклонения в размерах деталей или в амплитудах сигналов, могут привести к ухудшению свойств изделия, появлению ошибок, вплоть до полной потери его работоспособности. Поэтому все современные винты при изготовлении проходят индивидуальную настройку, в процессе которой подбираются такие параметры электрических сигналов, при которых устройству работается лучше. Эта настройка осуществляется программой ПЗУ при технологическом сканировании поверхности. При этом генерируются так называемые адаптивы - переменные, в которых содержится информация об особенностях конкретного гермоблока. Адаптивы сохраняются на блинах в служебной зоне, а иногда во Flash-памяти на плате контроллера.

Если в процессе эксплуатации винта адаптивы окажутся разрушены (это может случиться в результате ошибок в самом винте, статического электричества или из-за некачественного питания), то последствия могут быть непредсказуемы: от банальной кучи бэдов до полной неработоспособности девайса, с отказом выходить на готовность по интерфейсу. «Адаптивные>» бэды отличаются от обычных тем, что они «плавающие»: сегодня они есть, а завтра могут исчезнуть и появиться совсем в другом месте. Ремапить такой винт бесполезно - дефекты-призраки будут появляться снова и снова. И при этом дисковая поверхность может быть в безупречном состоянии! Лечатся адаптивные бэды прогоном selfscan'а - внутренней программы тестирования, аналогичной той, что применяется на заводе при изготовлении винтов. При этом создаются новые адаптивы, и винт возвращается к нормальному состоянию. Это делается в условиях фирменных сервис-центров.

Намечающиеся дефекты

Это участки поверхности, на которых еще не сформировался явно выраженный дефект, но уже заметны проблемы со скоростью чтения. Это происходит от того, что сектор не читается контроллером с первого раза, и винт вынужден делать несколько оборотов диска, пытаясь прочитать его без ошибок. Если прочитать данные все-таки удается, то винт ничего не сообщит операционной системе, и ошибка останется незамеченной до тех пор, пока на этом месте не возникнет настоящий BAD-блок. Как правило, тут же выясняется, что именно на этом месте хранился очень важный файл, в единственном экземпляре, и спасти его уже нельзя. Поэтому диски нужно периодически тестировать. Это можно делать программой Scandisk или Norton Disk Doctor в режиме тестирования поверхности, но лучше - специальной утилитой, работающей независимо от файловой системы и умеющей выявлять намечающиеся BAD'ы, замеряя время чтения каждого сектора.

Ruterk

#1
6. Практика

Каждая фирма, выпускающая винчестеры, обычно разрабатывает специальный софт для диагностики и обслуживания своих накопителей, размещая его в Сети для свободного использования. Иногда эти утилиты уже содержат в своем составе операционную систему (обычно это одна из разновидностей DOS), как например Sea Tool от Seagate или Drive Fitness Test от IBM. А иногда это просто исполняемый файл, который нужно самому запустить из DOS, как например у Maxtor или Fujitsu. Такой софт позволяет протестировать накопитель на наличие ошибок и при возможности исправить их. Среди методов исправления часто можно встретить функции очистки диска (заполнение его нулями с уничтожением всей информации), а также скрытия дефектов методом ремапа. Но мы не будем рассматривать фирменные утилиты - ведь о них не раз было написано, например в UPGRADE # 15(53). Тем более, как мы узнали, эти программы делают вполне стандартные вещи: запись нулей и проверку поверхности. Поэтому обратим внимание на несколько очень неплохих альтернативных программ, а из фирменных утилит рассмотрим только самую совершенную - IBM DFT.

Итак, мы имеем такую забавную вещицу, какой является бэдастый хард. Или хотим застраховать себя от "сюрпризов" и проверить его, пока он исправен. Для этого, прежде всего, скачиваем программу MHDD: maysoft.com.ua/files/mhdd/mhdd2743.zip. Для обслуживания винтов IBM понадобится утилита Drive Fitness Test ( http://www.storage.ibm.com/hdd/support/download.htm). Всем, у кого имеются харды объемом до 8.4 Гб, особенно старые Western Digital, рекомендуется иметь в хозяйстве программу HDD Utility для DOS: http://www.shostatsky.narod.ru/rem_comp/hddut23r.rar. Полезно будет запастись и программой HddSpeed для DOS v2.4. bbs.hotbox.ru/HDDSPEED.RAR - она поддерживает винты больших объемов.

Прежде всего, нужно подготовить диагностический софт и создать загрузочный диск с MS-DOS. Можно пожертвовать загрузочной дискетой Windows 9x, удалив с нее все файлы кроме io.sys, msdos.sys и command.com. На освободившееся место записываем исполняемый файл программы MHDD: mhdd2743.exe и файл конфигурации mhdd.cfg. Так как свободного места на дискете еще много, записываем на нее SMART-монитор smartudm.exe , и какой-нибудь файл-менеджер, например Volkov Commander для ДОС. Он понадобится для просмотра содержимого отчетов работы программ. Для удобства все файлы размещаем в корневом каталоге дискеты. Как вариант - дискету можно вообще не создавать или использовать ее только для загрузки ДОС, а все программы запускать прямо с основного винчестера, подключив проверяемый винт на другой IDE канал. Записывать программы на CD, чтобы запускать их оттуда, не нужно - диск обязательно должен быть открыт для записи, так как программы будут создавать на нем логи работы, и потерпев при этом неудачу, попросту сглючат. После внимательного знакомства с описанием MHDD и SMARTUDM можно приступить к экзекуции. Для начала посмотрим Smart-информацию нашего накопителя (в дальнейшем это придется делать не раз).

Загружаемся с нашей дискеты, и если исследуемый винт висит на первичном IDE-канале, набираем в командной строке: a:\smartudm, а если на вторичном - a:\smartudm 1. Если в системе больше 2-х винтов, то цифра может быть больше 1. Перед нами появится таблица, характеризующая состояние накопителя (рис 2)

[attachimg=1]

Рис.2   График SMART-статуса жесткого диска для быстрой оценки его состояния.

Каждая строчка таблицы - это один из параметров текущего состояния винта. Напротив каждого из них, в графе "Indicator", находится шкала, разбитая на три цветные зоны. По мере износа накопителя длина индикаторов уменьшается, так как все больше зеленых квадратиков в их правой части оказываются погашены. Остаются желтые и красные. Когда все зеленые квадратики в каком-либо индикаторе исчезнут, это означает, что винт выработал свой ресурс или неисправен. При этом рекомендуется сохранить важные данные, так как в любой момент винт может умереть совсем. Если остался только красный квадратик - винт уже находится в аварийном состоянии, и к дальнейшему хранению файлов непригоден.

Надпись "T.E.C. not detected" означает то, что текущее состояние винта в полном порядке. Если это не так, то будет выдано предупреждение, выделенное красным цветом. Посмотрев на цветную диаграмму, можно быстро оценить, какой именно SMART-атрибут вызвал такое недовольство программы. В случае большого количества бэдов им наверняка будет самый верхний (Raw Read Error Rate). Но эта информация приблизительная, а нам нужны абсолютные значения атрибутов, поэтому нажимаем ENTER и видим примерно такую картинку (Рис. 3):

[attachimg=2]

Рис.3 Расширенный SMART-статус жесткого диска (точные значения атрибутов).

Вот этот режим SMART монитора и является основным, и по нему мы будем контролировать состояние накопителя при любых дальнейших действиях. Например, посмотрев значение атрибута 5 (Reallocated Sector Count), мы увидим содержимое пользовательского дефект-листа и сможем судить о том, удалось ли скрытие дефектов. При нажатии клавиши «R» текущий SMART-лог сохраняется в файл. Нажав клавишу «ESC» можно выйти из программы в DOS. Некоторые атрибуты контроллер обновляет «на лету», несколько раз в минуту, поэтому для получения наиболее достоверного результата, винт нужно протестировать, чем мы сейчас и займемся.

Выходим из SMART-монитора, и запускаем программу MHDD, введя в командной строке имя ее исполняемого файла (mhdd2743.exe заранее можно переименовать во что-нибудь попроще). После загрузки следует сразу нажать комбинацию клавиш «Shift+F3» - программа просканирует шину и покажет список подключенных к системе накопителей. Выберите тот, который нужно проверить, введя в консоль нужную цифру от 1 до 10 (Рис. 4). Затем следует нажать F2 для инициализации выбранного винта.

[attachimg=3]

Рис.4  Инициализация винта по команде F2.

После этих действий накопитель выдаст информацию о своем объеме, максимально поддерживаемом режиме DMA и многом другом. Программа MHDD видит винты целиком, совершенно не интересуясь их разбиением на разделы и типом файловых систем. Она увидит все IDE-винты, независимо от того, определены ли они в BIOS или нет. Даже если мать не поддерживает накопители больших объемов, программа все равно их увидит на полную емкость, лишь бы винты были исправны. Если это произошло, можно приступать к проверке поверхности. Для этого нажимаем F4, и в вехней строчке появившегося меню ставим параметр «Scan in: LBA» (по умолчанию там стоит CHS). Переключение между режимами CHS и LBA осуществляется с помощью клавиши «пробел». Затем нажимаем F4 второй раз. По экрану побегут серые прямоугольники. Это займет 10-30 минут, и абсолютно безопасно для хранящейся на винте информации, так как при этом происходит только чтение секторов. Вот что про этот режим написал автор программы в документации к ней:

«При выполнении проверки поверхности справа появится окно. В первой строке этого окна будет отображаться текущая скорость работы с поверхностью. В последней - два значения в процентах. Первое значение показывает процент выполнения текущего теста в заданном промежутке, а второе отображает, насколько далеко головки ушли от 0 цилиндра и пришли к последнему. В процессе тестирования поверхности один квадратик равен 255 секторам (при тестировании в режиме LBA), либо числу секторов в строке параметров HDD (обычно, 63 - при тестировании в режиме CHS). Чем "мутнее" квадратик - тем больше накопителю потребовалось времени для чтения этого блока секторов. Если пошли цветные квадратики - значит, накопитель не вписался в отведенный ему для работы промежуток времени. Цветными квадратиками отображается ненормальное состояние поверхности (но еще без BAD'ов). Чем ниже по меню цвет - тем больше накопителю понадобилось времени для чтения этого трудночитаемого участка. Красный цвет - признак того, что на этом месте уже почти сформировался BAD block. Вопросительный знак появляется при превышении максимального времени ожидания готовности. То есть, при появлении [?] можно считать, что накопитель «подвис» на этом месте и здесь явно присутствует либо серьёзный дефект поверхности, либо неисправен блок магнитных головок (БМГ). Всё, что ниже вопросительного знака - это ошибки (BAD block). Если они появляются в процессе тестирования, значит, на поверхности есть физические дефекты»

При наличии бэд-блоков, вместо квадратиков обычно появляются значки
  • , очевидно символизирующие кресты. Если поверхность в порядке и без цветных квадратиков, а все SMART-атрибуты находятся в зеленой зоне, можно вздохнуть свободно: винт пока исправен.

    Если же MHDD показал, что на поверхности имеются дефекты, а винт при этом «зависает» или издает скребущие звуки, значит проблемы есть. Но не будем думать сразу о плохом: ведь бэды могут быть логическими (софт-бэды), поэтому для начала устроим накопителю «прочистку мозгов» - выполним низкоуровневую запись нулей во все секторы. (Внимание! При этом вся информация на винте будет уничтожена, поэтому копируем важные данные на другой диск). Программа MHDD имеет две команды для обнуления дисков: "erase" и "aerase". Мы будем использовать ERASE, так как она работает быстрей.

    Инициализируем винт, нажав клавишу F2 (эту процедуру желательно делать перед любыми действиями), и вводим команду ERASE в консоль. Будьте очень внимательны при выборе накопителя, иначе по ошибке можно загубить свой рабочий винт: данные при этом теряются безвозвратно, и даже в ФСБ их уже не восстановят! Процедура очистки идет довольно медленно, занимая несколько десятков минут. Но в дальнейшем, немного разобравшись с программой, вы сможете стирать диск выборочно, введя начальный и конечный номер сектора перед запуском процедуры. Это очень удобно, если бэды находятся ближе к концу диска, а его начало безупречно.

    Выполнив очистку, снова запускаем тест поверхности (нажав F4 два раза или консольной командой SCAN). При этом контроллер винта должен пересчитать жизненно важные SMART-атрибуты, что сделает его smart-статус более достоверным. Если бэдов больше нет, винт можно считать отремонтированным. Выходим из MHDD, запускаем наш SMART-монитор и смотрим на значение атрибута Reallocated Sector Count. Если оно после очистки не увеличилось, а дефекты исчезли - значит они были логическими. Если увеличилось - они были физическими, и контроллер произвел успешный ремап этих секторов. Если же наоборот, бэды остались, а значение атрибута Raw Read Error Rate катастрофически упало - все намного сложнее, и винт имеет серьезные повреждения. Будем пытаться лечить его дальше - делать ремап.

    Возможно, вы уже успели заметить, что при однократном нажатии клавиши F4 в MHDD появляется менюшка, содержащая дополнительные параметры сканирования (рис. 5)

    [attachimg=4]

    Рис.5   Настройки параметров сканирования и ремапа.

    Среди этих параметров есть функция ремапа. По умолчанию она выключена, но поставив на нее курсор и нажав «пробел», можно включить её (Remap: ON). В этом режиме MHDD будет пытаться вылечить дефектный сектор, всячески показывая контроллеру, что там имеется BAD и его нужно скрыть. При этом возле каждого успешно скрытого сектора возникает синий квадратик или надпись [ok]. После ликвидации всех бэдов нужно еще раз прогнать тест поверхности, выйти из MHDD и снова запустить SMART-монитор, убедившись в том, что значение Reallocated Sector Count увеличилось. Это означает, что ремап прошел успешно, без ошибок, и дефекты действительно были замещены из резерва.

    Если вы по каким-то причинам не хотите терять инфу с бэдастого винта, например, ее некуда сохранить - не отчаивайтесь. Можно попробовать не делать полное обнуление, а перейти сразу к ремапу с помощью MHDD. Информация с винта при этом не стирается, кроме, пожалуй, той, что была в самих бэдах (но ее все равно уже не вернуть). При нахождени бэдов, программа применит к ним те же меры, что и при обнулении - низкоуровневую запись, а следовательно, даже если бэды окажутся логическими, они с большой вероятностью могут быть исправлены. Точный результат зависит от реализации микрокода конкретной модели накопителя. Например, ремап без обнуления хорошо работает на винчестерах фирмы Quantum и Maxtor. Но если это не поможет, и дефекты не исчезнут - обнуление все же придется сделать, на всякий случай. Например на винтах Fujitsu MPG только обнуление помогает решить проблемы с софт-бэдами, а ремап с помощью MHDD нужного эффекта не производит. В некоторых случаях может помочь только применение команды «aerase» (она обнуляет винт по другому алгоритму, но работает медленнее).

    Программа MHDD постоянно дополняется и совершенствуется. Поэтому, посетив сайт mhdd.com можно скачать ее самую последнюю версию.

    Может случиться так, что даже после всех проведенных операций бэды останутся, а SMART покажет то, что ремап не происходит. Причин может быть несколько:

    1. Винт очень старый, и его контроллер не поддерживает функцию Automatic Defect Reassignment. Например, винты фирмы «Conner» вообще ремапу не поддаются. Лечится только специальными технологическими утилитами.

    2. У винта может быть переполнен G-list, и в нем больше нет места для новых дефектов. Это хорошо видно в SMART по завалу атрибута Reallocated Sector Count. Такой винт ремонтируется в условиях мастерской, путем переноса всех ремапов в P-list и последующего низкоуровневого форматирования.

    3. Процедура автозамещения дефектов была отключена в самом винте. Фирменные утилиты некоторых накопителей позволяют это делать, и ими же можно вновь включить его. Это достаточно редкий случай.

    4. На винте может появиться особый, не поддающийся ремапу дефект. Например, если физически разрушен заголовок сектора, в котором сектор помечается как BAD, или сильно повреждены сервометки. Такой винт ремонтируется только в технологическом режиме, у хорошего специалиста.

    5. Контроллер так и не смог поверить в то, что сектор действительно дефектный, т.к. он все-таки смог прочитать/записать его, пусть даже не с первой попытки. В этом случае ремап не произойдет. Ни одна программа скрытия дефектов никогда не пишет напрямую в дефект-листы. Это может сделать только сам контроллер, на основании своих наблюдений. Для того чтобы он «поверил» в то, что в данном месте имеется бэд, и скрыл его, иногда приходиться довольно долго это ему объяснять, всячески показывая проблемный сектор - многократно производить запись/чтение, до возникновения ошибки. Поэтому утилиты для ремапа никогда не скроют намечающийся дефект. Для того, чтобы это произошло, нужен только настоящий BAD.

    Такая «недоверчивость» сделана специально: ведь каждый перемещенный сектор ухудшает параметры накопителя, снижая его быстродействие. И скрыть 666 бэдов ремапом скорей всего не получится - размер пользовательского дефект-листа ограничен, и при определенном его значении (от десятков до нескольких сотен секторов, в зависимости от конкретной модели), винт заваливает себе SMART, сообщая о том, что ему пора в ремонт или на свалку.

    Но не спешите выкидывать такой накопитель. Если он относительно современный, и не имеет переполненного дефект-листа (атрибут 5 в норме), надежда на ремап еще есть. Просто нужно попробовать применить к нему другую программу, имеющую большее количество циклов записи в дефектный сектор. К таким программам относится HDD Utility для DOS. Эта прога работает немного иначе, чем MHDD: в ней функции проверки поверхности и ремапа разделены, и ремап производится на основе протокола, создаваемого при сканировании. По этому сначала запускаем проверку, пройдя цепочку: [Choose Drive] - [Read test] - [Hard read], а затем переходим к пункту [Choose Drive] - [Recovery] - [Remap defects-] (рис 6). Перед этим желательно ознакомиться с описанием этой программы, благо оно очень подробное и написано по-русски. Недостатки Hdd Utility - непонимание накопителей с объемом больше 8,4 Гб и отказ работать с некоторыми моделями (последнее связано с ограничением бесплатной версии). Но это не столь важно - «трудноремапящиеся» винты обычно имеют небольшую емкость - обычно это различные модели Western Digital емкостью 0,65-6,4 Гб. Для больших винтов можно применить программу HddSpeed v.2.4, в ней тоже есть функции ремапа (Try to repair/reallocate found defects) и русское описание (рис.6)

    [attachimg=5]

    Рис.6: HDD Utility. Процесс скрытия дефектных секторов.

    [attachimg=6]

    Рис. 7: Ремап с помощью HddSpeed.

    Особенности винтов IBM

    Некоторые производители, стремясь улучшить характеристики своих винтов, но при этом стесненные скудными возможностями стандартных ATA-команд, разработали свои фирменные технологии, суть которых заключается в том, что часть утилит стали встраивать непосредственно в винты. Это дало возможность проводить безопасный доступ к служебной зоне, исключив технологические команды в самих утилитах. Именно так поступила фирма IBM, разработав технологию Drive Fitness Test. Винчестеры IBM оборудованы встроенным аппаратно-программным комплексом, предназначенным для их качественного обслуживания, диагностики и ремонта. Он состоит из двух частей: первая является расширением SMART-функций интеллектуального контроллера, а вторая запускается извне. При этом результат получается на порядок выше, чем при использовании любых универсальных программ. IBM ведут внутренние журналы ошибок, благодаря которым намного облегчается диагностика их неполадок - ведь их анализирует сам контроллер, а не внешняя программа. А использование фирменного метода NoID позволяет скрывать дефекты без ремапа, перемещая их сразу в P-list и пересчитывая транслятор. Поэтому владельцам винтов IBM нужно всегда иметь под рукой эту замечательную утилиту, скачать которую можно здесь: www.storage.ibm.com/hdd/support/download.htm.

    [attachimg=7]

    Рис. 8: IBM Drive Fitness Test в действии

    И все операции по обслуживанию этих хардов желательно делать именно ей (Рис. 8). Принцип работы этой программы, на первый взгляд, не отличается от описанного выше: сначала нужно попробовать сделать полную очистку диска, выбрав в меню Erase Disk. Но в отличие от других программ, DFT не только очистит винт, но и тут же исправит текущие значения SMART-атрибутов, а при обнаружении физических дефектов сам их скроет. Поэтому функция стирания диска в DFT и не работает с винтами других фирм - она взаимодействует с винтами IBM с помощью нестандартных ATA- команд, которые у других накопителей отсутствуют. Но несмотря на это, в DFT присутствует и универсальная процедура ремапа - «Corrupted Sector Repair», причем довольно неплохая, и работающая с любыми IDE винтами.

    Drive Fitness Test позволяет делать настоящее низкоуровневое форматирование, скрывая физические дефекты «правильным» способом, без ремапа. Но этот способ пересчитывает транслятор винта, что приводит к полному уничтожении информации. По этому эту функцию и встроили в меню «erase disk» - если пользователь уже дал согласие на стирание данных, почему бы этим не воспользоваться?

    Единственное, что DFT не умеет - так это строить график чтения. Поэтому, если очень хочется оценить состояние поверхности визуально, воспользуйтесь программами HddSpeed или MHDD с ее «квадратиками». Только имейте ввиду, что для винтов IBM нужно обязательно ставить режим LBA, так как в режиме CHS именно эти винты, по непонятным причинам глючат.

    Оценить реальное состояние накопителя по графику, полученному через его интерфейс, невозможно. Это объясняется тем, что при работе интерфейса неизбежно возникают задержки, так как контроллер винта, кроме передачи данных, выполняет множество других операций: преобразование физических адресов в LBA, дефект-менеджмент, запись внутренних SMART-логов, верификацию данных и вычисление их контрольных сумм, управление стратегией кэширования, термокалибровку и т.д. Поэтому этот метод пригоден только для приблизительной оценки винта, выявления грубых ошибок, и применяется только в быту. Это прекрасно понимают авторы тестировочных программ, указывая на невозможность использования их результатов в качестве любых доказательств. Наиболее достоверными считаются тесты под чистым DOS. В многозадачных средах ситуация хуже, так как любой фоновый процесс искажает временнЫе интервалы, что препятствует верной оценке состояния накопителя.

    Альтернативные методы скрытия дефектов

    Как уже было сказано выше, ремап обладает недостатком, проявляющимся в виде рывков головками в резервную область. При этом винт может щелкать во время работы, а на графике будут видны провалы. Это может сильно затруднить, например, работу с потоковым видео. Особенно сильно это проявляется, когда ремапы расположены в начале диска: при этом головки проходят максимальный путь, и задержки на их перемещение очень велики. Поэтому, в некоторых случаях ремап может оказаться нецелесообразным, а вместо него лучшим выбором будет скрытие дефектов средствами файловой системы. Например - обычным высокоуровневым форматированием format.com, программой scandisk или Norton Disk Doctor. Только решиться на этот шаг нужно сразу после проверки поверхности, не пытаясь сделать винту ремап. Иначе, при успешном его проведении, вернуть бэды назад и очистить таблицу дефектов будет нельзя. Ремап - однократная процедура, и если контроллер винта перенес адреса секторов в резерв, вернуть их назад будет уже невозможно.

    Другая альтернатива ремапу - обрезание пространства в конце диска с помощью технологии HPA (Host Protected Area), имеющийся у всех современных винтов. При этом винт будет определяться в BIOS на меньший объем, а все беды, если они расположены в конце, останутся «за бортом», и станут невидимы. Этот метод следует применять к накопителям, имеющим много бэдов в конце диска (к сожалению, такое бывает редко). В любой момент винту можно вернуть его полную емкость и, соответственно, бэды тоже. Сделать это можно программой MHDD (консольные команды HPA и NHPA), а также IBM Feature Tool http://www.storage.ibm.com/hdd/support/download.htm Если винт старый, и не под- держивает HPA, то можно создать отдельный логический раздел, причем, не только в конце, но и в любом другом месте диска, и расположить его так, чтобы большая группа бэдов оказалась в нем. Это делается программой Fdisk. Такой раздел можно забить ненужными файлами, а можно вообще его не форматировать, присвоив ему статус "non-dos" (тогда он станет невидим для системы).

    Но самый лучший способ избавить винт от бэдов, особенно если их много, или они не поддаются ремапу - стендовый ремонт у квалифицированного специалиста. С помощью специального оборудования и утилит можно выполнить полный ремонтный цикл, аналогичный тому, который винт проходит на заводе: правильное низкоуровневое форматирование, очистку винта от ремапов, восстановление служебной информации, и многое другое. После такого ремонта винт будет неотличим от нового, будет иметь ровный график, и что самое главное - у такого винта будет запас надежности на несколько лет вперед. Оборудование для ремонта (как правило, это - комплекс РС3000, о возможностях которого можно почитать здесь: http://www.acelab.ru/products/pc/pc3000.html), имеется почти в любом крупном сервис-центре, кроме того, многие ремонтники используют собственный уникальный софт, превосходящий PC3000 по возможностям.

    Вопреки распространенному мнению, ремап и низкоуровневое форматирование не являются универсальным средством для решения любых проблем. Если винт имеет серьезную аппаратную неисправность, то эти действия не только не вылечат пациента, но и могут причинить ему вред, добив окончательно. Например, если винт монотонно стучит головками при включении и не хочет определяться в BIOS, или срывается в стук при копировании файлов - не надо мучить его програмными средствами, они не помогут. Подобное поведение обычно связано с физическим обрывом головок, разрушенными сервометками или неисправностью контроллера. Такому винту нужно не форматирование, а ремонт у грамотного специалиста.

    7. Особенности, глюки и профилактика

    Не все винты портятся из-за неосторожного обращения с ними. Иногда причиной их глюков становятся ошибки, допущенные самими разработчиками. Некоторые из них имеют непоправимые последствия, так как способны физически испортить магнитную поверхность. Так было, например в 1996-м году с винтами Quantum ST. Из-за ошибки в микрокоде эти винты распарковывали головки чуть раньше, чем блины набирали нужную скорость. В результате головы царапали поверхность, что приводило к огромному количеству бэд-блоков и быстрому отказу накопителя. Но это происходило не при обычной работе, а только при выходе винта из спящего режима, поэтому для многих этот глюк оставался незамеченным. И только после перестановки ОС, если забывали отключить «пониженное энергопотребление», винт начинал сыпаться. Эта болезнь носила настолько массовый характер, что в народе получила название «бабушкин будильник» - из-за характерного металлического звука, который издавал винт при отбрасывании копыт. После каждого «пробуждения» винт получал новую порцию бэдов, и попытки сделать ремап помогали лишь до тех пор, пока хватало места в таблице дефектов. Поэтому, чтобы спасти оставшиеся в живых винты, фирма Quantum выпустила патч - обновление микрокода, скачать который можно здесь http://wingy.hwc.ru/firmware/quantum/ST/ST_A0F0C.ZIP. К сожалению, было уже поздно - почти все винты этой серии вымерли раньше, чем за год, но если у вас остался такой накопитель - не поленитесь и обновите ему прошивку.

    Аналогичные проблемы были у старых винчестеров Western Digital в 95-м году, но бэды у них появлялись в конце диска. Патч для них можно скачать здесь: ftp://crydee.sai.msu.ru/pub/.1/western.digital/overlay.exe

    Нередко встречается и такой глюк: винт просто перестает определяться в BIOS. Причина - ошибка программиста, писавшего firmware, в результате которой винт сам себе портит служебную зону: из-за переполнения внутренних логов ошибок происходит затирание соседних областей, без которых винт отказывается работать. Как правило, этому предшествуют какие-нибудь сбои, например, появление BAD-блоков или неудачный разгон шиной. Именно так и было с серией IBM DTLA: ошибка таилась в SMART, и если он был включен - винт подыхал. Похожие проблемы были у Seagate, Fujitsu, и многих других. Поэтому нужно следить за выходом обновлений для своего винта, и регулярно «перешивать» их. В отличие от прошивки BIOS'ов материнских плат, делать это нужно обязательно - если фирма выпустила прошивку, то это неспроста: возможно, был найден серьезный баг, устранение которого избавит от неприятностей в будущем. Прошивки для винтов лежат здесь:

    - для 60GXP: http://anders.fugmann.dhs.org/ibm/DFT-Generic-IC35ER-A46A.EXE
    - самая последняя для 60GXP http://www.gbar.dtu.dk/~c928376/ibm/DFT-Generic-IC35ER-NEW.exe
    - для ранних «дятлов»: http://www.geocities.com/dtla_update/
    - для Quantum: http://www.cm.nu/~shane/lists/comp.periphs.scsi/2001-12/0039.html
    - другие, в том числе для Barracuda-IV: http://maysoft.com.ua/firmware/index.shtml и http://wingy.hwc.ru/firmware/seagate/

    «Фирменным» глюком винтов IBM DTLA является нарушение контактов в разъемах платы, а также плохое качество пайки этих разъемов. Поэтому у винтов IBM нужно очень осторожно вставлять шлейфы, стараясь не перегибать плату. Этим вы значительно продлите жизнь своему «дятлу», и спасете его от появления софт-бэдов.

    Среди многих пользователей до сих пор распространен слух о том, что некоторые винты умирают от «неправильного» низкоуровневого форматирования, например программой, встроенной в BIOS материнских плат. Пока не удалось найти достаточных доказательств этому, однако существовала модель винта с дырой в микрокоде, способной привести к подобному эффекту. Это Fujitsu серии TAU (приблизительно 1996 год), некорректно обрабатывающий ATA-команду 50h: именно ей BIOS производит универсальное форматирование, и эта команда входит во многие программы а-ля HddSpeed. Поэтому не стоит искушать судьбу, форматируя эти винты малоизвестными утилитами или из BIOS.

    То же самое, возможно, относится и к некоторым, совсем старым винтам, емкостью 40-240 Мб. Они не имели мощных средств автозамещения дефектов, не поддавались обычному ремапу, и для их форматирования применялись специальные утилиты, которые можно найти здесь: http://oasis.secna.ru/ftp/soft/dos/harddisk/ , http://bbs.ru/cgi-bin/bbs2html?pub/msdos/diskutil

    Многие старые винты при неправильном форматировании приобретали неровный график чтения. Исправить его можно, выполнив обнуление диска в MHDD.

    Еще одна разновидность программ, которые можно применять только от производителей - переключалки режимов DMA: изменения между UDMA33/66/100 - это изменение части микрокода винта, поэтому попытка применить чужую утилиту (например переключить Quantum с помощью IBM DFT) может привести к порче прошивки, а следовательно - к глюкам с непредсказуемыми последствиями.

    Вот и все. Будем надеется, что этот материал помог вам. Но помните: любое количество bad'ов на винте - это повод для обращения по гарантии. А невозможность их убрать без ухудшения характеристик диска - повод для обмена устройства. И если вам удастся убедить в этом продавца - считайте, что скрытие BAD'ов удалось на все 100%. Только не забывайте про профилактику, и возможно, вам и не понадобится ничего скрывать.

    Автор: Сергей Казанский
    © Все права на этот материал принадлежат Sergei Kazanskij (onehalf), 2002г.

    Большое спасибо Dmitry Postrigan (maysoft) за программу MHDD и документацию к ней!
    Опубликовано в журнале UPGRADE #44 (82)http://www.computery.ru/upgrade/