Восстановление данных и ремонт жестких дисков (HDD)
TestLine.ru || Лаборатория восстановления данных
      Меню:
      Статьи по теме, полезная информация
    Главная страница
    О компании
    Восстановление с HDD
    Восстановление с Flash
    Восстановление RAID
    Акции
    Статистика поломок
    Статьи по теме
    Программы, утилиты
    Задать вопрос
    Наши скидки
    Наши партнеры
    Контактная информация
Уважаемые клиенты, для проверки состояния ремонта Вашего оборудования введите номер заказа, указанного в акте сдачи-приемки оборудования.
 

 
 
  Лаборатория восстановления данных

"Горькие воспоминания о плохом качестве сохраняются гораздо дольше, чем кратковременная радость от низкой цены..."
 
Если у Вас пропали важные данные в результате неосторожного обращения, действия вирусов или же поломки носителя - доверьте процесс восстановления профессионалам. Мы вернем Вам данные и спокойствие!
 
 
  Сохранность и восстановление компьютерных данных: теория и практика

Почему пропадают данные

Хотя надежность современных компьютерных систем в целом достаточно высока, время от времени в них происходят сбои, вызванные неисправностью аппаратных средств, ошибками в программном обеспечении, компьютерными вирусами, а также ошибками пользователей, системных администраторов и технического персонала. 

Анализируя причины возникновения встречавшихся в нашей практике аварийных ситуаций, приводивших к потере данных, можно сказать, что все перечисленные сбои случаются примерно с одинаковой вероятностью. 

Отказы аппаратных средств

Исчезновение данных может быть вызвано отказом различных устройств - жестких дисков и дисковых контроллеров, соединительных кабелей, оперативной памяти или центрального процессора компьютера. Внезапное отключение электропитания при отсутствии источника бесперебойного питания - также одна из наиболее распространенных причин исчезновения данных. В зависимости от того, что происходило в компьютере на момент отказа, последствия могут оказаться более или менее тяжелыми. 

Отказы дисковых контроллеров

Чаще всего нам встречались случаи потерь данных при отказах дисковых контроллеров. При этом в момент аварии контроллер выполнял операцию записи, которая завершалась с ошибками. Как следствие, оказывались разрушенными системные области диска, после чего все данные или часть их становились недоступны. 

Заметим, что дисковые контроллеры современных файловых серверов, таких, как Compaq Proliant, протоколируют сбои аппаратных средств и позволяют выполнять диагностику. Это дает возможность обнаружить опасные симптомы еще до того, как они приведут к отказу. Например, в одной компании на протяжении нескольких недель контроллер диска записывал в системный журнал сообщения о возможном отказе кэш-памяти, встроенной в контроллер. И когда эта память, наконец, отказала, пропало несколько гигабайт важных данных. 

Зеркальные диски

Наиболее простой способ увеличения надежности хранения данных - подключить к одному контроллеру два жестких диска и средствами ОС выполнить их зеркальное отображение. При этом один диск играет роль основного, а другой дублирует всю информацию, записываемую на основной диск. При выходе из строя основного диска его функции автоматически переходят к зеркальному диску, в результате чего система продолжает работать без аварийной остановки. 

К сожалению, зеркальные диски не помогут при сбое контроллера или ПО. Фактически данная технология поможет вам застраховаться только от такой неприятности, как поломка одного жесткого диска из зеркальной пары. 

Если каждый из зеркальных дисков будет подключен к своему контроллеру, то надежность возрастет. Теперь система продолжит работу при выходе из строя не только одного диска, но и одного дискового контроллера. 

Такие ОС, как Microsoft Windows NT и Novell NetWare способны создавать зеркальные диски программным путем без применения дополнительного оборудования. 

Отказы кэш-памяти

Как вы, вероятно, знаете, кэш-память значительно ускоряет операции записи данных на диск и чтения с диска за счет временного хранения данных в очень быстрой оперативной памяти. Если данные кэшируются при чтении, то отказ кэш-памяти не приведет к их потере, так как на диске они останутся в неизменном виде. Что же касается кэширования при записи, то эта операция несет в себе потенциальную опасность. 

Кэширование при записи предполагает, что данные вначале записываются в оперативную память, а затем, когда для этого возникает подходящий случай, переписываются на жесткий диск. Программа, сохраняющая данные на диске, получает подтверждение окончания процесса записи, когда данные оказываются в кэш-памяти. При этом фактическая запись их на диск произойдет позже. Так вот, если отказ кэш-памяти случится в "неподходящий" момент, то программа (или ОС) будет полагать, что данные уже записаны на диск, хотя фактически это не так. В результате могут оказаться разрушенными важнейшие внутренние структуры файловой системы. 

Операционные системы обычно выполняют дополнительное кэширование данных, записываемых на диск или считываемых с диска, в основной оперативной памяти компьютера. Поэтому отказы оперативной памяти, а также внезапное отключение электропитания могут привести (и обычно приводят!) к возникновению фатальных неисправностей файловой системы. Именно поэтому так важно снабжать компьютеры, и особенно серверы, устройствами бесперебойного питания. Кроме того, такие устройства должны быть в состоянии корректно завершать работу ОС компьютера без вмешательства человека. Только в этом случае отключения электропитания не приведут к потере данных. 

Неисправности электроники в дисках

Несколько слов заслуживают неисправности, возникающие в самих дисковых устройствах. Помимо механических повреждений, вызванных небрежным обращением с дисками, возникают отказы электронных схем, расположенных как вне, так и внутри герметичного корпуса диска. Отказы таких электронных схем могут привести, а могут и не привести к потере данных. В нашей практике встречались случаи, когда после замены электроники удавалось полностью восстановить данные, переписав их на другой диск. 

Замена контроллера диска

Иногда данные пропадают после замены дискового контроллера на контроллер другого типа (такая проблема обычно возникает с контроллерами SCSI). Операционная система в этих случаях просто отказывается монтировать диск. Выбрав правильный тип контроллера, обычно удается легко ликвидировать данную проблему, однако так бывает не всегда. 

Проблемы с контроллерами дисковых массивов RAID

Особо стоит отметить контроллеры дисковых массивов RAID. Существуют RAID-массивы нескольких типов (их организация описана во врезке). Отметим, что RAID-массивы позволяют увеличить надежность хранения данных, скорость чтения и записи за счет добавления избыточности. 

В простейшем случае RAID-массив может состоять из двух дисков, дублирующих всю сохраняемую информацию. При выходе из строя одного диска данные сохранятся на другом. Другие типы массивов (например, RAID5) хранят контрольные суммы данных и, кроме того, распределяют отдельные блоки файлов по нескольким дискам, используя для этого довольно сложный алгоритм. Цель одна - предотвратить потери данных при возникновении сбоя в одном физическом диске массива. 

Несмотря на повышенную надежность, обеспечиваемую RAID-массивами по сравнению с обычными дисками, такие массивы все же не могут гарантировать полную безопасность данных. Во-первых, может выйти из строя контроллер массива RAID, в результате чего данные будут записываться на диск с ошибками, а во-вторых, могут отказать сразу (или поочередно) два диска. Вторая ситуация маловероятна, но первая нам встречалась. 

Кроме того, контроллеры RAID никак не защитят Ваши данные от ошибок в программах и операционных системах, от нападения компьютерных вирусов, ошибок пользователей или системных администраторов. 

Дисковые массивы RAID

В критически важных случаях для увеличения надежности хранения информации обычно используют так называемые массивы дисковых накопителей RAID (Redundant Arrays of Inexpensive Disks - массивы недорогих дисков с избыточностью). 

RAID-массивы состоят из нескольких жестких дисков, подключенных к одному интеллектуальному контроллеру. Контроллер может реализовать один из нескольких алгоритмов хранения данных, предполагающих увеличение надежности за счет введения избыточности. При этом выход из строя одного или двух дисков (в зависимости от алгоритма) не приведет к нарушению общей работоспособности массива. 

Существует несколько категорий массивов RAID, обозначаемых как RAID 0, RAID 1, RAID 2, RAID 3, RAID 4 и RAID 5. Все они используют различную технику повышения надежности. 

В массивах RAID любой категории надежность достигается за счет чередования (striping) - разделения данных одного и того же файла сразу на несколько дисков. Помимо повышения надежности, такое разделение приводит к увеличению скорости считывания файла, так как его фрагменты могут считываться одновременно с разных дисков. 

Хотя ОС Microsoft Windows NT может создавать массивы RAID 0, RAID 1 и RAID 5 программным путем, целесообразно применять для этого специальные дисковые контроллеры, называемые RAID-контроллерами. При этом достигается максимальная гибкость и производительность, а также обеспечивается дополнительный контроль целостности данных. 

Массив RAID 0
В массивах RAID 0 применяется простейшая техника чередования данных, при которой для записи файла последовательно используются дорожки с одинаковыми номерами, но расположенные на разных дисках. В массиве RAID 0 можно объединять два или более диска. 

В массивах RAID 0 данные записываются без избыточности, поэтому повышения надежности не происходит . Тем не менее, такие массивы увеличивают скорость доступа к информации за счет того, что операции записи и чтения различных фрагментов файлов выполняются одновременно. 

Массив RAID 1
В массивах RAID 1, которые должны содержать не менее двух дисков, применяется дублирование информации на зеркальных дисках. При этом контроллер может распараллеливать операции чтения, что повышает скорость выполнения этой операции. 

Увеличение надежности хранения данных достигается за счет двойных затрат дисковой памяти. 

Массив RAID 2
Массивы RAID 2 предлагают дополнительное увеличение надежности хранения информации за счет использования техники исправления ошибок с помощью кодов коррекции ECC (Error Correction Code). Часть накопителей дискового массива используется для хранения кодов коррекции. Если в одном из накопителей возникает сбой, информация восстанавливается по кодам коррекции. 

Массив RAID 3
В этих массивах один из дисков применяется для хранения контрольных сумм. На него записывается сумма данных по модулю 2, вычисленная с применением логической операции XOR. Массивы RAID 3 должны содержать не менее трех дисков. 

Массив RAID 4
Массив устроен и работает аналогично массиву RAID 3, однако в отличие от него не способен выполнять одновременные операции чтения и записи над несколькими дисками сразу. 

Массив RAID 5
Массивы RAID 5 используются чаще всего. При относительно небольших затратах они обеспечивают высокую надежность хранения данных, а также способны выполнять операции записи и считывания одновременно на разные диски. Это достигается применением техники чередования данных не только для записи файлов, но и для записи контрольных сумм. 

Массив RAID 5 должен содержать не менее трех дисков, причем выход из строя одного диска не сказывается на общей работоспособности системы. Однако одновременная поломка двух или более дисков приводит к необратимым разрушениям данных.

Сбои, возникающие из-за пыли

Несмотря на то что корпуса современных серверов специальным образом защищены от проникновения пыли (для этого на вентиляторы устанавливают специальные воздушные фильтры), пыль все же проникает в компьютер. Она оседает на системной плате, конструктивных элементах корпуса и контроллерах. Так как в пыли есть металлические частички, она может вызывать замыкания между соединительными линиями, расположенными на системной плате или на платах контроллеров. 

Когда компьютер переносят с одного места на другое, комочки пыли перекатываются внутри корпуса и могут привести к замыканию. Именно так пропали данные на сервере у одного из наших клиентов после перестановки сервера из одной стойки в другую. 

Чтобы уменьшить вероятность возникновения сбоев из-за пыли, используйте в ответственных случаях специальные пылезащищенные корпуса и периодически выполняйте профилактические работы, удаляя пыль при помощи специального "компьютерного" пылесоса. 

Ошибки в программном обеспечении

Известно, что практически во всех более или менее сложных программах (а также в ОС, представляющих собой комплекс многих программ) имеются ошибки. Причина этого очевидна - программы составляют люди, а людям свойственно ошибаться. Поэтому бесполезно искать программы без ошибок. Но можно найти такие программы, в которых ошибки не сказываются или оказываются некритичными для использования этих программ по назначению. 

С точки зрения безопасности данных наиболее опасны ошибки в ОС, в драйверах, а также такие ошибки, которые могут привести к полному "зависанию" компьютера и потере данных, хранящихся в кэш-памяти. Так как в ОС Microsoft Windows драйверы (дисковые, видеоадаптера и др.) работают в привилегированном кольце защиты, сбой в драйвере может повредить всю операционную систему. 

Чтобы уменьшить вероятность возникновения потерь данных в результате программных ошибок, мы рекомендуем устанавливать самые свежие пакеты исправлений ОС и самые свежие драйверы, полученные непосредственно от производителей оборудования. 

Приобретая компьютер для ответственных приложений, обязательно проверьте список оборудования, совместимого с вашей ОС. Если выбранное оборудование не входит в этот список, ОС, возможно, не будет с ним работать или (что хуже) будет работать с ошибками. В результате в самый неподходящий момент компьютер может "зависнуть", а данные - исчезнуть. 

Компьютерные вирусы

О том, что компьютерные вирусы повреждают данные, знают практически все. Однако, к сожалению, не все выполняют даже элементарные требования, значительно уменьшающие вероятность вирусного заражения. 

При организации антивирусной защиты прежде всего необходимо определить возможные пути проникновения вирусов: дискеты, компакт-диски, электронная почта, серверы Web и др. Далее, исходя из этого анализа, следует подобрать наиболее подходящее антивирусное ПО, установив его на каждый компьютер вашей сети. При этом необходимо строго соблюдать рекомендации, приведенные в описании выбранного антивируса. Малейшее отклонение - и все усилия по антивирусной защите могут быть сведены к нулю. 

Необходимо также периодически обновлять антивирусную базу данных вашей программы, причем в сети это нужно делать на всех серверах и всех рабочих станциях. Антивирусная база данных содержит описание признаков, по которым антивирусная программа ищет вредоносные модули. Так как каждый день в мире появляются десятки новых вирусов, задача периодического обновления антивирусной базы данных представляется нам весьма актуальной. 

Современные антивирусные программы "умеют" обновлять антивирусную программу через Интернет или интрасеть. Такая возможность особенно важна в крупных сетях, состоящих из сотен серверов и тысяч рабочих станций, когда обновление вручную превращается в невыполнимую задачу. 

Ошибки пользователей и системных администраторов

Как мы уже говорили, человеку свойственно ошибаться. Разумеется, это касается не только программистов, оставляющих ошибки в своих программах, но и пользователей и системных администраторов. 

Случайное удаление файлов или каталогов

Наиболее распространенная ошибка пользователя - случайное удаление файла или папки с файлами. Одно неверное движение мыши - и дело сделано. Бывает, что даже опытные системные администраторы совершают такую ошибку. 

Застраховаться от случайного удаления файла или каталога, расположенного на локальном диске рабочей станции, позволяет обычная "мусорная корзина" (Recycle Bin) ОС Microsoft Windows. Можно дополнительно установить одну из продвинутых версий корзины, например, Norton Protected Recycle Bin. В большинстве случаев удаленные файлы оказываются в этой корзине, откуда их легко восстановить. Тем не менее, ряд программ игнорируют корзину, удаляя файлы без возможности восстановления. 

Сходная проблема возникает и в том случае, если пользователь случайно удалил файл или папку в сетевом каталоге, расположенном на дисках сервера. При этом мусорная корзина, установленная на рабочей станции, никак не поможет в восстановлении файлов, удаленных из сетевых каталогов. 

Тем не менее, даже если удаленный файл отсутствует в корзине или корзина была по ошибке опорожнена, ситуацию еще можно исправить, если после стирания не добавлять на диск новые файлы. Для восстановления файлов можно использовать специальные утилиты, например, EraseUndo for NTFS (созданную одним из авторов этой статьи для восстановления файлов, удаленных из разделов файловой системы NTFS) или Easy Recovery, способную восстанавливать файлы и в разделах FAT16/FAT32. 

Ошибки в технологии резервного копирования данных 
Без преувеличения можно сказать, что единственный по настоящему надежный способ обеспечения сохранности данных - это их периодическое резервное копирование на сменные носители, такие как магнитные ленты, магнитооптические диски, диски CD-R и т.д. 

Почему единственный? Потому, что на сегодняшний день и аппаратное, и программное обеспечение компьютерных систем ненадежно. Пользователи и системные администраторы тоже ненадежны, так как могут ошибаться. Если же у Вас есть актуальная резервная копия данных, то с нее данные можно быстро восстановить. 

Почему необходимо выполнять копирование на сменные носители данных? Причина этого в том, что, только вынув носитель данных из компьютера и убрав его в надежное место, Вы можете быть уверены, что "сошедшая с ума" ОС, вирус, а также кто-то из пользователей или системных администраторов не испортит записанные на нем данные. 

Некоторые недальновидные пользователи и системные администраторы копируют файлы в другой раздел того же самого жесткого диска, на котором хранятся их актуальные экземпляры, или на другой физический диск. Хотя копирование данных на другой диск и может помочь, если исходный станет неисправным, от ошибок в ОС, программах или от нашествия компьютерных вирусов такие меры не спасут. 

Очень важно правильно выбрать периодичность резервного копирования. При этом надо исходить из периодичности обновления информации на дисках, а также из необходимой степени надежности. Если данные обновляются часто, можно выполнять копирование, например, каждый день на новые носители с циклом от 3 до 7 дней. Кроме того, дополнительно можно делать (и хранить отдельно) недельные и месячные копии. На все это может потребоваться довольно много магнитных лент, однако затраты не будут напрасными. Обладая таким многодневным архивом, вы сможете при необходимости поднять любую версию файлов, если окажется, что актуальная копия оказалась уничтоженной несколько дней назад. 

Если к сохранности данных предъявляются повышенные требования, имеет смысл установить для копирования сразу два стримера и копировать одновременно на две магнитные ленты. Если одна из лент не прочитается, у вас останется другая. 

Хотя для выполнения резервного копирования в простейших случаях можно использовать встроенные средства ОС, например, Windows NT Backup, лучше установить одну из серьезных систем резервного копирования, такую как ArcServe. В этом случае на один стример можно выгрузить данные со всех серверов и рабочих станций сети, а также выбрать нужный вам график выполнения копирования. 

Чтобы быть уверенным в том, что резервное копирование действительно завершилось без ошибок, необходимо внимательно просмотреть журнал программы, выполняющей копирование. Если речь идет о крупной сети или об архивировании важных данных, то такую операцию необходимо выполнять каждый день, например, утром. 

Обязательно попробуйте восстановить сделанную резервную копию, желательно на другой диск или другой сервер. А лучше всего проделывать операцию пробного восстановления на регулярной основе. 

Многим системным администраторам наши советы по резервному копированию могут показаться банальными, однако в большинстве случаев потери данных связаны именно с тем, что резервное копирование либо не выполнялось совсем, либо выполнялось неправильно. 

Известны случаи, когда руководители компаний пытались сэкономить несколько тысяч долларов на покупке качественного стримера и ПО к нему и при этом теряли сопоставимые суммы на восстановлении разрушенных данных. Что характерно, после первого же случая такие руководители покупали стример. Вот уж воистину - скупой платит дважды. 

В том случае, когда покупка дорогостоящего стримера вам абсолютно не по карману, рассмотрите возможность архивирования данных на таких устройствах, как ZIP, магнитооптические диски, диски CD-R, CD-RW, и, в крайнем случае, на обычных дискетах.

Автор: Александр Фролов, Григорий Фролов


Единая диспетчерская 8 (495) 664-41-44
 
Адрес лаборатории: Москва, 5-й Монетчиковский пер., д.20с1. Время работы с 9:00 до 19:00 без выходных.

:: Главная страница :: Контакты ::  


Copyright © Восстановление данных    
Дизайн и сопровождение: ГОСТЛАБ  

Rambler's Top100