Наши партнеры

UnixForum






Книги по Linux (с отзывами читателей)

Библиотека сайта rus-linux.net

На главную -> MyLDP -> Тематический каталог -> Аппаратное обеспечение

Логическая структура жестких дисков

Александр Дудкин

Винчестеры, как и другие магнитные накопители с прямым доступом, имеют дорожковую организацию дисковой памяти. Это означает, что поверхность магнитных дисков разбивается на концентрические кольца разного диаметра - дорожки, начиная с внешнего края. Далее структуру информации на винчестере следует рассматривать отдельно с точки зрения физической и логической структур. Чаще всего путаница возникает при сравнении параметров, относящихся к различным структурам.

Физическая структура

С физической точки зрения обе поверхности всех магнитных дисков в массиве-пакете содержат дорожки. BIOS не определяет, к какому конкретно "блину" относится та или иная дорожка, поэтому все поверхности пронумерованы единой сквозной нумерацией. Каждой рабочей поверхности соответствует своя головка, по которым, собственно говоря, поверхности и нумеруются (параметр heads). Физически максимально допустимое число головок за всю историю производства винчестеров было равно 11, но в современных накопителях более 6 головок не используется. В используемых ныне магнитных дисках число дорожек равно 80, а число дорожек жесткого диска достигает нескольких тысяч. Дорожки, как и головки, идентифицируются номером (внешняя дорожка и верхняя головка имеет нулевой номер). Количество дорожек на диске определяется поверхностной плотностью записи.

Дорожки, в свою очередь, разбиваются на сектора, являющие минимальными физическими элементами хранения и адресации данных. Чаще всего, сектора на каждой дорожке имеют фиксированный угловой размер, благодаря чему на всех дорожках располагается одинаковое количество секторов. Каждая дорожка дискеты 3,5" содержит 18 секторов. Жесткий диск имеет обычно от 17 до 63 секторов (так считает BIOS). Реально же на дорожке современного накопителя содержится около 100 секторов, а максимальное их количество равно 256. Размер сектора определен в 512 байт. Нумерация секторов на дорожке начинается с единицы, а не с нуля, в отличие от головок и цилиндров.

Каждый сектор несет не только данные, но и служебную информацию. В начале каждого сектора записывается его заголовок (prefix), по которому определяется начало и номер сектора, а в конце - заключение (suffix), в котором находится контрольная сумма (checksum, CRC), необходимая для проверки целостности данных. Заголовок сектора включает в себя идентификатор (ID) сектора, первую CRC (контрольная сумма) и интервал включения записи. Идентификатор содержит информацию о номере цилиндра, головки и сектора. Далее следует интервал включения записи, после которого следует 512 байт данных. За данными располагается вторая CRC и интервал между записями (секторами), необходимый для того, чтобы застраховать следующий сектор от записи на предыдущий. Это может произойти из-за неравномерной скорости вращения диска. Завершает сектор прединдексный интервал, который имеет размер от 693 байт, служит для компенсации неравномерности скорости вращения диска. Таким образом, размер сектора увеличивается до 571 байта, из которых 512 байт составляют данные.

Вся эта информация записывается на заводе при низкоуровневом (LowLewel) форматировании, используя специальные программные средства (например, Speed Store или Disk Manager) или команды DOS. Кроме промежутков между секторами существуют еще и промежутки между самими дорожками. Префиксы, суффиксы и промежутки как раз и составляют то пространство диска, которое теряется при форматировании.

Сектора, находящие друг над другом в пакете дисков, на которые одновременно может быть спозиционирован пакет головок, называется цилиндром. В связи с тем, что накопитель имеет несколько дисков, расположенных друг под другом, разбиения дисков идентичны. Поэтому при рассмотрении жестких дисков чаще говорят о цилиндрах, чем о дорожках.

Адресация дискового пространства в BIOS

Геометрия (ёмкостные параметры) жесткого диска описываются в BIOS следующей формулой:

Общий объем (байт) = C x H x S x 512 (байт),

где С - количество цилиндров; Н - количество головок; S - количество секторов.

Следовательно, вследствие физических ограничений накопителей, BIOS может адресовать (<увидеть>) накопитель максимальной ёмкостью 128 Гбайт:

65536 x 16 x 256 x 512 = 128 Гбайт.

Однако из-за ограничений работы контроллера винчестера и BIOS эта величина может быть существенно сокращена. Так, до 1995 года использовался стандартный CHS-режим (стандарт ATA-1), в котором физические параметры накопителя соответствовали логическим, передаваемым в BIOS. При стандартной CHS-адресации максимальное количество цилиндров равно 1024, головок - 16, что приводит к ограничению максимальной емкости жесткого диска (504 Мбайт). Кроме того, BIOS "считает", что у любого накопителя на любой дорожке должно быть ровно 63 сектора.

Современные IDE-контроллеры (начиная со стандартом SATA-2, EIDE) поддерживают универсальный режим трансляции, для которого главным параметром является общее количество секторов. В большинстве BIOS появилась функция "Autodetect", которая позволяет считывать и устанавливать паспортные параметры накопителя. При инициализации накопителю передаются два параметра: количество головок и секторов; затем накопитель подстраивает свою логическую структуру таким образом, чтобы общая емкость не изменилась, причем коррекция осуществляется за счет цилиндров.

Максимальная емкость накопителей АТА-2 значительно увеличена за счет разработки улучшенной BIOS (Enhanced BIOS), что позволило преодолеть барьер в 504 Мбайт емкости жесткого диска. Первая модификация стандарта ATA-2 с режимом передачи PIO 3 использовала режим адресации ECHS, благодаря которому в CMOS Setup была введена опция Large и ECHS. Их надо было использовать для дисков, количество цилиндров которых превышает 1024, но к которым нельзя было применить адресацию LBA. Пересчет происходил в 2 этапа: сначала контроллер считал общее количество цилиндров, затем делил его пополам и в два раза увеличивал количество головок. Этот метод позволил адресовать 3-4 Гбайт дискового пространства.

В дальнейшей модификации АТА-2 (PIO 4,5) в 1996 году появилось использование логической адресации блоков. В этом режиме все секторы нумеруются без разделения по трем категориям (цилиндр, головка, сектор), и адресуются единым 28-битным кодом. С учетом ограничений BIOS (1024 цилиндра, 256 головок, 63 сектора на дорожке при пересчете) общая емкость жесткого диска достигает 8,4 Гбайт.

В 1998 году для BIOS материнских плат выпустили обновление, способное решить проблему "8 Гигабайт". Была изменена адресация к прерыванию Int 13h (DOS), чем удалось преодолеть барьер 1024 цилиндров. Теперь для физической адресации использовались все 28 бит:

С - 16 бит (максимум 216 = 65536)

         H - 4 бита (максимум 24 = 16)

         S - 8 бит (максимум 28 = 255).

Таким образом, теперь в интерфейсе ATA-5 теоретически был доступен максимальный объем винчестеров. Но биосописатели в очередной раз ошиблись. Они не учли, что при стандартном пересчете LBA с 16-ю головками и 63-мя секторами у винчестеров объемом более 33,8 Гбайт цилиндров окажется больше 65536, и они не поместятся в 16 бит отведенные под цилиндры. Эта проблема была решена в 1999 году введением простого условия: если число секторов превышает 65536, то тогда количество секторов приравнивать к 255. Также для некоторых BIOS существовала ошибка определения винчестеров объемом больше 65 Гбайт, которая, как обычно, решалась обновлением прошивки.

В 2002 году были выпущены жесткие диски, объем которых превышает 137 Гбайт. За невозможностью использования старого алгоритма с 28-битным кодированием для протокола UltraDMA/133 была придумана 48-битная адресация секторов,  и очередной барьер возникнет не скоро.

Логическая структура

 Кроме того, что накопитель должен быть сконфигурирован в CMOS, его логическую структуру должна понимать операционная система. Для обращения к информации используется кластер (allocation unit) - минимальная логическая единица доступа к информации. Каждый кластер состоит из нескольких секторов (8 и более). Каждый кластер пронумерован и может быть либо свободен, либо монопольно занят для хранения определенного файла, даже если не все сектора внутри его заняты. Следовательно, даже файл размером несколько байт требует целого кластера. В результате, на каждом файле теряется около половины кластера. Чем больше размер кластера, тем больше потери. Использование кластеров позволяет ускорить работу, так количество кластеров существенно меньше количества секторов.

Нумерация кластеров не соответствует их порядковому расположению на дисках. При работе используется тот факт, что при записи данных используются все сектора, которые на данный момент находятся под всеми головками, таким образом, заполняется цилиндр. Прежде чем перейти к следующему цилиндру, заполняется текущий чтобы иметь возможность считывать как можно больше информации без перемещения головок.

Для DOS версии 3.0 и выше используется алгоритм следующего свободного кластера размещения файлов на диске. Кластеры устроены так, что каждый из них ссылается на последующий. При работе DOS ищет свободные кластеры не с начала диска, а с места последней записи на диск. DOS устанавливает указатель последнего записанного кластера и ищет свободные кластеры, пользуясь этим указателем. Указатель размещается в RAM и уничтожается при перезарузке. Если DOS дошла до конца диска, то указатель также удаляется, а поиск начинается с начала диска. Таким образом осуществляются операции файлами на диске.

Этот алгоритм позволяет восстанавливать удаленные файлы. При удалении файла в начало его первого кластера ставится знак "?", и все кластеры, связанные с данным считаются свободными. Указатель выставляется на следующий свободный кластер, запись продолжается в идущих далее свободных кластерах. Перезапись кластера, в котором произошло удаление, произойдет только когда указатель в новом цикле дойдет до данного кластера. Даже, если переписывается один файл поверх другого, то запись работает по такой же схеме. А для каждого нового файла используется первая свободная запись.

Файловые системы

Файловая система через использование кластеров позволяет осуществлять доступ к данным. Большинство файловых систем построено на основе таблицы размещения файлов (allocation table - FAT).   Наиболее распространены файловые системы FAT12 (диски менее 16 Мбайт), FAT16 (или просто FAT) и FAT32.

FAT подразумевает наличие следующих структур (в порядке расположения их на диске):

         Загрузочные секторы главного и дополнительного разделов

         Загрузочный сектор логического диска

         Таблицы размещения файлов (FAT)

         Корневой каталог

         Область данных

         Цилиндр диагностических операций

1.               Загрузочный сектор главного раздела - Boot Record (MBR, Главная загрузочная запись) или Partition table (PT, Таблица разделов) - является первым сектором на жестком диске (занимает один или более секторов). Но под этот раздел отдана целиком вся первая дорожка (цилиндр 0, головка 0, сектор 1). Он в себя включает Таблицу главного раздела, которая может содержать только четыре записи, так как больше не поместится в 512 байт. Корневой таблице разделов принадлежат адреса 01BEh-01FDh. Очевидно, что можно создать только 4 раздела, среди которых могут быть Первичные (Primary) и Дополнительные (Extended) разделы. Поэтому если на диске выделен Дополнительный раздел, то Первичных уже можно создать не более трех.

Первичный может иметь только один логический диск, в то время как количество логических в Дополнительном разделе не ограничено. Общее количество логических дисков (томов) не должно быть более 24 (для DOS). В первом секторе Дополнительного раздела расположена его Таблица разделов с такой же структурой как и Корневая таблица разделов. В ней описываются адреса начала и конца первого логического диска в этом разделе и его файловая система, а также зоны, занимаемой остальными логическими дисками (если они есть). Все последующие разделы в Дополнительном разделе имеют аналогичную структуру.

MBR создается с помощью стандартной программы fdisk. Правда последняя накладывает некоторые ограничения: первичный раздел может быть создан только один.

Также в Главной загрузочной записи находится главный загрузочный код - небольшая программа, которая выполняется из BIOS. Она передает управление активному (загрузочному) разделу.

2.               Загрузочная запись (Boot Record) занимает 32 первых сектора каждого логического диска (для первичного раздела - цилиндр 0, головка 1, сектор 1). Загрузочный сектор активного раздела получает управление от MBR. Он выполняет некоторые проверки и запускает с диска первый системный файл io.sys. Формирует загрузочная запись программой format. Напомню, что только Первичный раздел может быть активным. Загрузочная запись, как Корневая таблица разделов должны заканчиваться сигнатурой 55АА. По этой сигнатуре BIOS определяет, успешной ли была загрузка.

3.               Таблица размещения файлов (FAT) - основная часть файловой системы, давшая ей название. Она представляет собой набор записей с номерами, соответствующих номерам всех кластеров на логическом диске. Каждому кластеру соответствует одно число. Для каждого кластера запись может иметь несколько стандартных значений: кластер свободен, кластер поврежден или кластер является последним кластером файла, или содержать ссылку на следующий кластер в цепочке, относящийся к тому же файлу. Получается, что в таблице хранится информация только о первом кластере цепочки кластеров одного файла.

Каждая ячейка FAT хранит значение длиной 12, 16 или 32 бита. Отсюда и пошли названия FAT12, FAT16 и FAT32. Размер записей в таблице FAT определяет максимальный размер логического тома. Так как в FAT16 запись представлялась 2-байтовым числом, то на логическом диске не могло быть более 65536 кластеров: 216 = 65536. В результате несложных вычислений мы находим, что вся таблица FAT помещается в 1 Мбайте. Этим и пользовались вирусы типа "Чернобыль". В связи этим FAT, начиная с DOS 4.0 ограничивала объем логического диска в 2 Гбайта (размер кластера составлял 32 Кбайта): 32 Кб х 65536 = 2 Гб.

Операционные системы Windows 95 OSR2 и старшие поддерживают 32-разрядную FAT с размером кластера до 64 Кбайт. Таким образом, эта система поддерживает тома размером до 2 Тбайт. А применяется она в дисках объемом от 512 Мбайт.

Всего в каждом логическом диске существует 2 таблицы FAT, которые следуют друг за другом. При порче первого экземпляра, используется второй, путем корректировки первого. Но у этой системы защиты есть свои недостатки. Во-первых, вторая таблица используется только когда первая полностью испорчена. Во-вторых, вторая копия часто обновляется за счет первой, так что во второй также могут содержаться ошибки.

В зависимости от размера логического диска меняется и размер кластера. Для FAT16 тома до 260 Мбайт используют кластеры размером 2 Кбайта, до 8 Гбайт - 32 Кбайта. Размеры кластеров и записей определяются при форматировании высоко уровня. Для FAT32 зависимость размера кластера от размера тома приведена в таблице.


Размер тома

Размер кластера

Размер записи FAT

Кол-во секторов на 1 кластер

< 260 Мбайт

512 Кбайт

512 байт

 

260 Мб - 8 Гб

4 Кбайта

4 байта

8

8 - 16 Гбайт

8 Кбайта

8 байт

16

16 - 32 Гбайт

16 Кбайт

16 байт

32

> 32 Гбайт

32 Кбайта

32 байта

64

4. Корневой каталог (Root directory). Так как размеры таблицы FAT не постоянны, то Корневой каталог не имеет четко закрепленного места, но следует сразу за второй таблицей FAT. Размеры этого каталога четко фиксированы, поэтому существует ограничение на количество папок и файлов в корне диска. Под корневой каталог обычно отводится 32 сектора, именно поэтому корневой каталог ограничен 512 записями. Подкаталог может хранить произвольное количество записей.

Каждая запись в том каталоге имеет размер 32 байта. В записи содержится информация практически вся информация о файле, которой располагает DOS: имя, атрибуты, время и дата создания и размер на диске. Эта информация связана с FAT посредством одного из полей записи - номера первого занимаемого файлом кластера на диске.

Чтобы отследить расположение файла, надо обратиться к каталогу и выяснить номер его первого сектора и длину файла, затем найти в FAT этот кластер и проследить цепочку кластеров до конца файла.

5.              И последним разделом, о котором мало кто знает, является цилиндр диагностики. Это последний цилиндр диска, операционная система и FAT его не видят. Он отделяется программой fdisk при создании разделов. Используется этот цилиндр для форматирования низкого уровня и тестирования данных винчестера.

Форматирование

Итак, теперь мы можем определиться, что же на самом деле происходит при форматировании. В процессе низкоуровневого форматирования (заводского или специальными утилитами) дорожки разбиваются на сектора, формируется межсекторное пространство, записываются префиксы и суффиксы секторов. Во всех современных накопителях применяется зонная запись, при которой количество секторов на дорожке является переменным. Дорожки, более удаленные от центра, а значит, и более длинные, содержат большее количество секторов, и наоборот. Однако, BIOS "думает", что секторов на любой дорожке 63, преобразование осуществляется контроллером винчестера. При зонной записи цилиндры разбиваются на группы, которые называются зонами, причем в каждой зоне на дорожках свое количество секторов. Зон бывает 10 и более.

При форматировании высокого уровня в тома заносится загрузочный сектор тома (VBS - volume Boot Sector), записываются или переписываются таблицы FAT и корневой каталог. Как видно, данные не удаляются, всего лишь переписываются загрузочные данные для работы с операционной системой, и теряется их описание и каталог.

Установка нескольких ОС на один винчестер

Операционные системы, использующие файловые системы FAT и NTFS должны устанавливаться в Первичные разделы. При установке таких системы не будут видеть другие Первичные разделы, в которые установлены другие ОС. Общими для всех операционных систем будут логические диски, находящиеся в дополнительном разделе. Стоит отметить, что файловая система NTFS позволяет видеть диски FAT, но не наоборот. NTFS из DOS не виден. Кроме того, NTFS позволяет более рационально использовать дисковое пространство.

Чтобы загрузиться с того или иного Первичного раздела, надо последний назначить активным (active), в то время как остальные будут незагрузочными (hidden). Флаг активного раздела выставляется в MBR в одной из 4 записей. Чтобы каждый раз не переназначать активные разделы при загрузке можно использовать программы-мультизагрузчики, которые модифицируют MBR, и при загрузке им передается управление, которое позволяет пользователю выбрать с какого раздела загружаться. Среди таких программ стоит отметить System Commander, SyMon и программу BootMagic из пакета Partition Magic. Последний еще и предлагает поставить пароли на загрузку тех или иных разделов. Linux, Windows 2000 и XP имеют встроенный загрузчик, которые, впрочем, не очень удобны.

Вот теперь, похоже, мы разобрались со всеми аспектами размещения информации на винчестерах и можем перейти к параметрам жестких дисков, по которым следует выбирать то или иное устройство, но об этом в следующем номере: