Raid

RAID (Redundant Array of Independent Disks, что в переводе на русский язык означает “зеркальный массив из независимых дисков”) – это метод для объединения нескольких физических дисков в одну логическую единицу хранения данных. RAID массив предоставляет повышенную отказоустойчивость и/или повышенную производительность за счет распределения данных по различным дискам.

Термин «RAID» был предложен в 1987 году Петтерсоном (David A. Patterson), Гибсоном (Garth A. Gibson) и Катцом (Randy H. Katz) как сокращение от англ. Redundant Array of Inexpensive Disks («избыточный массив недорогих дисков»). В своей презентации они аргументировали своё изобретение относительно небольшой стоимостью массива дешёвых дисков, предназначенных для персональных компьютеров, в сравнении с дисками большой ёмкости, которые они назвали «SLED» (Single Large Expensive Drive).

Позднее расшифровка термина изменилась на Redundant Array of Independent Disks (избыточный массив независимых (самостоятельных) дисков), потому что в массивах зачастую использовались как раз очень дорогие серверные диски.

Существует несколько уровней RAID массивов, каждый из которых имеет свои особенности:
1. RAID 0 (строка) – данные разбиваются на блоки и записываются на два или более дисков одновременно, что позволяет достичь высокой скорости передачи данных. Однако, RAID 0 не обеспечивает отказоустойчивости, так как при выходе из строя одного диска теряются все данные.
2. RAID 1 (зеркало) – данные дублируются на двух или более дисках, обеспечивая отказоустойчивость. Если один из дисков выходит из строя, данные всегда остаются доступными.
3. RAID 5 – данные разбиваются на блоки и записываются на несколько дисков, включая проверочную информацию, называемую контрольной суммой. Если один из дисков выходит из строя, данные можно восстановить из контрольной суммы.
4. RAID 6 – подобен RAID 5, но использует двойную контрольную сумму. Это обеспечивает еще более высокую отказоустойчивость, так как система может восстановить данные при выходе из строя двух дисков.

5.RAID 7 — зарегистрированная торговая марка компании Storage Computer Corporation, отдельным уровнем RAID не является. Структура массива такова: на n−1 дисках хранятся данные, один диск используется для складирования блоков чётности. Запись на диски кэшируется с использованием оперативной памяти, сам массив требует обязательного UPS; в случае перебоев с питанием происходит повреждение данных.

Число 7 в названии создаёт впечатление, что система чем-то превосходит своих «младших братьев» RAID 5 и 6, но схема работы массива RAID 7 не отличается от RAID 4, а кэш и батареи используются в RAID-контроллерах любых уровней (чем дороже контроллер, тем больше вероятность наличия этих компонентов, и тем более они дорогие и качественные). Поэтому, хотя никто не отрицает, что RAID 7 обладает высокой надёжностью и скоростью работы, — это не промышленный стандарт, а скорее маркетинговый ход единственной компании-производителя таких устройств, и только эта компания осуществляет для них техническую поддержку.

6. RAID 10 (RAID 1+0) – комбинирует преимущества RAID 1 и RAID 0. Данные дублируются на нескольких дисках и одновременно разбиваются на блоки для достижения высокой скорости передачи данных.

7. RAID-Z – массив дисков, разработанный компанией Sun, и построенный на файловой системе ZFS, используемый принудительную запись содержимого кэш-памяти. Система имеет много общих черт с RAID 5, однако в ней применен динамический размер сегмента, и она лишена недостатков своего “собрата” (стандартный размер полосы).

RAID-Z не имеет фиксированный размер “страйпа”, в ней он равен размеру логического блока файловой системы. Каждая запись в массиве RAID-Z представляет собой запись полного сегмента. Благодаря присутствию в системе копирования при записи в семантике ZFS пользователь получает возможность полностью избавиться от большинства уязвимостей RAID систем.

Особенностью данного уровня является возможность быстрого восстанавления не только всего диска, но и целого блока. Еще одним немаловажным преимуществом RAID-Z является обновление данных с установкой указателя на них, что позволяет сократить риск их потери при усовершенствовании системы. Файлы малого объема дублируются, вместо создания контрольных сумм. RAID-Z превосходит по скорости обычный RAID, поскольку не производит чтение данных, меняя их, а затем снова записывая.

ZFS сверяет каждый блок с 256-битной контрольной суммой, осуществляя проход по метаданным. Обычным RAID-системам это не под силу. Таким образом, ключевой особенностю RAID-Z является возможность самостоятельного восстановления данных. RAID-Z может бороться как с полным отказом диска, так и с неявными повреждениями данных.

8. RAID 50 (также известный как RAID 5+0) – вложенный RAID, состоящий из массивов RAID 5 и RAID 0, обладающий высокой скоростью записи и загрузки данных. В отличии от RAID 0+5, который применяется достаточно редко (по причине недостаточного количества преимуществ для конкуренции с другими гибридами) RAID 50 пользуется достаточно стабильным спросом.

 

Система RAID 50 требует для функционирования, по меньшей мере, 6 дисков. По мере увеличения количества дисков RAID в сэте, производительность дисков также возрастает, что соответственно сказывается на быстроте восстановления данных, поскольку интервал (шаг) восстановления RAID увеличивается.

Несмотря на то, что, теоретически, для организации Raid массива могут быть использованы любые жёсткие диски в настоящее время употребляют, в основном  3 варианта:

  1. SCSI – в связи с стремительным устареванием данной технологии встречается всё реже;
  2. SATA – часто используется в недорогих системах;
  3. SAS – самое популярное на сегодня решение.

Одним из популярных программных решений для управления RAID массивом является LVM.

RAID массивы широко используются в серверных системах для повышения отказоустойчивости и производительности хранения данных, системах для рендеренга и т.п. Raid массив может быть частью сервера, или быть отдельным изделием, к примеру в конструктиве Евромеханика, предназначенным для монтажа в серверный шкаф. В таком случае он имеет внешние интерфейсы ISCSI и/или Fibre Channel и может быть подключен более чем к одному серверу одновременно. Или же он может быть частью SAN и/или NAS устройства. Источник бесперебойного электропитания и качественное заземление является неприменным условием эксплуатации Raid массивов, да и вообще всей техники, располагаемой в серверной.

Обсуждение закрыто.