RAID-массивы для NAS: руководство по выбору уровня защиты данных

Россия+7 (910) 990-43-11
Обновлено: 2025-07-04

Вне зависимости от того, хотите ли вы защитить свой бизнес от потери данных или оптимизировать производительность, выбор правильного уровня RAID для вашего сетевого хранилища (NAS) имеет большое значение для безопасности данных и эффективности работы.

Вопрос, который вдохновил меня на написание этой статьи, звучит так: какой уровень RAID следует выбрать для вашего NAS, если вы хотите иметь два диска вместо одного? На первый взгляд, ответ кажется очевидным, но я решил, что стоит немного подробнее рассмотреть этот вопрос.

В этой статье я расскажу вам всё, что нужно знать о выборе правильного уровня RAID для ваших нужд. Мы рассмотрим преимущества и недостатки различных уровней RAID, а также обсудим их применение в различных сценариях.

Освежим в памяти: что такое NAS и что такое RAID

NAS – это сетевое хранилище, которое представляет собой отличное решение для организаций и пользователей, которым требуется общий доступ к большим объёмам информации. NAS обеспечивает экономичное централизованное хранилище, к которому могут одновременно обращаться несколько пользователей из разных мест.

Как работает сервер NAS в домашней сети

Однако, по мере увеличения объёма данных, хранящихся на устройствах NAS, возрастает и риск потери информации. В этом случае на помощь приходят уровни RAID. RAID расшифровывается как «избыточный массив независимых дисков» или «недорогих дисков» – в зависимости от того, у кого вы спрашиваете.

Пользователям NAS крайне важно понимать различные уровни RAID, чтобы они могли эффективно защищать данные и обеспечивать оптимальную производительность своей системы NAS.

NAS и RAID – это дисковые массивы, которые представляют собой набор из нескольких жёстких дисков (HDD) и/или твердотельных накопителей (SSD), предназначенных для хранения больших объёмов информации. Основное различие между ними заключается в том, что NAS работает в сети, а RAID – это стратегия хранения данных, которая позволяет объединять несколько дисков в единую систему.

Это позволяет пользователям NAS легко настраивать уровни RAID, сочетая преимущества RAID и удобство сетевых возможностей NAS. Такая комбинация позволяет пользователям выбирать типы RAID, которые соответствуют их потребностям, будь то избыточность данных, повышение производительности записи или баланс между ними.

При правильной настройке устройство NAS с RAID обеспечивает гибкость и улучшенную защиту данных.

Что такое RAID-хранилище

В конце 1980-х годов исследователи из Калифорнийского университета в Беркли впервые представили концепцию RAID. В статье «Дело в пользу избыточных массивов недорогих дисков (RAID)» Дэвид Паттерсон, Гарт А. Гибсон и Рэнди Кац описали идею объединения нескольких небольших дисков в один массив для повышения производительности и надёжности хранения данных.

Учёные утверждали, что даже самые производительные дисковые накопители для мейнфреймов того времени не могли сравниться по скорости с массивом недорогих накопителей. С тех пор технология RAID стала широко применяться в сфере хранения данных, и с течением времени появилось множество различных уровней RAID.

Сегодня RAID-хранилища используются в самых разных системах, от устройств NAS до корпоративных центров обработки данных. Они предлагают различные конфигурации, которые обеспечивают баланс между скоростью записи, защитой данных и отказоустойчивостью.

Такая гибкость делает RAID важной частью архитектуры хранения, помогая компаниям и частным лицам эффективно хранить и защищать свои данные.

Различные типы технологий хранения RAID

Прежде чем мы углубимся в изучение различных уровней RAID, необходимо понять, как они работают. Для этого нужно разобраться в методах хранения данных, которые используются в RAID.

Существует три основных метода хранения данных в RAID: чередование, дублирование и паритет. В зависимости от уровня RAID эти методы комбинируются по-разному, чтобы обеспечить баланс между производительностью, избыточностью и эффективностью хранения данных.

Метод чередования в системе RAID

В процессе чередования данные распределяются по нескольким дискам. Если вы используете сетевое хранилище NAS, то блоки, из которых состоят ваши файлы, будут записаны на доступные жёсткие диски одновременно. Это позволяет создать один большой диск, который обеспечивает более быстрый доступ для чтения и записи, поскольку данные могут храниться и извлекаться с нескольких дисков одновременно.

Однако, чередование не гарантирует избыточности и обычно применяется в системах, где производительность важнее, чем сохранность данных. Если один диск в массиве хранения выйдет из строя, все данные на устройстве могут быть утеряны.

Чередование часто используется вместе с другими методами, которые мы рассмотрим далее.

Изображение, описывающее метод чередования дисков в системах RAID
Изображение, описывающее метод чередования в системах RAID, где данные хранятся в разных частях на жестких дисках, но данные на дисках не перекрываются

Зеркальное отображение [дублирование] в системе RAID

Как следует из названия, процесс зеркалирования создаёт точную копию ваших данных. Информация записывается одновременно на два носителя, обеспечивая тем самым избыточность за счёт наличия двух идентичных копий данных. Даже если один из носителей выйдет из строя, доступ к данным всё равно будет возможен с другого носителя.

Кроме того, зеркалирование позволяет повысить производительность при чтении данных – вы можете запрашивать блоки одновременно с двух носителей (например, блок 1 с одного жёсткого диска и блок 2 с другого). Однако, у этого метода есть и недостаток: для хранения такого же объёма данных потребуется в два раза больше носителей.

Зеркалирование обычно используется в уровнях RAID, таких как RAID 1 и RAID 10.

Изображение, демонстрирующее схемы зеркалирования в системах RAID
Изображение, демонстрирующее схемы зеркалирования, где каждый из кластеров данных абсолютно одинаков на обоих дисках

Паритет [чётность] в системе RAID

Паритет – это процесс выявления и устранения ошибок. Система генерирует специальный код (ECC), который используется для исправления ошибок, и сохраняет его вместе с данными на диске. Этот код позволяет контроллеру RAID обнаруживать и исправлять ошибки, которые могут возникнуть при передаче или хранении данных, что снижает риск повреждения или потери данных из-за отказа диска.

Если диск выходит из строя, вы можете установить новый диск, и система NAS восстановит ваши файлы на основе ранее созданного ECC.

Паритет часто используется в RAID 5 и RAID 6, причём в последнем используется двойная чётность, то есть хранятся два набора данных для дополнительной защиты.

Изображение, показывающее схемы четности с тремя дисками в системе RAID
Изображение, показывающее схемы четности с тремя дисками в системе RAID. Каждый диск имеет различные наборы данных, а также два блока четности

Что такое отказоустойчивость RAID

Помимо различных способов организации RAID-массивов, при выборе уровня RAID необходимо также учитывать его отказоустойчивость.

Отказоустойчивость RAID – это способность системы продолжать работу даже при отказе одного или нескольких жёстких дисков.

Другими словами, отказоустойчивость показывает, сколько дисков вы можете потерять в массиве RAID и при этом продолжать работать с данными или восстанавливать их.

Разные уровни RAID обеспечивают разную степень отказоустойчивости и избыточности. Важно понимать, как соотносятся ёмкость хранилища, производительность и стоимость. Об этом мы поговорим позже.

Каковы различные уровни RAID

Уровни RAID были стандартизированы Ассоциацией производителей сетевых устройств хранения данных (SNIA). Каждому уровню присвоен номер, который отражает его влияние на хранение данных и избыточность.

С течением времени уровни RAID развивались, но сегодня основными являются следующие: RAID 0, RAID 1, RAID 5, RAID 6 и RAID 10. Кроме того, существуют конфигурации дисков без RAID, такие как JBOD, о которых мы расскажем подробнее.

Теперь, когда вы знакомы с основами RAID-хранилища, давайте рассмотрим различные конфигурации уровней RAID для устройств NAS. Мы обсудим их преимущества, варианты использования и уровень отказоустойчивости.

JBOD: простая организация, данные записываются на все диски

JBOD, также известный как «Just a Bunch of Disks» или «Just a Bunch of Drives», представляет собой конфигурацию хранилища, в которой несколько дисков объединены в один логический том. В JBOD данные записываются последовательно на все диски без применения технологий RAID.

Такой подход позволяет гибко и эффективно использовать хранилище, но не обеспечивает избыточности данных или отказоустойчивости.

JBOD не предусматривает избыточности данных и не обеспечивает отказоустойчивости. С другой стороны, это наиболее простая схема хранения, и все диски доступны для использования. Однако, в отличие от других конфигураций, в JBOD нет улучшений производительности.

Изображение несколько дисков с разными данными объединенных по принципу JBOD

RAID 0: чередование, данные равномерно распределены по всем дискам

RAID 0, также известный как «чередующийся том» или «набор полос», распределяет данные по всем дискам равномерно. Это позволяет быстрее записывать и считывать информацию.

Однако, RAID 0 не обеспечивает избыточности или отказоустойчивости. Если один диск выйдет из строя, то весь массив перестанет работать, и данные будут потеряны.

RAID 0 – это простой и недорогой способ увеличить скорость чтения и записи. Но, при этом нет избыточности данных, и существует риск их потери.

RAID 0 обычно используется в ситуациях, когда скорость важнее безопасности данных. Например, при редактировании видео или временном хранении некритичных файлов.

RAID 0 – данные равномерно распределены по двум дискам
Диаграмма, показывающая данные, совместно используемые на двух дисках, при этом данные, совместно используемые на обоих дисках, не пересекаются

Математика RAID 0

Мы можем провести быстрый расчёт, чтобы наглядно показать, как RAID 0, на самом деле, увеличивает риск потери данных.

Для простоты расчётов предположим, что годовой уровень отказов (AFR) составляет 1%. Это означает, что из 100 дисков, выбранных случайным образом, один выйдет из строя в течение года, то есть вероятность отказа конкретного диска в течение года составляет 0,01.

Теперь вероятность отказа всего RAID-массива – его AFR – это вероятность отказа любого из дисков. Чтобы рассчитать это, нужно учесть, что вероятность того, что массив будет работать в течение года, – это произведение вероятностей того, что каждый диск будет работать в течение года.

Примечание: все результаты в этой статье округлены до двух знаков после запятой.

Умножьте вероятность отказа одного диска на количество имеющихся у вас дисков. В этом примере их два.

0,99×0,99 = 0,98

Вычтите этот результат из единицы, чтобы получить процент.

Таким образом, AFR равен:

1 − 0,98 = 0,02 или 2%

Следовательно, вероятность отказа RAID-массива из двух дисков в два раза выше, чем у массива с одним диском.

Для более крупных массивов риск возрастает экспоненциально с увеличением количества дисков, что делает RAID 0 непригодным для хранения критически важных или долгосрочного хранения данных.

RAID 1: зеркалирование, точная копия данных на двух или более дисках

Технология RAID 1 предусматривает создание точной копии набора данных на двух или более дисках. Это позволяет обеспечить защиту данных от возможных сбоев.

Процесс записи данных происходит одновременно на два или более дисков, что делает их идентичными копиями друг друга. В случае выхода из строя одного диска, данные остаются доступными на другом диске.

Для восстановления массива необходимо установить дополнительный диск и скопировать данные с оставшегося диска на замену. Однако, существует вероятность того, что оставшийся диск может выйти из строя до завершения копирования.

RAID 1 обеспечивает отказоустойчивость одного диска. Среди преимуществ можно выделить избыточность данных и улучшенную производительность при чтении. Однако, недостатком является меньшая ёмкость хранения по сравнению с потенциалом диска. Кроме того, для реализации RAID 1 требуется в два раза больше дисков, чем для RAID 0.

RAID 1 – точная копия данных на двух или более дисках
Изображение, демонстрирующее сохранение данных в массиве RAID 1, где все данные зеркально отображены на всех дисках.

Математика RAID 1

Чтобы рассчитать AFR для массива RAID 1, необходимо учесть время, которое потребуется для восстановления массива. В частности, нужно скопировать все данные с исправного диска на замену.

Время восстановления может сильно варьироваться в зависимости от ёмкости диска, скорости записи и того, используется ли массив во время восстановления.

Для упрощения расчётов предположим, что восстановление массива займёт один день, и у вас останется один исправный диск.

Вероятность того, что оставшийся диск выйдет из строя в течение этого дня, равна:

1/365×0,01 = 0,000027

Теперь вероятность того, что весь массив выйдет из строя, равна сумме вероятностей выхода из строя одного диска и выхода из строя оставшегося исправного диска в течение этого однодневного периода восстановления:

0,01×0,000027 = 0,00000027

Поскольку у нас два диска и, следовательно, два возможных сценария отказа, необходимо объединить вероятности, как мы это делали для RAID 0:

1 – (1 – 0,00000027) × 2 = 0,00000055 = 0,000055%

Это лишь малая часть среднего показателя отказов для одного диска: из двух миллионов RAID-массивов мы ожидаем, что в течение года выйдет из строя только один, в отличие от 20 000 из двух миллионов отдельных дисков.

Этот расчёт показывает, как RAID 1 значительно снижает вероятность потери данных, делая его более безопасным вариантом для хранения критически важных данных по сравнению с RAID 0.

Когда AFR настолько малы, мы часто используем обратную логику и говорим о надёжности в терминах «количества девяток». Надёжность – это вероятность того, что устройство будет работать в течение года. Затем мы просто считаем девятки после запятой, игнорируя остальные цифры. Наш одиночный диск имеет надёжность 0,99 или две девятки, а массив RAID 0 имеет только одну девятку с надёжностью 0,98.

Надёжность двухдискового массива RAID 1, учитывая наше предположение о том, что восстановление массива займёт один день, составляет:

1 – 0,00000055 = 0,99999945

Если пересчитать девятки, то это также можно назвать шестью девятками.

RAID 5: чередование и чётность с коррекцией ошибок

В RAID 5 применяется технология, которая позволяет равномерно распределить данные по нескольким дискам и создать код для исправления ошибок. Этот код хранится в одном блоке на набор полос.

RAID 5 обеспечивает отказоустойчивость одного диска. Это означает, что даже если один диск выйдет из строя, данные можно будет восстановить с помощью кода исправления ошибок.

RAID 5 также предлагает избыточность данных и улучшенную производительность. Это делает его экономически выгодным решением для тех, кому нужна надёжность и эффективность. Однако, следует учитывать, что RAID 5 может выдержать только отказ одного диска. Если выйдут из строя два диска, данные будут потеряны.

RAID 5 хорошо подходит для таких сред, как веб-хостинг или файловые серверы, где важны эффективность и надёжность хранения, но не требуется чрезмерное резервирование данных.

RAID 5 – чередование и четность распределены по дискам
Диаграмма, показывающая шаблоны распределения данных RAID 5

Математика RAID 5

Давайте проведём расчёт. Массив перестаёт работать, когда выходит из строя один диск, а любой из оставшихся дисков выходит из строя в течение периода ремонта. Для массива RAID 5 требуется минимум три диска. Мы будем использовать те же значения для AFR и времени ремонта, что и раньше.

Мы уже вычислили вероятность отказа любого диска во время ремонта: 0,000027.

Учитывая, что это может произойти тремя способами, AFR для трёхдискового RAID-массива составляет:

1 – (1 – 0,000027)3 = 0,000082 = 0,0082%

Чтобы рассчитать долговечность, мы повторим ту же операцию, что и в предыдущих разделах (1 – AFR), и получим четыре девятки. Это намного лучше, чем долговечность одного диска, но хуже, чем у двухдискового массива RAID 1. Мы ожидаем, что из двух миллионов трёхдисковых массивов RAID 5 выйдет из строя 164.

Компромисс заключается в экономической эффективности: 67% дискового пространства трёхдискового массива RAID 5 доступно для данных по сравнению с 50% дискового пространства массива RAID 1.

Увеличение количества дисков до четырёх увеличивает доступное пространство до 75%, но поскольку массив теперь уязвим к отказу любого из трёх оставшихся дисков, это также увеличивает AFR до 0,033%, или всего до одной девятки.

RAID 6: чередование и двойная чётность с коррекцией ошибок

В RAID 6 применяется метод записи данных, при котором они распределяются между дисками в виде чередующихся блоков. Как и в RAID 5, данные записываются на каждый диск по очереди. Однако, в RAID 6 в каждом наборе блоков данных также присутствуют два блока информации, которые используются для проверки целостности данных.

Это обеспечивает более высокий уровень защиты данных по сравнению с RAID 5. Массив RAID 6 способен выдержать отказ двух дисков и продолжить работу.

Преимущества RAID 6 включают в себя отказоустойчивость до двух дисков, повышенную защиту данных и улучшенную производительность. Однако, есть и недостатки. Из-за двойной чётности скорость записи данных снижается. Также требуется больше времени для восстановления массива из-за его сложной структуры.

RAID 6 идеально подходит для крупных сред, таких как корпоративные центры обработки данных, где вероятность отказа дисков выше, а простои недопустимы.

Схема, показывающая сохранение данных в массиве RAID 6
Массив RAID 6: чередование и двойная четность с коррекцией ошибок

Математика RAID 6

Расчёт для конфигурации RAID 6 с четырьмя дисками аналогичен расчёту для RAID 5 с четырьмя дисками, но в этом случае мы можем оценить вероятность того, что в процессе ремонта выйдут из строя любые два из трёх оставшихся дисков.

Вероятность выхода из строя конкретной пары дисков составляет:

1/365 × 1/365 = 0,0000075

Это может произойти тремя способами, поэтому вероятность выхода из строя любых двух дисков равна:

1 − (1 − 0,0000075)3 = 0,000022

Таким образом, вероятность выхода из строя одного конкретного диска, а затем ещё двух из трёх оставшихся дисков в процессе ремонта составляет:

0,01 × 0,000022 = 0,00000022.

Это может произойти четырьмя способами, поэтому вероятность выхода из строя любого диска в течение года составляет:

1 − (1 − 0,000000075)4 = 0,0000009, или 0,00009%

Вычитая этот результат из единицы, мы получаем шесть девяток надёжности. Мы ожидаем, что только два диска из, примерно, двух миллионов выйдут из строя в течение года. Неудивительно, что вероятность выхода из строя диска в RAID 6 аналогична вероятности в RAID 1, поскольку в массиве RAID 6 из четырёх дисков доступно 50% хранилища для данных.

Как и в случае с RAID 5, мы можем увеличить количество дисков в массиве, соответственно увеличив вероятность выхода из строя. Массив RAID 6 из пяти дисков позволяет использовать 60% хранилища с вероятностью выхода из строя 0,00011%, или пять девяток. Два из, примерно, двух миллионов дисков выйдут из строя.

RAID 1+0: чередование и зеркалирование для защиты и производительности

RAID 1+0, также известный как RAID 10, представляет собой комбинацию технологий RAID 0 и RAID 1. В этом режиме данные чередуются между несколькими зеркальными парами дисков, обеспечивая как высокую скорость передачи данных, так и надёжную защиту информации.

Для работы RAID 1+0 требуется минимум четыре диска, два из которых используются для чередования, а два – для зеркалирования. Это позволяет объединить преимущества RAID 0 с надёжностью RAID 1.

В случае сбоя одного диска, данные всё равно могут быть доступны через другой диск в зеркальной паре. RAID 1+0 обеспечивает отказоустойчивость одного диска на зеркальный набор, что делает его более надёжным, чем RAID 1 или RAID 5. Однако, использование этой технологии требует больше дисков для избыточности данных, что увеличивает стоимость и уменьшает ёмкость хранилища.

Диаграмма, демонстрирующая стратегию сохранения данных в массиве RAID 1+0
RAID 10: чередование и зеркалирование для защиты и производительности

В таблице ниже представлен краткий обзор различных уровней RAID, их методов хранения и уровней отказоустойчивости.

Уровень RAID Метод хранения Устойчивость к отказам Преимущества Недостатки
JBOD Просто куча дисков Отсутсвует
  • Простейшая организация хранения.
  • Все диски доступны для использования.
  • Отсутствие избыточности данных.
  • Никаких улучшений производительности.
RAID 0 Чередование на уровне блоков Отсутствует
  • Легко реализовать.
  • Более высокая скорость чтения и записи.
  • Экономически эффективно.
  • Отсутствие избыточности данных.
  • Повышенный риск потери данных.
RAID 1 Зеркальное отображение Один диск
  • Избыточность данных.
  • Улучшение производительности чтения.
  • Уменьшенная емкость хранилища по сравнению с потенциалом диска.
  • Требуется вдвое больше дисков.
RAID 5 Чередование на уровне блоков с распределенной четностью Один диск
  • Избыточность данных.
  • Улучшенная производительность.
  • Экономически эффективно для тех, кому нужна избыточность и производительность.
  • Ограниченная отказоустойчивость.
RAID 6 Чередование на уровне блоков с двойной распределенной четностью Два диска
  • Более высокая защита данных.
  • Улучшенная производительность.
  • Сниженная скорость записи: из-за двойной четности записи выполняются медленно.
  • Ремонт массива занимает больше времени из-за его сложной структуры.
RAID 1+0 Чередование на уровне блоков с зеркалированием Один диск на зеркальный набор
  • Высокая защита данных.
  • Улучшенная производительность по сравнению с RAID 1 и RAID 5.
  • Более высокая стоимость, так как требуется больше дисков для резервирования данных.
  • Уменьшение емкости хранилища.

Сколько дисков нужно

В этом материале мы рассмотрели только стандартные уровни RAID.

Некоторые производители NAS-устройств предлагают свои уникальные конфигурации RAID, которые могут включать в себя функции объединения дисков разных размеров в один массив. Однако, обычно такие решения направлены на обеспечение отказоустойчивости, которая зависит от количества дисков с данными чётности в массиве.

Рассмотрим типичный случай с NAS-устройством, имеющим четыре диска. Предположим, что вероятность отказа одного диска составляет 1% в год, а время ремонта – один день.

Уровень RAID Метод хранения Уровень отказоустойчивости Примечания
RAID 2 Чередование на уровне битов, переменное количество выделенных дисков четности Переменный Более сложный, чем RAID 5 и 6, с незначительным выигрышем.
RAID 3 Распределение на уровне байтов, выделенный диск четности Один диск Опять же, это сложнее, чем RAID 5 и 6, и не дает никаких реальных преимуществ.
RAID 4 Чередование на уровне блоков, выделенный диск четности Один диск Выделенный диск четности является узким местом для записи данных и не дает никаких преимуществ по сравнению с RAID 5.

RAID 5, который использует один диск для хранения данных и один для контроля целостности, представляет собой хороший баланс между эффективностью использования пространства и надёжностью. Вероятность отказа такого RAID-массива составляет примерно 0,033% в год, что соответствует, примерно, одному отказу из 3000.

Если вы хотите повысить надёжность, вы можете выбрать зеркалирование или использование двух дисков для контроля целостности. В этом случае вероятность отказа снижается до одного отказа из миллиона или даже одного из трёх миллионов.

Важно отметить, что в наших расчётах мы предполагаем, что на восстановление массива после отказа диска потребуется один день. Как только диск выходит из строя, время начинает идти. Если вам нужно купить новый диск или дождаться доставки заказа, время восстановления увеличивается, а вместе с ним и вероятность отказа другого диска во время ремонта.

Один из распространённых подходов – использование устройств NAS с функцией «горячего резерва», которые всегда готовы к работе. Если устройство обнаруживает отказ диска, оно может немедленно перевести резервный диск в рабочий режим и начать процесс восстановления, минимизируя вероятность второго, более серьёзного отказа.

Даже самый высокий уровень RAID оставляет вас уязвимыми

Как мы уже говорили, определить, какой уровень RAID вам нужен, не так уж и сложно, но есть много нюансов.

Прежде всего, важно понимать, что RAID – это не панацея. Даже самый высокий уровень RAID не гарантирует полную защиту данных.

RAID обеспечивает защиту от сбоев физических дисков, сохраняя несколько копий данных на разных дисках. Это повышает отказоустойчивость, но не защищает от других событий, которые могут привести к потере данных. Например, стихийные бедствия, кража или атаки программ-вымогателей.

RAID также не защищает от ошибок пользователя. Если вы случайно удалите важный файл с устройства NAS, он исчезнет из этого массива, независимо от того, сколько у вас дисков чётности.

Конечно, это предполагает, что у вас нет резервных копий. Чтобы обеспечить полную защиту данных NAS, важно реализовать дополнительные меры для резервного копирования, такие как резервное копирование в облаке за пределами площадки.

Решения для облачного хранения данных – это эффективный инструмент для защиты ваших данных NAS с помощью безопасного резервного копирования в облаке за пределами площадки. Это гарантирует, что ваши данные защищены от различных угроз потери данных или других событий, которые могут повлиять на физическое расположение NAS.

В итоге, многоуровневый подход – это самый безопасный способ защиты ваших данных. RAID – важный компонент для достижения избыточности данных, но для повышения киберустойчивости следует также принять дополнительные меры.


5.0/1