Классификация систем хранения данных
Введение
Рассматривая любую информационную систему, нельзя не выделить такой процесс как хранение информации. Именно информация представляет основную ценность в любой организации, а вся инфраструктура, предназначенная для её обработки, хранения, передачи – лишь следствие данного факта. Хотелось бы уделить внимание процессу хранения информации, методах аппаратной защиты информации от потери и управлению хранением информации. В современном мире любая компания ощущает на себе следующие тенденции: информация играет ключевую роль в работе организации, рост данных происходит в экспоненциальной пропорции. К примеру, IDC утверждает, что объем ежегодно создаваемой и дублируемой информации увеличится в 6 раз в период с 2006 по 2010 гг.
В первую очередь, интересует продолжительное во времени хранение на жестких дисках (в перспективе на SSD накопителях). Данный материал дает представление об аппаратных методах организации хранения и защиты данных. Рассмотрены иерархия систем хранения данных на жестких дисках, их общие классы. Такие системы как NAS серверы или VTL не рассматривались, хотя могут иметь место как надстройка к описанным системам.
Угрозы для информации, ведущие к её потере при хранении на жестких дисках
- Аппаратные - отказ, порча, поломка оборудования.
- Программные - отказ, сбой, неправильная работа программного обеспечения.
- Человеческие – неправильные, неадекватные действия персонала.
- Инфраструктурные – сбой средств передачи информации, обрыв кабелей, выключение роутеров, плохие контакты.
- Электропитание – потеря данных вследствие низкого качества или исчезновения электроэнергии.
- Аварии – пожар, затопление и прочие угрозы масштаба серверной комнаты, здания.
- Катастрофы – проблемы районного, городского масштаба.
Итак, начиная от простого к сложному.
Прямое подключение HDD
Жесткий диск подключается к интегрированному контроллеру материнской платы. Подразумевается, что никаких дополнительных устройств хранения нет. Если данный тип подключения почти всегда реализуется в домашних условиях, то для любой фирмы он совершенно неприемлем как средство хранения хоть сколько-нибудь важной информации.
Данные не защищены и любой сбой (аппаратный или программный) может привести и однажды приведет к потере данных. Ценность Вашей информации противопоставлена не только прогнозам фирмы производителя на гарантийные расходы, но и качеству электроэнергии, квалификации персонала, софта и прочих надсистемных факторов.
Информация не защищена от:
- Аппаратных проблем
- Программных сбоев
- Человеческого фактора
- Инфраструктурных проблем
- Сбои электропитания
- Аварий
- Катастроф
Внутренний RAID контроллер
RAID (англ. redundant array of independent/inexpensive disks) - избыточный массив независимых/недорогих жёстких дисков — матрица из нескольких дисков, управляемых контроллером, взаимосвязанных скоростными каналами и воспринимаемых как единое целое. В зависимости от типа используемого массива может обеспечивать различные степени отказоустойчивости и быстродействия.
Два или более дисков подключаются к контроллеру в сервере либо внешняя дисковая полка подключается к контроллеру, в зависимости от выбранного уровня отказоустойчивости, защищает от поломки одного или более дисков, сохраняя работоспособность.
При наличии энергонезависимого кэша и использовании SAS дисков, защищает от проблем, связанных с перебоями электропитания, за исключением тех случаев, когда происходит электрическое повреждение оборудование. Но при повреждении сервера возможна потеря данных.
Защищает данные от:
- Аппаратных проблем - отказ, порча, поломка оборудования. Частично, только от отказа жестких дисков.
- Сбои электропитания – частично, защищает данные, хранимые в буфере контроллера в очереди на запись, но ограниченное время и только при наличии аккумулятора на контроллере.
Не защищает от:
- Программных сбоев
- Человеческого фактора
- Инфраструктурных проблем (хотя все соединения, как правило, находятся внутри сервера).
- Аварий
- Катастроф
Основная цель применения – защита данных от потери при отказе жесткого диска, так же, одна из причин внедрения - потребность в повышенной производительности дисковой подсистемы.
RAID контроллеры поставляют многие компании: IBM, DELL, SUN, HP, Adaptec, 3ware, LSI, и прочие.
Внешний RAID массив
Начальный уровень. Диски и контроллер вынесены в отдельную внешнюю систему. Один или несколько серверов могут быть подключены к внешнему массиву различными интерфейсами, к примеру SAS, iSCSI, FC. Почти все такие системы имеют дублирование вентиляторов и блоков питания, многие предусматривают возможность установки дублирующего контроллера. Сами по себе, внешние RAID массивы более производительны и надежны по сравнению с внутренними RAID контроллерами и могут расширяться до более чем сотни дисков (при помощи дисковых полок).
На данный момент во многих моделях есть продвинутые средства мониторинга и управления, как самим массивом, так и данными на нём. Средства контроля за состоянием дисков заранее оповещают о возможном отказе, большинство достойных производителей меняют диски только на основании данных сообщений, до факта неработоспособности. У некоторых моделей есть возможно делать мгновенные снимки – (snapshot), что позволяет защитить данные и упрощает резервное копирование.
Защищает данные от:
- Аппаратных проблем - частично, при наличии дублирования всех систем.
- Программных сбоев - частично, некоторые массивы обладают функциями создания мгновенных копий, что поможет создавать множественные снимки.
- Инфраструктурных проблем– защищают при условии дублирования всех массивов вне сервера.
- Сбои электропитания – частично, защищает данные в буфере контроллера на запись при наличии аккумулятора. Наличие дублированных блоков питания гарантирует большую надежность.
Не защищают от:
- Человеческого фактора
- Аварий
- Катастроф
Причиной внедрения является либо потребность в консолидации ресурсов хранения, их более простом управлении, возможности одновременного доступа (например при создании кластера), либо потребность в высокой производительности, либо потребность в большей надежности (дублирование путей к контроллеру).
Типичные представители класса: Xyratex 5xxx/6xxx, Dell MD3000, IBM 3XXX, HP MSA 2000.