пятница, 2 мая 2014 г.

Storage Tiering - хорошо забытое старое...

Мухи - отдельно,
мясо - отдельно.
(народная мудрость)

    Выражение, вынесенное в эпиграф, не является плодом напряженного ума Великого Ведущего. В приведенной интерпретации я слышал его в своей семье с глубокого детства. В определенный момент, произнесенная в микрофон для довольно большой аудитории фраза, получает "вторую молодость".
    Является ли техника иерархического хранения (Hierarchical Storage Management, HSM. Синоним - Storage Tiering) "открытием 201х года"? Конечно же, нет! Она применялась чуть ли с рождения серверов. Wikipedia затруднилась обозначить более-менее точный период, но ассоциация с мэйнфреймами IBM не вызвала возражений общественности. Честно говоря, первенство IBM можно оспорить, поскольку в основе своей техника имеет веками использующуюся логику хранения "шкаф -> кладовка -> гараж -> дача (сарай, если дачи нет) -> помойка"

   Причина разделения хранилища на разделы банальна - чем быстрее раздел, тем он дороже. Строить монолитное "самое быстрое из возможных" хранилище - в большинстве случаев глупо-расточительно, поскольку сохраняемые данные (как правило) могут быть разделены на часто используемые (горячие) и используемые редко-никогда (холодные). Как показывает практика, этот вполне логичный подход часто не работает. "Нам необходима система хранения с максимально возможной скоростью доступа объемом ХХХ петабайт" - уж строить, так строить!



    Застой.
Со временем структура несколько видоизменялась, подстраиваясь под доступные в текущее время технологии.
    На заре были дисковые накопители и ленточные.
    Позже быстрые диски (FC, SCSI) - емкие относительно дешевые диски - ленты.
    Время шло, дисковые накопители с интерфейсом FC канули в лету, а ценовой и скоростной разрыв между быстрыми (SAS) и емкими (SATA) накопителями стал не драматически огромным. Ленточные хранилища тоже попали в узкую нишу. Интерес к иерархическому хранению остыл.
    Перестройка.
    Некоторый импульс к возрождению интереса придали SSD. На рынке появился класс устройств, имеющих существенное преимущество в скорости, но и весьма ощутимо высокую цену - т.е., опять появился смысл в сепарации данных по разным подразделам общего хранилища. Еще больший отрыв в скорости и в стоимости единицы хранения у NVMe продуктов (см. NVMe).

    Защитой данных и оптимизацией хранения занимается подразделение SNIA - комитет Data Protection and Capacity Optimization (DPCO). Из названия видно, что круг интересов комитета более широкий, чем наша тема, которая является лишь подразделом. Комитет призван заниматься обучением и пропагандой в области защиты и оптимизации хранения - публикуется бюллетень. Он также аккумулирует общие сведения о продукции, попадающей в сферу интересов, публикуя их в Product Selection Guide (PSG). Комитет Проявлял некоторую активность с сентября 2010 по сентябрь 2011. Вообще, 2011 год - наверное, самый плодовитый в области Storage Tiering.

    Почему же, при всех своих преимуществах, Storage Tiering по-прежнему не используется широко даже там - где ему "доктор прописал"? По нескольким причинам:

  • как обычно - "а мужики-то не знают!...". Люди, принимающие решение, зачастую просто не знают о существовании технологии. Это относится как к стороне потребителя ("а нам ничего подобного не предложили"), так и к стороне поставщика ("в запросе не было - мы и не предлагали");
  • усложнение структуры вычислительной системы и оборудования - это дополнительные затраты при закупках и в эксплуатации;
  • процесс требует автоматизации. Значит - либо использования специализированного программного обеспечения, либо программно-аппаратных комплексов с соответствующими возможностями. И то, и другое - как правило, дорого, поскольку находится в области "Enterprise", где вообще ничего дешевого не бывает. Здесь, правда, произошли существенные изменения - Microsoft включила Storage Spaces в Windows Server 2012 R2, то есть - иерархическая система хранения стала доступна потребителю "практически бесплатно". Сразу оговорка - в пределах одного сервера (наверное).

    Итак, если из всех генерируемых компанией данных можно выделить часть, к которой необходимо обеспечить наибольшую скорость доступа и к тому же есть некоторое количество денег (теперь есть не пугающе дорогая альтернатива) на реализацию этих чаяний - имеет смысл строить многоуровневое хранилище с автоматизированной системой управления. Будет ли это намного дешевле, чем монолитное очень быстрое хранилище?
   Во-первых, навряд ли намного дешевле, с учетом необходимого ПО, дополнительных усилий и повышенным требованиям к квалификации управляющего персонала. Чем больше масштаб - тем больше возможный эффект. Для небольших задач экономическая выгода может оказаться под большим вопросом.
   Во-вторых, выгода зависит от соотношения объемов быстрого/небыстрого разделов. Чем оно больше, тем больший экономический эффект может быть достигнут.


http://www.snia.org/sites/default/education/tutorials/2012/spring/storman/LarryFreeman_What_Old_Is_New_Again.pdf
http://searchdatacenter.techtarget.com/feature/Solid-state-data-storage-devices-increase-the-use-of-tiering
http://www.computerweekly.com/feature/Automated-storage-tiering-product-comparison
http://technet.microsoft.com/ru-ru/library/dn387076.aspx


Комментариев нет:

Отправить комментарий