среда, 16 сентября 2015 г.

Взгляд: "Да ленты еще и диски переживут!" LTO живет своей насыщенной жизнью.

    Цитаты:
"Лидеры ленточного хранения говорят, что их любимая технология не мертва, и на самом деле становится здоровее".
"Лента не умирает - она ​​становится здоровее и умнее".

    Поумнение и оздоровление идет параллельно по нескольким направлениям, касающимся накопителей, носителей (лент) и управления.

    LTO консорциум обновил родмэп, продолжив его линию несколько дальше - до предположительно 2022 года и формата LTO-10.

Внимательный читатель обратит внимание на "лишнюю" затабличную строку курсивом. Это - эмпирическое продолжение официальной таблички, сделанное редакцией The Register на основе информации об успешных исследованях текущего времени (IBM и Sony, в частности).

    Внимательный и вдумчивый читатель обратит внимание на довольно резкое сокращение периода между сменой поколений. Резво!

    Итак, какие ветры дуют в море LTO...


    14 сентября 2015 официально представлена спецификация поколения 7 LTO.

Коротко:
- емкость картриджа 6TB (15TB с компрессией 2,5:1)
- скорость передачи данных накопителем (с/на ленту, т.е. - скорость чтения/записи) до 750MB/s (2.7TB/час)  - данные с учетом компрессии
- вдвое увеличено количество головок чтения/записи
- улучшен серво-формат для адаптации к повышенной плотности записи
Поддерживаются уже введенные в предыдущем поколении:
- совместимость с LTFS (Linear Type File System - файловая система, учитывающая особенности линейного характера чтения/записи на ленты)


    Плотность записи и емкость картриджей.

    9 апреля 2015 IBM продемонстрировала запись на магнитную ленту с плотностью 123 миллиарда бит (Gb) несжатых данных на квадратный дюйм. В пересчете на стандартный LTO картридж - это 220TB. Как теперь модно - приводятся более впечатляющие и поражающие воображение "бытовые" аналоги: "Это 1,37 триллиона (!) СМС сообщений или текст 220 миллионов книг, для которых требуется полка длиной 2 200 км - расстояние от Лас-Вегаса до Хьюстона, что в Техасе". Последнее особенно впечатляет! А вообще - в США штук 18 Хьюстонов...
    Для достижения результатов, IBM сделала:
- улучшенную систему серво-контроля, включающую контроль скорости перемещения ленты, позиционирования головок. В результате головка позиционируется с точностью до 6 нанометров, что позволяет разместить 181 300 треков на дюйм.
- улучшенные головки чтения/записи, позволяющие использовать носитель с BaFe рабочим слоем. Исследования ведутся в кооперации с FUJIFILM.
- инновационные алгоритмы обработки в канале данных с предсказанием шума
- GMR головки со сверх-узким 90-нанометровым рабочим зазором.

    30 апреля 2014 Sony разместила пресс-релиз о технологии магнитной записи на ленту с плотностью 148 гигибит на квадратный дюйм. Это на год раньше и на 20% больше, чем у IBM. Продолжив цепочку ассоциаций по аналогии с IBM - книжная полка у Sony длиннее полки IBM на 440 км!!! Т.е - от Лас-Вегас прямо до Ciudad de México.
    В пересчете на картридж, у Sony получается 185TB. Меньше, чем у IBM - видимо, лента в картридже меньшей длины или ширины.
    Результат достигнут за счет создания магнитного слоя с размером магнитных частиц порядка нанометров с равномерной кристаллической ориентацией. Получается он электростатическим осаждением в аргоне.
    Беда состоит в том, что Sony идет своей тропой, она не присоединилась к LTO консорциуму.

    Управление и мониторинг.

    В пресс-релизе этого нет. В статье Techrepublic приводятся комментарии сотрудника IBM Shawn Brume:
    LTO-7 использует новую технологию, названную Extended Copy. Система заимствована у SCSI стандарта - копирование информации производится непосредственно между устройствами без участия управляющего хоста (сервера)
    Контроль состояния носителей (картриджей с лентами). Администратор должен быть уверен, что носитель в кондиционном состоянии! Для того, чтобы быть в этом уверенным, в паузах между "боевыми" заданиями вынимались с полок картриджи, не участвующие в работе некоторое время, проверялись на предмет работоспособности, складывались обратно. В случае, если что-то пошло не так, администратор не мог сходу сказать - кто виноват: привод или носитель? Теперь привод знает состояние и может выдать отчет "наверх" о состоянии и результатах проверки каждого носителя в библиотеке. Он и раньше это знал, но никому ничего не говорил. Потому что не спрашивали! Технология позволит предупредить ошибки и принять меры до их наступления.

    Вердикт


    Шаги, которыми движется индустрия хранения на лентах с точки зрения емкости и "умности" таковы, что технология может пережить диски! - это мнение Dave Woiti, управляющего Information Storage Industry Consortium. Флеш в системах хранения занимает все большую долю. За счет чего? По мнению Dave Woiti, она может вытеснять НЖМД, не затрагивая при этом ленты. В итоге, датацентры будут иметь два уровня хранения - флеш под горячие данные и ленты под все остальное.

http://www.lto.org/2015/09/the-lto-program-announces-upcoming-generation-7-specifications-for-licensing/
http://www.techrepublic.com/article/tape-isnt-dying-its-getting-healthier-and-smarter/

пятница, 11 сентября 2015 г.

Таки, каким интерфейсом мы будем соединяться с iSCSI SSD хранилищем? Знамо дело - Infiniband с RDMA!

    7 сентября 2015. Mellanox продолжает затеянную некоторое время назад тему. Оригинал здесь. ВИдением развития рынка СХД делится Майкл Каган - главный технический директор и соучредитель компании Mellanox Technologies.

    По мнению компании, мы являемся свидетелями революции в системах хранения. Речь идет о доступе к быстрым хранилищам по протоколу iSCSI через интерфейс Infiniband с использованием технологии прямого доступа к памяти (RDMA).

    История.
    В то время, пока основным носителем в СХД был жесткий диск с задержкой на выдачу данных в десятки миллисекунд, и соответствующие сетевые и протокольные накладные расходы были в сотни микросекунд, суммарные накладные расходы составляли незначительный процент от общего времени доступа.
    Все кардинально поменялось с началом активного использования SSD в СХД. Время доступа снизилось на два порядка до сотен микросекунд. Если задержки доступа по сети и протокола не снизить пропорционально, они создадут бутылочное горлышко, которое сведет на нет все преимущества, привносимые SSD.
    ... и тут на сцене появляется рыцарь в сверкающих доспехах на белом коне! Мало того, что интерфейс Infiniband изначально проектировался с фокусом на сверхнизкие задержки, так Mellanox, к тому же, является большим специалистом в RDMA! Сочетание одного с другим выводит компанию Mellanox в безусловные лидеры в двух направлениях - а) межсоединения в нагруженных вычислительных кластерах и - как оказалось, б) в быстрых системах хранения. Немаловажным является и тот факт, что решение получается "из одних рук" - Mellanox производит как контроллеры интерфейса, так и соответствующие коммутаторы (.. и даже кабели с недавнего времени!).

    Сейчас.
    iSCSI Extensions for RDMA (iSER) - расширение iSCSI, формализует протокол передачи данных по каналам связи с учетом прямого доступа к памяти.
    Mellanox имеет в портфеле полноценные решения со скоростью передачи как на 40/56Gb/s, так и на 100Gb/s. Кстати - Mellanox первой в мире предложила комплексное решение на скорости 100Gb/s с суб-миллисекундной задержкой в 2015 году.

    Скоро.
    Не за горами выход на широкий рынок Intel 3D-Xpoint. Он ознаменуется очередным 100-кратным скачком производительности, и будет требоваться еще более эффективной сети.
В план-графике Mellanox (дорожной карте - если кто не понял) - "кролик из рукава" - решение на 200Gb/s.
    Помимо прочего, развивается и RDMA, в который заложены перспективные механизмы. На картинке отражен сегодняшний скачок при переходе от 1Gb/s iSCSI и НЖМД к 40/100Gb/s + RDMA и SSD, а также движение к следующей станции - 100/200Gb/s + RDMA+ и 3D-Xpoint в качестве носителя.

    Что такое "-" и "+" в RDMA.
Знак "-", "+", "++" показывает метод разрешения коллизий при передаче пакетов по каналу связи от нескольких источников.
В "RDMA-", только один из конкурирующих кадров обрабатывается (пропускается в канал), в то время как остальные отбрасываются.
В "RDMA+", только один из конкурирующих кадров пропускается в канал, в то время как остальные буферизуются в пределах определенной продожительности.
"RDMA++" - то же, что в "RDMA+". Дополнительно: не переданные кадры сохраняются в случае обрыва связи. Задания на передачу восстанавливаются с восстановлением канала.

http://www.mellanox.com/blog/2015/09/rdma-enabling-storage-technology-revolution/

G. Neufeld,M. Ito   Protocols for High Speed Networks IV