|ГЛАВНАЯ|   |О ЖУРНАЛЕ|    |ПОДПИСКА|   |ФОРМЫ СОТРУДНИЧЕСТВА|  |КОНТАКТЫ|   |СОДЕРЖАНИЕ НОМЕРА|  |НОВОСТИ|    |ВАКАНСИИ|     |АРХИВ|  |IT-СТРАНСТВИЯ|

№ 1 (44) 2009

 

 

 
 

 

 

 

 


Игорь КИРИЛЛОВ

 

 

 

Человеку, независимо от возраста и рода занятий, свойственно увлекаться. Примеры спонтанных и массовых увлечений встречаются на каждом шагу — мода, политика, автомобили… Не удивительно, что некоторая «увлеченность» присуща также и сегменту информационных технологий. Например, тема центров обработки данных (ЦОД), широкое освещение которой отечественные СМИ начали всего пару лет назад, успела настолько укорениться в умах представителей ИТ-сообщества, что «не строить ЦОД» для более-менее крупной украинской компании — чуть ли не моветон.

Однако здесь наблюдается некоторая однобокость (в общем-то, оправданная новизной темы), которая проявляется в увлечении  инфраструктурными решениями. Другими словами, рассуждая о дата-центрах, зачастую вспоминают шкафы, СКС, стойки, фальшполы, ИБП, кондиционеры и т.д. Тем не менее, инфраструктура — это всего лишь база для серверов и систем хранения данных, которые, в свою очередь, являются средствами обработки и хранения важнейшего бизнес-ресурса — информации. А между тем, сегодня на рынке присутствует множество серверных решений, ориентированных именно на центры обработки данных, каждое из которых будет оптимальным только в определенных условиях.

 

Новое — забытое старое

Как известно, стоимость каждого квадратного метра ЦОД измеряется тысячами долларов. Поэтому перед владельцем комплекса, в процессе выбора серверов, всегда стоит дилемма — как обеспечить максимум «производительности» и задействовать минимум площади (гарантируя при этом соответствующий уровень электропитания, охлаждения, безопасности и т.д.).

Представленные на рынке вычислительные системы можно разделить на две большие группы: специализированные и разнородные решения.

В первую группу попадают, главным образом, мейнфреймы и коммерческие суперкомпьютеры, а во вторую — гетерогенные комплексы на базе серверов CISC (архитектура х86), RISC и EPIC (т.н. Unix-серверы). Потребители уже успели привыкнуть к серверам в ЦОД. Однако остается вопрос, насколько целесообразно и экономически оправдано использование  мейнфреймов и коммерческих суперкомпьютеров в дата-центрах.

Еще в 60-х годах прошлого века активное развитие вычислительных технологий породило один из самых грандиозных компьютерных проектов в истории — системы типа мейнфрейм. На их разработку IBM еще тогда израсходовала около $5 млрд. (сумму, сопоставимую со стоимостью американской «лунной» программы) и продолжает тратить все новые миллиарды. История создания и развития систем этого типа весьма интересна. Но отсылаем все вопросы по хронологии событий в Интернет, отметив лишь, что в результате проведенных работ был создан тип близкого к идеальному (если сравнивать с неким эталоном) или даже идеального (в сравнении с другими серверными решениями) коммерческого компьютера (рис. 1).

 

 

Изначально мейнфреймы разрабатывались как системы коллективного использования. Следовательно, на всех уровнях в них заложена возможность разделения физических аппаратных ресурсов (процессоров, накопителей и периферийных устройств) на виртуальные разделы, в каждом из которых могут независимо запускаться собственные операционные системы и приложения. В то же время, пользователь, подключаемыйк мейнфрейму, работает с виртуальным разделом так же, как работал бы с физическим.

Несколько десятилетий подряд мейнфрейм являлся основой любого крупного вычислительного центра (будь то коммерческое предприятие, научный институт или оборонное предприятие). Фактически, это был вычислительный комплекс организации, к которому подключались терминалы — «тонкие» клиенты (более подробно особенности менфреймов рассмотрены во врезке «В чем прелесть мейнфрейма?»).

Долгое время централизованные вычисления были единственно возможным способом автоматизированной обработки данных. Но по мере развития персональных систем все чаще стали отходить от этой устоявшейся модели. Поскольку рабочие места, благодаря появлению ПК, становились более самостоятельными, значение роли центрального суперкомпьютера стало падать. Новая парадигма, превалировавшая в 1990–2000-х, предписывала максимальное рассредоточение обработки информации.

Однако вскоре выяснилось, что и без централизованного ядра часто не обойтись. Правда, теперь можно было строить его не на базе мощного мейнфрейма, а используя необходимое число относительно недорогих, но довольно производительных CISC- или Unix-серверов. И, судя по росту популярности современной концепции ЦОД, фактически пошел обратный процесс, направленный на централизацию серверных ресурсов.

 

_____________________________________________________

Судя по росту популярности современной концепции ЦОД,

в ИТ-мире идет процесс возвращения

к централизованной схеме обработки данных,

по крайней мере — в сегменте крупных организаций.

____________________________________________________

 

 

Серверы vs мейнфреймы

Но что же выбрать сегодня для наполнения ЦОД? Что предпочесть: одного серверного «чудо-богатыря» или целый полк небольших серверов? Естественно, каждый подход обладает своими преимуществами. Конечно, с точки зрения идеальной технической модели (не включающей в себя экономические оценки), для использования в ЦОД мейнфрейм видится предпочтительнее сборного серверного комплекса. Судите сами: площадь, которую занимает современный мощный мейнфрейм, составляет около 3 кв. м. (два стандартных шкафа 42U). При этом он способен заменить несколько сотен CISC- или десятки Unix-серверов.

Сразу отметим, что адекватное прямое сравнение эффективности систем обоих типов корректно только со многими дополнительными условиями. Например, с помощью фирменных технологий на одном мейнфрейме можно организовать более тысячи виртуальных серверов, каждый из которых будет выполнять свою задачу. Но и современные CISC- или Unix-серверы поддерживают технологии виртуализации (часто «унаследованные» от мейнфреймов), да и масштаб таких систем весьма различный — от одно- и двухпроцессорных 1U-моделей до мощнейших Unix-серверов.

К тому же большую роль играет класс выполняемых задач. Многие специалисты отмечают, что величина удельной производительности в расчете на одно «среднее» вычислительное ядро процессора, при условии выполнения типичных для коммерческого сектора задач (СУБД, бизнес-приложения и т.д.), у современного мейнфрейма в 4–5 раз выше, чем у Unix-систем, и более чем в 20 раз превосходит аналогичные показатели серверов х86.

 

__________________________________________________________

По мнению специалистов, величина удельной

производительности современного мейнфрейма в расчете на

одно вычислительное ядро процессора,

при условии выполнения типичных для коммерческого

сектора задач (СУБД, бизнес-приложения),

в 4–5 раз выше, чем у RISC-систем, и более чем в 20 раз

превосходит показатели серверов х86.

___________________________________________________________ 

 

Пусть эта оценка не будет идеально точной, но она дает представление о масштабе явления. Еще отметим, что сейчас речь идет об одиночных мейнфреймах, которые, в свою очередь, могут объединяться в кластеры (в том числе и территориально распределенные).

За счет высокой производительности мейнфрейм занимает меньше места, чем обычные серверы (аналогичной производительности), к тому же у него значительно меньшее удельное энергопотребление. Даже если для сравнения взять блейд-серверы очень высокой плотности (которые сегодня позволяют разместить шестнадцать двухпроцессорных «лезвий» в восьми юнитах) и установить их из расчета четыре фермы на стойку, то мы получим «всего» 64 сервера на шкаф.

В результате окажется, что энергопотребление мейнфрейма (из двух шкафов) класса Hi-End и одной стойки блейд-серверов при максимальной нагрузке будет примерно одинаковым — около 25–30 кВт. Если же сравнивать по занимаемой в ЦОД площади, то в двух стойках с блейд-серверами поместится, как нетрудно подсчитать, до 128 «лезвий» (при общем энергопотреблении 50–60 кВт).

При этом для систем на базе архитектуры х86 до сих пор часто действует эмпирическое правило: «один сервер — одно приложение». То есть, для стабильной работы в рамках одного корпоративного сервера не рекомендуется запускать более одного важного приложения (СУБД, почтовые программы, документооборот и т.д.). В то же время, мейнфрейм, в силу своих программно-аппаратных особенностей, способен обеспечить стабильную одновременную работу сотен независимых приложений.

Здесь также стоит учитывать тот факт, что в случае использования традиционных систем понадобится значительное количество всевозможных внешних кабелей, коммутаторов, соединительных панелей и т.д. Мейнфрейм же занимает в несколько раз меньше места и потребляет также меньшее количество электроэнергии, чем сравнимые по производительности CISC- или Unix-серверы (с учетом инфраструктуры).

Но все же: преимущества мейнфреймов — не в количестве ядер или в тактовой частоте процессора, а в сбалансированности и надежности системы, отказоустойчивости, защищенности информации. К тому же у мейнфреймов имеются фирменные средства удаленного управления и настройки. А поскольку система изначально проектировалась и разрабатывалась как централизованная, ею гораздо проще управлять, чем гетерогенным вычислительным комплексом.

Итак, промежуточное резюме. По сравнению с обычными серверами мейнфрейм, при соответствующем уровне производительности, занимает меньше места, потребляет меньше электроэнергии (и, как следствие, выделяет меньше тепла), лучше управляется и обеспечивает высокую степень отказоустойчивости (99,999 и выше). Но

 

Хорошо, но дорого

как это обычно бывает, за высокий класс надо платить большие деньги. Этот фактор часто играет не на пользу мейнфреймам. Так, уже упомянутый z10 в самой базовой конфигурации стоит около $1 млн., а цена его «нафаршированной» версии может перевалить и за $3–4 млн., а то и больше. Здесь мейнфрейм сильно проигрывает комплексам на базе CISC- и Unix-серверов — по некоторым данным, в 3–5 и более раз при сопоставимой производительности. Это отнюдь не способствует росту рынка мейнфреймов, которых с каждым годом продается все меньше.

 

_________________________________________________________

Стоимость мощного современного мейнфрейма сегодня

начинается от $1 млн. и достигает $3–5 млн.

_________________________________________________________

 

 

Ради сохранения интереса со стороны потребителей производители пошли на определенные отступления от негласных традиций «большого железа». На рынке все чаще стали предлагать небольшие мейнфреймы, а в последнее время на Западе приобрела популярность концепция on demand — когда клиенту поставляется полноценная система, но платит он только за необходимый набор функций, докупая лицензии на новые возможности по мере необходимости.

Но такие меры положения не исправили — компании малого (по западным меркам) и среднего бизнеса, на которые, собственно, и были рассчитаны мейнфреймы Low-End, в большинстве случаев предпочитают серверы на базе открытых стандартов, и часто готовы пожертвовать некоторой долей отказоустойчивости и производительности, в пользу кратного выигрыша в цене. Выгода концепции on demand тоже не всегда однозначна и осязаема.

И здесь самое время вспомнить о некоторых «не очень приятных» (с финансовой точки зрения) особенностях мейнфреймов. Если для поддержки, ремонта, замены и профилактики обычных серверов достаточно легко найти работников соответствующей квалификации, то попробуйте отыскать у нас в стране специалиста по мейнфреймам, а если отыскали, то — переманить его к себе на работу… Да еще иметь одного «про запас» (хотя бы потенциально): вдруг первый заболеет или уволится. Конечно, это сложности организационного характера.

Однако гораздо дороже обстоит дело с гарантийным обслуживанием. Ведь вложив в мейнфрейм несколько миллионов долларов США, покупатель наверняка ожидает получить определенные гарантии. Но оказывается, гарантийное обслуживание и обеспечение соответствующего уровня сервиса (Service Level Agreement, SLA) может обеспечить только производитель. В результате, гарантийное или аварийное обслуживание выливается в значительную сумму (часто с пятью нулями), а, учитывая тот факт, что мейнфрейм рассчитан на 12–15 или даже 20 лет непрерывной работы, итоговая стоимость обслуживания может многократно превысить цену самого вычислительного комплекса. Одним словом — хорошо, но дорого! Причем дорого «и сейчас», «и потом».

К тому же, одним из недостатков мейнфрейма является то, что на нем могут работать только специальные операционные системы и оптимизированные приложения. Это повышает требования и к ПО, и к уровню квалификации системного администратора, который должен быть специалистом именно в сфере мейнфреймов. Тем не менее, за много лет использования в различных организациях выкристаллизовались типы приложений, которые используются клиентами мейнфреймов. Главным образом, это различные СУБД, АСУП и т.п.

В большинстве случаев мейнфреймы используются в корпоративных ЦОД для собственных потребностей организации. Но нередко они применяются также и в коммерческих ЦОД. Однако в этом случае есть принципиальное отличие от ЦОД на базе серверов х86 — владелец мейнфрейма предоставляет заказчику не ресурсы, а услуги. Поэтому, если в традиционном дата-центре размещаются х86-системы, то клиент получает физические серверы и доступ к ним (как вариант — место в шкафу, для размещения собственных серверов). В случае с мейнфреймом клиент, с помощью терминала и выделенного канала связи, получает доступ к набору важнейших приложений, например, СУБД Oracle или ERP-системе SAP. И работает он уже не столько с физическими ресурсами  эксплуатация и поддержка системы лежит полностью на стороне владельца ЦОД), сколько с прикладными.

 

Суперкомпьютеры на службе у бизнеса

В попытках поймать рыночную волну (и взобраться поближе к ее гребню) ряд компьютерных производителей предлагает для использования в корпоративных ЦОД адаптированные суперкомпьютеры. Например, в продуктовой линейке компании Silicon Graphics есть коммерческий вариант вычислительной системы Altix4700 (рис. 2а). Не менее известным классическим суперкомпьютером на коммерческой службе является также и Hewlett-Packard Superdome (рис. 2б).

 

 

Обе системы построены с использованием архитектуры cc-NUMA, работают на базе 2-ядерных процессоров Intel Itanium2, поддерживают виртуализацию вычислительных ресурсов, динамическое перераспределение нагрузки, могут объединяться в кластеры (с себе подобными) и работают под управлением операционных систем Linux и HP-UX, соответственно.

При этом отдельные серверы SGI Altix4700 (в каждом из которых может быть установлено до 78 процессоров и до двух терабайт ОЗУ) могут объединяться в кластеры. Общее число процессоров Itanium2 в них может достигать 512 (1024 ядра), что обусловлено, в основном, ограничениями операционной системы Linux, а не аппаратными возможностями.

Каждый HP 9000 Superdome содержит до 64 процессоров, до 2 Тб оперативной памяти и также поддерживает кластеризацию. Кстати, в современных мейнфреймах объем оперативной памяти, как правило, не превышает 1,5–2 Тб, а количество процессоров — 77, с учетом специализированных чипов.

Отметим, что «суперкомпьютерность» HP Superdome или SGI Altix определяется типом архитектуры, а точнее — способом взаимодействия процессоров и оперативной памяти. В обоих случаях это cc-NUMA (Cache Coherent Non-Uniform Memory Access, или неоднородный доступ к оперативной памяти с обеспечением когерентности кэшей) (рис. 3).

 

 

Такая схема позволяет наращивать количество узлов практически до бесконечности, ограничения накладывает только операционная система, прикладное ПО или производительность внутренней коммуникационной сети (на практике одна система редко содержит больше тысячи процессоров, да и таких немного). Однако здесь возникает сложность с распараллеливанием задач. Оперативная память в NUMA-системах разделена физически, но не логически. Следовательно, если построить нерациональный алгоритм, то процессор, скажем, из узла X может разместить свои оперативные данные в ОЗУ узла Y (вместо своей собственной памяти). Тогда рациональный обмен данными будет весьма затруднен и задача начнет тормозить. Но если все сделать грамотно, каждый узел из четырех или восьми процессоров будет трудиться только над своим участком работы (за распределение и баланс нагрузки в ходе выполнения задач отвечает программа-супервайзер). В этом случае скорость возрастет. К тому же при такой архитектуре легче выделять пулы вычислительных ресурсов для коммерческих потребностей.

 

В то же время, «большой сервер» — не всегда «суперкомпьютер». Например, такие модели, как FSC M8000, Sun M9000 или IBM p595, несмотря на большое количество процессоров (16, 32 и более), представляют собой типичные SMP-системы (рис. 4) с общим доступом процессоров ко всему объему оперативной памяти. Отметим, что на базе архитектуры SMP сегодня построены все массовые серверы.

 

Важным ограничением является то, что SMP-система не может работать с количеством процессоров более 32 (это физический предел), поскольку по мере увеличения их числа резко возрастает уровень ошибок в памяти. Установлено, что в SMP-системе диапазон производительности для 1- и 32-процессорной системы даже в идеальном случае не превышает пяти раз. В то время как cc-NUMA позволяет наращивать производительность почти линейно. Если не учитывать целого ряда практических факторов, то теоретически эффективность добавления каждого следующего вычислительного узла в такую систему определяется степенью параллелизма задач — чем он выше, тем более линейно, согласно закону Амдала, возрастает производительность.

Если производитель декларирует наличие в SMP-системе более чем 32 процессоров, речь идет о кластерной конфигурации, когда два и более серверов с помощью специальных программно-аппаратных средств объединяют в одну вычислительную систему. Однако добиться такой целостности работы элементов, как в случае cc-NUMA, все равно не удается.

Переориентированные супер-компьютеры стоят в несколько раз дешевле, чем сравнимые по вычислительной мощности мейнфреймы, в том числе и в аспектах гарантийного и сервисного обслуживания. Тем не менее, несмотря на все усилия и успехи разработчиков они все еще гораздо менее надежны.

Соответственно, изначально и Altix, и Superdome, и другие суперкомпьютеры не были рассчитаны на отказоустойчивость уровня мейнфреймов, и принимать меры к повышению надежности пришлось уже по мере развития — с помощью дополнительно разрабатываемых программных и аппаратных «заплаток».

Чтобы не потерять суть вышесказанного, подведем краткий итог, собрав некоторые важные параметры систем обработки данных всех рассмотренных типов в сравнительную таблицу. По каждому из критериев системы сравниваются между собой, оценка является эмпирической и усредненной, полученной путем анализа мнений экспертов и доступной информации.

Желание централизовать обработку и хранение информации, с одной стороны, и нежелание платить за это слишком дорого, с другой, постоянно стимулируют развитие концепции ЦОД именно на базе открытых стандартов. Пускай еще не все здесь идеально. Но, справедливости ради, стоит отметить, что современные CISC- и Unix-серверы при грамотном подходе могут обеспечить отказоустойчивость на уровне 99,999 (которой более чем достаточно для 99,999% компаний), а эффективность использования их ресурсов, благодаря технологиям виртуализации, повышается. Совершенствуются каналы связи, протоколы управления, да и сами методы обработки информации. Тем не менее, всегда найдутся компании, готовые переплатить за возможность использовать в своей информационной среде сверхнадежные и производительные системы, репутация которых проверена десятилетиями безупречной работы.

 

Игорь КИРИЛЛОВ

igor@sib.com.ua,

СиБ

 

В чем прелесть мейнфрейма?

 

 

Основной технической особенностью мейнфрейма является возможность использования процессоров, накопителей и периферийных устройств несколькими виртуальными серверами одновременно (более сорока лет эта особенность являлась уникальной и лишь в начале XXI века «перекочевала» на серверы других типов). В рамках одной физической системы могут работать сотни и даже тысячи виртуальных серверов, каждый из которых будет иметь свою операционную систему и приложения, при этом серверы не будут влиять на работу друг друга (если это не предусмотрено политиками управления). Таким образом, сбой одного «сервера» никак не повлияет на работу остальных, позволяя реализовать множество отказоустойчивых решений в рамках одной физической системы. Аппаратные ресурсы — процессоры, накопители, интерфейсы ввода/вывода, каналы связи — с помощью специальных средств разделяются между виртуальными серверами и могут, по мере необходимости, динамически перераспределяться. Скажем, один физический процессор способен обслуживать десятки виртуальных машин.

Но главное, в отличие от всех других вычислительных комплексов, загруженность процессоров мейнфрейма может достигать 80–90% (а в некоторых случаях и выше). Для сравнения, RISC-серверы нормально работают при 20–30% загрузке процессоров (при этом нагрузка в 50% часто считается пиковой), а системы х86 — и того ниже. Еще одной особенностью мейнфрейма является одновременное использование в одном комплексе не только центральных процессоров общего назначения, но и специализированных чипов, например, для обработки Java-приложений или баз данных. К тому же имеется специальный криптопроцессор, отвечающий за безопасность и кодирование/декодирование данных.

Поскольку все коммуникации находятся внутри мейнфрейма, это ускоряет процесс передачи данных между виртуальными серверами (в отличие от обычных аппаратных серверов, где обмен информацией происходит через внешние коммуникационные каналы). К тому же, среднее время наработки на отказ такой системы составляет 12–15 и более лет. Физическая надежность мейнфреймов обеспечивается за счет дублирования всех важнейших элементов: процессоров, микросхем памяти, жестких дисков, внутренних шин и каналов связи, путей доступа к периферийным устройствам и т.д.

Вычислительной основой мейнфрейма является PSB (Physical System Board, вполне официально иногда называемая «книжкой») — аппаратная плата с установленными на ней процессорами, платами оперативной памяти, интерфейсами ввода/вывода и т.д. В отдельной системе, как правило, устанавливается от одной до четырех таких «книжек» (до двадцати процессоров на каждой).

До 32 мейнфреймов могут объединяться в особый кластер, способный работать как единая система, — Sysplex (SYStem comPLEX), или GeoPlex, если такой кластер будет географически распределенным. Подключение пользователей к мейнфрейму происходит по принципу «тонкого» клиента, когда персональный терминал является только средством ввода и отображения, но не обработки данных. Компании-производители разрабатывают для мейнфреймов специальные процессоры и операционные системы. В числе самых распространенных ОС — zOS и Linux for zSeries (IBM), BS2000 (Fujitsu), Solaris (Sun Microsystems), VM/ESA, VSE, zTPZ и другие.

Что касается производителей, то их в эпоху рассвета мейнфреймов, которая продолжалась с 60-х по 90-е годы, в мире насчитывалось более десятка, в том числе: Amdahl, Burroughs, Control Data, DEC, Fujitsu, IBM, Hitachi, Sperry, Sun Microsystems, Unisys, Wang и другие. Но сегодня заметные позиции занимают только три — IBM, Fujitsu и Hitachi.

 

 

Интересные факты «из жизни» мейнфреймов

• Один современный мейнфрейм с полной загрузкой может весить более двух тонн при площади опоры менее 3 кв. м. Это стоит учитывать при подготовке помещения ЦОД.

• Знаменитые советские ЕС ЭВМ (Единая система электронных вычислительных машин) – не что иное, как «клоны» мейнфреймов IBM System/360 и System/370.

• В одном из отчетов Gartner фигурировал прогноз того, что последний мейнфрейм будет выключен в 1993 году, но, как видим, этого не произошло до сих пор и, судя по объему рынка (который последние несколько лет, как минимум, не падает) произойдет еще не скоро.

• На сегодняшний день в мире, по разным данным, работает более 30 тыс. различных мейнфреймов.

 

 

 

№ 1 (март) 2009