Подписаться  на наше издание быстро и дешевле чем где-либо Вы можете прямо сейчас! Подписаться!

 

 

Появившаяся недавно поддержка RAID-массивов в популярных чипсетах позволила повысить технологичность собираемых кустарно серверов начального уровня. Вашему вниманию предлагается исследование производительности RAID-массивов уровней 0,1,10,0+1 и 5, построенных на интегрированных в южные мосты контроллерах от Intel и nVidia.


Вообще говоря, сервер – это не просто железо. Можно даже утверждать, что сервер – это комплексное решение, предназначенное для обеспечения гарантированного уровня доступности данных или сервисов. И в обеспечении этого уровня большую роль играют сервис и поддержка этого решения со стороны продавца.

 

Под серверами "совсем" начального уровня мы подразумеваем самодельный или не серийно собранный сервер, основу которого составляют обычные компоненты ПК. Формально это просто мощный ПК, который в силу определенных обстоятельств временно используется вместо сервера. При создании такого сервера основная проблема – построение быстрой и надежной дисковой подсистемы. Дело в том, что дисковые подсистемы ПК по производительности значительно уступают всем остальным его компонентам. А по ненадежности с HDD могут сравниться только блоки питания и вентиляторы.


В "настоящих" серверах эти проблемы (помимо подбора качественных комплектующих) решаются с помощью RAID-технологий, или созданием массивов из дисков (RAID – Redundant Array of Independent Disks – "избыточный массив независимых дисков"). В последнее время, когда средства для построения RAID-массивов были включены в массовые чипсеты, эти технологии стали доступны и в обычных ПК.


Рассмотрим скоростные характеристики для уровней RAID, позволяющих восстановить раздел после выхода из строя одного из винчестеров. Это RAID уровней 1, 10, 0+1 и 5.


Тестовые платформы и методика


Поддержку RAID можно встретить в чипсетах от ATI, Intel, nVidia, SiS, ULi и VIA, однако вышеперечисленные уровни поддерживают только южный мост Intel ICH7R и южный мост nVidia из семейства nForce4. Поэтому будут рассмотрены только две эти платформы. Остальные параметры наших тестовых систем указаны в таблице:

 

 

Тестовые платформы были запитаны от БП ATRIX 500T, предоставленного компанией "SVEN Украина".


Разрешение экрана для тестовых систем было установлено на 1280х1024х32 бит.


Параметр stripe size для обоих контроллеров RAID-уровней 10/0+1 и 5 одинаков и составляет 64 Кб.

 

Каждый из чипсетов поддерживает большое количество вариантов построения массивов RAID 1, 0, 10, 0+1 и 5, однако нами были протестированы только наиболее "серверные" варианты. Массив RAID 1 тестировался в двухдисковой конфигурации, RAID 10/0+1 – в четырехдисковой, а RAID 5 – в трех- и четырехдисковой. Также для сравнения было произведено тестирование и одиночного винчестера.


stripe – это непрерывная последовательность дисковых блоков. stripe может быть размером с один дисковый блок, а может состоять из тысяч. Устройства RAID разграничивают содержащие их разделы дисков на stripe-ы; различные уровни RAID отличаются тем, как они организуют stripe-ы и как данные размещаются на них. Взаимодействие между размером stripe-ов, типичными размерами файлов в системе и их положением на диске определяет общую производительность подсистемы RAID.

 

Время загрузки системы


При тестировании времени загрузки измерялось время от включения и до полной загрузки операционной системы. Понятно, что на разных платформах время загрузки зависит в основном от Bios, и особенно от POST-процедуры.

 

 

Надо отметить, что результаты измерений приводятся для того, чтобы показать: на скорость загрузки наличие RAID-массивов в основном не влияют.


Время перестройки массива


Если предыдущий параметр с практической точки зрения не так интересен, то время перестройки массива после выхода из строя и замены одного из дисков – характеристика очень важная. Фактически она определяет минимальное время восстановления самодельного сервера после сбоя дисковой подсистемы.

 

 

Таким образом, RAID 5 быстрее перестраивается на платформе Intel, а зеркалирование быстрее восстанавливает чипсет nVidia.

 

IOMeter: RAID 1


Стоит подчеркнуть, что в тестирование входили тесты на зависимость от нагрузки двух параметров – интенсивности транзакций и скорости отклика дисковой подсистемы. Все измерения производились с помощью Intel IOMeter v2004.07.30. Слово Intel в названии этой программы не должно смущать: тест спонсируется компанией Intel, но разработка этого бенчмарка ведется открытым сообществом на SourceForge. Доступны также исходники программы. Кроме того, это единственная программа, которая умеет корректно эмулировать многозадачную нагрузку путем создания множества тестовых псевдопользователей.

 

 


Поскольку речь идет о тестировании дисковой подсистемы сервера начального уровня, из всего множества типовых нагрузок (workload) IOMeter были выбраны только две – File Server и Web Server. Достаточно интересна также нагрузка Database, но работа с базами данных на RAID-массивах в большой степени зависит от параметра strip size, учет которого как минимум утроит количество тестовых данных.


Зависимости интенсивности транзакций и скорости отклика от нагрузки для обоих чипсетов при работе на RAID 1 приведены в диаграммах 1 и 2 соответственно. Эти диаграммы показывают, что отработка транзакций чипом Intel ICH7R возрастает практически линейно при любом увеличении нагрузки, во всяком случае, мы увеличивали ее во всех тестах до 128 клиентов, и даже до 256 – тенденция сохраняется. Для nVidia nForce4 приемлемым уровнем нагрузки является всего 16 клиентов. Правда, на практике с сервером одновременно работают не более 30% пользователей, поэтому такой сервер сможет обслужить около 50 пользователей.


Что касается времени отклика, то на RAID 1 у обоих чипов оно растет экспоненциально в зависимости от нагрузки. Если учесть, что субъективным порогом приемлемости отклика считается задержка не более трех секунд, то для обоих чипсетов максимальная нагрузка – 64 клиента.


Сопоставляя данные по интенсивности запросов и времени отклика, можно сделать следующие выводы относительно RAID 1: сервер, построенный на чипсете nVidia nForce4, сможет достаточно качественно обслуживать до 16 активных пользователей, а построенный на Intel ICH7R (при всех прочих равных условиях) – до 64.


IOMeter: RAID 10/0+1


Наиболее простой путь увеличения производительности дисковой подсистемы – это применение RAID 0, в котором дисковые блоки (stripes) чередуются на нескольких физических дисках. В результате при обращении к такому массиву разные блоки файла считываются разными винчестерами параллельно, что позволяет значительно увеличить пропускную способность дисковой памяти и уменьшить время доступа к ней. По результатам тестирования эффективности RAID 0 (см. "К+П" №4 2005) в реальных приложениях, активно использующих дисковую память (ACDSee PowerPack 5.0, Adobe Premiere 6.5, Ahead Nero 6.0.0.3, WinZip 8.1), прирост общесистемной производительности составляет от 5 до 10%. А при использовании RAID 0 вместе с "1С:Предприятие 8.0" (см. "К+П" №11 2004) прирост производительности может составить до 31%.

 

 


Вместе с тем в RAID 0 есть один существенный недостаток. Этот массив не предполагает никакой избыточности, а потому уменьшает общую надежность системы. Отказ одного диска уничтожает весь раздел, поэтому RAID 0 "в чистом виде" в серверах не применяется. Применяются его модифицированные варианты – RAID 10 (в котором дисковые блоки чередуются через один, и обе последовательности хранятся на парах зеркальных дисков) и RAID 0+1 (где информация сначала зеркалируется, а потом обе копии хранятся на двух массивах RAID 0). В Intel ICH7R реализован RAID 10, а в nVidia nForce4 – RAID 0+1.


Очевидные достоинства обоих вариантов – высокая производительность, очевидный недостаток – такая же, как у RAID 1, удвоенная избыточность. Особой же разницы между 10 и 0+1, в принципе, нет.


Зависимости интенсивности транзакций и скорости отклика от нагрузки для обоих чипсетов при работе на RAID 10/0+1 приведены в диаграммах 3 и 4 соответственно. По ним можно сделать вывод, что при малых нагрузках (1–2 клиента) nVidia nForce4 работает чуть быстрее, чем Intel ICH7R, но если клиентов восемь и более, его производительности явно недостаточно. Что же касается скорости отклика, то при нагрузках вплоть до 64 клиентов она вполне допустима для обоих чипсетов, а в случае с Intel ICH7R – до 128 клиентов.


Если сопоставить показатели интенсивности запросов и времени отклика, то в отношении RAID 10/0+1 можно сделать следующие выводы: сервер, построенный на чипсете nVidia nForce4, сможет достаточно качественно обслуживать до 16 активных пользователей, а основанный на Intel ICH7R (при всех прочих равных условиях) – до 128.

 

IOMeter: RAID 5 на трех HDD


Как уже говорилось, основной недостаток RAID 10/0+1 – это двойная избыточность, то есть половина всего дискового пространства уходит на дублирование информации. Значительно экономнее использует диски RAID 5, который циклически чередует дисковые блоки и контрольную информацию на всех доступных винчестерах. При этом чем больше дисков, тем меньше удельный объем контрольных блоков, и, соответственно, больше полезного объема. Минимальное количество HDD, на которых можно построить RAID5, – три диска. При этом емкость подобного раздела будет равна разделу RAID 10/0+1 на четырех таких же дисках. Экономия очевидная, но ничего бесплатного не бывает. Расчет контрольных блоков и их чередование с информационными блоками требует вычислительных мощностей и памяти. Отражается это и на производительности. Без специализированного контроллера на хорошую производительность рассчитывать не приходится.

 

 


Зависимости интенсивности транзакций и скорости отклика от нагрузки для обоих чипсетов при работе на трехдисковом RAID 5 приведены в диаграммах 5 и 6 соответственно. Эти диаграммы позволяют сделать вывод, что при малой нагрузке (1, 2 и 4 клиента) оба чипа работают примерно одинаково, затем nVidia nForce4 сразу "умирает", а Intel ICH7R нормально отрабатывает 32 клиента, и только потом начинает притормаживать. Надо сказать, это первый тест, который показал, что возможности чипа Intel не безграничны, хотя до 64 одновременных запросов его производительность еще растет. А это почти две сотни пользователей в реальных условиях, чего достаточно для сервера начального уровня.


Данные об интенсивности запросов и времени отклика говорят о том, что при использовании трехдискового массива RAID 5 сервер, построенный на чипсете nVidia nForce4, сможет качественно обслуживать до 8 активных пользователей, в то время как построенный на Intel ICH7R (при всех прочих равных условиях) – до 64.


IOMeter: RAID 5 на четырех HDD


Если рассмотренный ранее RAID 5 на трех дисках – это, скорее, пример минимализма, то использование четырехдискового массива – это уже более оптимальное решение. Такой массив хранит на 50% больше информации, чем RAID 10/0+1 на этих же HDD, и работает быстрее, чем трехдисковый массив.

 

 


Зависимости интенсивности транзакций и скорости отклика от нагрузки для обоих чипсетов при работе на четырехдисковом RAID 5 приведены в диаграммах 7 и 8 соответственно. Можно констатировать, что в целом они работают аналогично трехдисковому решению, но немного быстрее и по интенсивности транзакций, и по скорости отклика. Учитывая в полтора раза больший объем, это очень хорошо (правда, RAID 10/0+1 работал быстрее).


Общий итог тот же: сервер с nVidia nForce4 сможет качественно обслуживать до 8 активных пользователей, а с Intel ICH7R (при прочих равных условиях) – до 64.

 

IOMeter: CPU utilization


Помимо скоростных показателей, в IOMeter также измерялась загрузка процессора во всех тестах. Надо сказать, что во всех тестах она не превышала 1%. Правда, было исключение: показатель CPU utilization составил меньше 1,5% в комбинации Intel ICH7R и RAID 10. Признаться, это достаточно неожиданные цифры, поскольку мы ожидали большей загрузки процессора, особенно в RAID 5.

 

 


Относительная производительность RAID-массивов


Помимо сравнения скоростей чипсетов при работе с разными уровнями RAID, хотелось бы также отметить, насколько меняется производительность каждой системы при использовании различных RAID. Рассмотрим самые показательные результаты тестирования Intel ICH7R в наиболее тяжелом для файловой системы тесте File Server. Результаты тестирования с помощью этой типовой нагрузки приведены в диаграммах 9 и 10. Первая диаграмма показывает зависимость интенсивности транзакций от числа одновременных запросов, а вторая – скорость отклика в соответствии с числом одновременных запросов.


Что касается интенсивности транзакций, то даже RAID 1 работает значительно быстрее одиночного винчестера, а абсолютный чемпион производительности – RAID 10, который работает как минимум в полтора раза быстрее всех остальных. RAID 5 в обеих реализациях показывает производительность чуть большую, чем у RAID 1, и их несомненное преимущество – большая емкость получаемых разделов.

 

Что работает быстрее?


Надо сказать, что компания Intel не только давно выпускает процессоры с Hyper-Threading (а с недавнего времени и многоядерные) и пропагандирует "правильное" многопоточное программирование. К тому же она всерьез проработала готовность всей платформы в комплексе к применению "правильного" многопоточного ПО. В обычных тестах (с "игровыми попугаями") этого не видно, а вышеописанный IOMeter – один из немногих, кто может это продемонстрировать.


Десктопные платформы от Intel к многопоточности, и, следовательно, к многоядерности готовы. При этом запасов производительности хватает даже для таких "не десктопных" применений, как обслуживание большого числа независимых запросов. Проще говоря, они годятся для создания почти настоящих самодельных серверов. Что касается конкурентов, то здесь может идти речь, например, о выделенном вычислительном ПК для решения специальных, в основном вычислительных, задач. Но раздавать такой ресурс многим потребителям не удастся.


И все-таки сегодня при фактически немногозадачном окружении nVidia nForce4 в некоторых режимах будет работать быстрее. И что интересно – быстрее будет работать в RAID 5.

2006.08.22
19.03.2009
В IV квартале 2008 г. украинский рынок серверов по сравнению с аналогичным периодом прошлого года сократился в денежном выражении на 34% – до $30 млн (в ценах для конечных пользователей), а за весь календарный год – более чем на 5%, до 132 млн долл.


12.03.2009
4 марта в Киеве компания Telco провела конференцию "Инновационные телекоммуникации", посвященную новым эффективным телекоммуникационным технологиям для решения задач современного бизнеса.


05.03.2009
25 февраля в Киеве компания IBM, при информационной поддержке "1С" и Canonical, провела конференцию "Как сохранить деньги в условиях кризиса?"


26.02.2009
18-19 февраля в Киеве прошел юбилейный съезд ИТ-директоров Украины. Участниками данного мероприятия стали ИТ-директора, ИТ-менеджеры, поставщики ИТ-решений из Киева, Николаева, Днепропетровска, Чернигова и других городов Украины...


19.02.2009
10 февраля в Киеве состоялась пресс-конференция, посвященная итогам деятельности компании "DiaWest – Комп’ютерний світ" в 2008 году.


12.02.2009
С 5 февраля 2009 г. в Киеве начали работу учебные курсы по использованию услуг "электронного предприятия/ учреждения" на базе сети информационно-маркетинговых центров (ИМЦ).


04.02.2009
29 января 2009 года в редакции еженедельника "Computer World/Украина" состоялось награждение победителей акции "Оформи подписку – получи приз!".


29.01.2009
22 января в Киеве компания "МУК" и представительство компании Cisco в Украине провели семинар для партнеров "Обзор продуктов и решений Cisco Small Business"

 

 
 
Copyright © 1997-2008 ИД "Комиздат".