Подписаться  на наше издание быстро и дешевле чем где-либо Вы можете прямо сейчас! Подписаться! 


Компания Intel разработала новый процессор Core. Результаты тестирования первых образцов действительно впечатляют. Засекреченные до недавнего времени технологии теперь обнародованы, в чем же секрет столь высокого прироста производительности?

С 7 ПО 9 МАРТА 2006 ГОДА в Сан-Франциско (США) проходил очередной Форум "Интел" для разработчиков (Intel Developer Forum — IDF). Главный технический директор компании "Интел" Джастин Раттнер (Justin Rattner) назвал это мероприятие самым значимым с момента появления форумов (они проводятся с 1997 года).

Каждый Форум "Интел" имеет свою тематическую направленность. Темой весеннего IDF стало новое ядро микропроцессоров — Intel Core. Особое внимание уделялось деталям микроархитектуры следующего поколения Intel (Next-Generation MicroArchitecture — NGMA) многоядерных процессоров. Новое поколение CPU будет не только быстрее предыдущего, но и значительно экономичнее и "холоднее". На основе архитектуры Intel Core будут построены три варианта процессоров для различных сфер применения: Conroe для настольных ПК, Merom для мобильных систем и Woodcrest для серверов и рабочих станций начального уровня. Процессоры на базе Intel Core для всех категорий устройств будут производиться по технологии 65 нм, которая сегодня применяется для изготовления мобильных чипов платформы Napa (Core Solo и Core Duo). Три модели CPU технически почти идентичны, но каждая из них благодаря включению или отключению ряда функций и настройке некоторых блоков будет оптимизирована для определенного сегмента. На данном этапе гонка за гигагерцами прекращается. Высокие тактовые частоты будут только в топовых настольных ПК и серверах. Основное внимание уделено высокой эффективности, независимой от тактовой частоты, которая достигается повышением пропускной способности и ширины конвейера (именно ширины, а не длины).


Ожидается, что процессор с кодовым наименованием Conroe сможет обеспечить производительность примерно на 40% большую и энергопотребление на 40% меньшее, чем у процессора Intel Pentium D 950. Серверный Woodcrest будет на 80% производительнее  двухъядерного Xeon 2,8 ГГц с 2 х 2 Мб кэша L2, потребляя при этом на 35% меньше энергии. Мобильный Merom будет на 20% быстрее своего двухъядерного предшественника Yonah, а его энергопотребление останется на том же уровне. Неправда ли некоторые цифры впечатляют? Именно поэтому Intel решила обнародовать большое количество технических деталей новой микроархитектуры.


Выход первых процессоров с кодовыми названиями Conroe и Woodcrest ожидается в 3-м квартале 2006 года. Мобильный Merom запланирован на последний квартал этого года. Практически все ныне существующие системы на основе платформы Napa способны поддерживать процессоры Merom (потребуется лишь обновить BIOS). Поэтому Intel еще  называет новый процессор "обновлением Napa". Полная же замена Napa (которая была представлена в январе 2006 года) на новую платформу под кодовым названием Santa Rosa ожидается в первой половине 2007 года.


Анонсированы максимальные термальные пакеты (TDP, thermal design power) для каждой серии CPU: Merom – 35Вт, Conroe – 65Вт, Woodcrest – 80Вт. Однако возможны и менее прожорливые вариации. Например, модель LV Woodcrest (предназначенная для использования в blade-серверах) за счет уменьшения тактовой частоты будет иметь 40Вт TDP.


Результаты тестирования первых образцов CPU, построенных на основе новой микроархитектуры, оказались если не фантастическими, то очень неожиданными. Хотя, наверное, не для компании Intel. При относительно невысокой тактовой частоте и совсем малой рассеиваемой мощности процессор Core Duo T2500 по производительности почти не уступает самым старшим экстремальным CPU (Intel Pentium Extreme Edition 955 и AMD Athlon 64 FX-60), а в некоторых тестах даже опережает. В чем секрет таких результатов? Проанализируем архитектуру нового ядра и попытаемся ответить на этот вопрос.

 

Энергопотребление


Итак, последние процессоры Pentium 4 и Pentium D потребляют больше энергии, чем их аналоги производства AMD: Athlon 64 и Athlon 64 X2. А следовательно это влечет за собой и более высокие требования к системе охлаждения, и, естественно, увеличение затрат на электроэнергию. Для отдельно взятых домашних ПК это не очень существенно. Но для организаций, в которых используются сотни или тысячи компьютеров этот критерий может оказаться определяющим при выборе оборудования.


У компании Intel уже были довольно успешные разработки процессоров с низким энергопотреблением (речь идет о Pentium M и Core Duo на ядре Yonah). Можно было бы развивать это направление. Но в Intel решили построить полностью новый процессорный дизайн. Микроархитектура Intel Core базируется в основном на процессоре Pentium M и его непосредственном предке Pentium III, но добавилось и много нового.


В частности, компания Intel ввела новый параметр для оценки эффективности процессора: "количество энергии на инструкцию" (Energy per Instruction, EPI). Теперь основной целью при разработке новой микроархитектуры стало как можно меньшее значение EPI. То есть неважно, какая тактовая частота процессора, какой длинны конвейер, наличие встроенного контроллера памяти. Важно, чтобы CPU обеспечивал максимальную производительность (выполнение максимального количества команд) при минимальном энергопотреблении.

 


С развитием процессоров показатель EPI в процессе эволюции процессоров постоянно возрастал (см. рисунок). Как видим, в процессорах Pentium M и Core Duo удалось достичь низкого уровня энергопотребления на инструкцию, сопоставимого с EPI первого Pentium’а.


Также важную роль в уменьшении энергопотребления сыграл переход на 65-нм техпроцесс, который, по данным Intel, позволяет на 20% ускорить транзисторы и затрачивая при этом на 30% меньше энергии по сравнению с 90-нм технологией производства.

 

Микроархитектура Core


Новая микроархитектура Intel Core имеет пять ключевых нововведений:

  1. Intel Wide Dynamic Execution (Широкое динамическое исполнение). Эта технология позволяет каждому ядру процессора выполнять параллельно за один такт до четырех инструкций. В дополнение к существовавшей ранее функции Micro-fusion (слияние микроопераций) появилась новая – Macro-fusion (слияние макроопераций), позволяющая объединить в одной инструкции некоторые часто используемые инструкции x86.
  2. Intel Intelligent Power Capability (Интеллектуальная система управления энергопотреблением). Активирует отдельные логические подсистемы только по мере необходимости.
  3. Intel Advanced Smart Cache (Улучшенный «умный» кэш). Использование общего, динамически разделяемого между ядрами, кэша 2-го уровня.
  4. Intel Smart Memory Access ("Умный" доступ к памяти). Эта технология повышает производительность системы, сокращая время отклика памяти и оптимизируя использование пропускной способности подсистемы памяти. Включает функцию memory disambiguation (устранение неоднозначности при работе с памятью), которая служит для повышения эффективности спекулятивных вычислений (загрузка данных для инструкций, которые могут быть исполнены до завершения всех предыдущих инструкций записи).
  5. Intel Advanced Digital Media Boost (Улучшенная работа с цифровым медиа-содержанием). Технология позволяет обрабатывать все 128-разрядные команды SSE, SSE2 и SSE3, широко используемые в мультимедийных и графических приложениях, за один такт. Таким образом, скорость их выполнения удваивается по сравнению с предыдущим поколением процессоров.

А теперь рассмотрим эти инновации более подробно.

 

Широкое динамическое исполнение


Технология широкого динамического исполнения подразумевает четыре параллельных процесса (ранее было три), то есть налицо внутреннее увеличение пропускной способности. Помимо этого улучшена эффективность работы с микрооперациями (micro-ops) – функция Micro-fusion, которая направлена на снижения их общего числа. Напомним, что микрооперации являются результатом разделения команд x86 на более мелкие инструкции, понятные процессору. С помощью Micro-fusion определенные две микрооперации могут быть сложены в одну, тем самым достигается экономия, как времени выполнения, так и затрачиваемой энергии. По данным Intel, примерно каждая десятая инструкция может быть объединена с другой. Функция Micro-fusion была реализована еще в процессоре Pentium III, а в состав новой микроархитектуры вошла ее усовершенствованная версия.


Появилась новая функция Macro-fusion, которая работает по тому же принципу что и Micro-fusion, но объединяются не микрооперации, а команды x86. Оба механизма слияния дают возможность существенно увеличить количество выполняемых операций, а, следовательно, повысить эффективность работы каждого ядра.

 

Интеллектуальная система управления энергопотреблением

 

Помимо снижения количества энергии в расчете на инструкцию существуют и другие механизмы экономии энергии. Технология Enhanced SpeedStep как и ранее позволяет снижать тактовую частоту процессора, если нагрузка на систему невелика. В новой архитектуре появилась возможность управлять каждым ядром по-отдельности. Переход техпроцесс 65 нм позволит создавать более эффективные по энергопотреблению микросхемы. Технология Intelligent Power Capability обеспечивает функционирование подсистем процессора по принципу «нужное включаем», то есть активизируется только те блоки, которые необходимы в текущий момент. Помимо этого, разные блоки процессора могут получать разное напряжение. Также появилась возможность отключать неиспользуемую часть кэша.

 

Улучшенный "умный" кэш

 

В новой микроархитектуре Intel Core два ядра совместно используют общий кэш второго уровня. Такая организация является более эффективной, поскольку одинаковые данные для разных ядер не нужно хранить по два раза в отдельных кэшах L2. Кэш динамический и способен подстраиваться под нагрузку каждого ядра. Например, в какой-то момент времени одно ядро может динамически забрать весь объем. Использование большого (удвоенного) кэша позволяет свести к минимуму обмен данными с памятью, и тем самым повысить производительность.

 

"Умный" доступ к памяти

 

Улучшенная предварительная выборка


Каждый двухядерный процессор на основе архитектуры Intel Core оснащен восемью блоками предварительной выборки (prefetch). По два блока выборки данных и одному блоку выборки инструкций на ядро, а также два блока выборки в общем кэше второго уровня. По заверениям разработчиков, блоки можно оптимизировать для каждой из трех моделей двухъядерных процессоров: Merom, Conroe и Woodcrest. В результате чего предварительная выборка будет по-разному выполняться для сегментов мобильных, настольных или серверных вычислений.


Блок предварительной выборки предоставляет данные вышестоящим блокам, руководствуясь сложными алгоритмами предсказания, которые постоянно совершенствуются в процессе развития процессоров. Блок prefetch должен запросить данные из оперативной памяти, которые с наибольшей вероятностью будут использоваться в ближайшем времени, что позволит снизить задержки и повысить эффективность системы. Соответствующие данные передаются в кэш второго уровня.

 

Устранение неоднозначностей памяти


Часто случаются такие ситуации, когда, например, инструкции чтения (load) ждут окончания выполнения других инструкций, хотя не имеют с ними ничего общего. Просто из-за того, что команды должны выполняться строго по порядку. Блок устранения неоднозначностей памяти выбирает операции чтения, которые не зависят от других операций записи (store), и позволяет выполнить их раньше (см. рис). Эта процедура дает возможность максимально эффективно нагрузить конвейер процессора. Блок устранения неоднозначностей памяти также как и блоки предварительной выборки позволяет немного компенсировать влияние больших задержек памяти.

 

Улучшенная работа с цифровым медиа-содержанием

 

В предыдущих поколениях процессоров АЛУ (арифметическо-логическое устройство) обычно разбивало инструкции на два блока, что приводило к двум микрооперациям и, соответственно, двум тактам выполнения. В новой микроархитектуре увеличили ширину выполнения АЛУ до 128 бит (для сравнения, процессоры Yonah и Pentium 4 имели 64-битные АЛУ). Кроме того, увеличилось и количество таких АЛУ с двух (процессоры Yonah и Pentium 4) до трех. Это позволило обрабатывать за один такт восемь блоков с одинарной точностью или четыре блока с двойной точностью. Данная функция была названа улучшенной работой с цифровым медиа-содержанием (Advanced Digital Media Boost), поскольку она непосредственно касается инструкций SSE.


Эта технология должна оказать ощутимое влияние на скорость обработки видео- и аудио-файлов.

 

Контроллер памяти

 

В отличие от CPU производства AMD процессор на основе микроархиитектуры Intel Core по-прежнему использует системную шину (FSB), а контроллер памяти встроен в северный мост. Путь данных от процессора к памяти относительно длинный и вносит свою задержку. Встроенный в процессор контроллер памяти, такой как у AMD Athlon 64, работает более эффективно.


Но есть у такой реализации и свои минусы. Контроллер памяти в северном мосту улучшает гибкость решений, ведь в таком случае платформу и процессорную архитектуру можно обновлять независимо друг от друга. Вдобавок к этому, встроенный графический адаптер, который использует ресурсы ОЗУ, лучше работает, если контроллер памяти находится в северном мосту.


Также в двух или более сокетных системах появляется проблема согласования (когерентности) контроллеров памяти, в то время как в платформах Intel управлением ОЗУ занимается один блок. Помимо этого, с интегрированным контроллером памяти процессор нельзя перевести в самые экономичные режимы, а это дополнительное энергопотребление.

 

Новые преимущества


Стоит признать, что инженеры Intel разработали очень добротную микроархитектуру. Предком Intel Core можно считать процессоры Pentium III и Pentium M, то есть микроархитектуру, которая своими корнями уходит в 1995 год и началась еще с Pentium Pro. Однако процессор Pentium M имел некоторые недостатки, такие как невысокий потенциал роста тактовой частоты и отсутствие 64-битного режима EM64T, устранение которых требовало значительной переделки внутренних блоков. Новая микроархитектура поддерживает 64-битные вычисления, а относительно невысокие тактовые частоты компенсируются большим количеством операций за такт. Какая разница, на какой частоте работает процессор, если за счет эффективной внутренней организации он способен обгонять конкурентов. Высокая тактовая частота была важна для микроархитектуры NetBurst (Pentium 4) с длинным конвейером. Можно предположить, что NetBurst еще не сказала своего последнего слова и ее время еще придет.


Подытожим основные достоинства новой микроархитектуры. Каждое ядро процессора может выполнять параллельно за один такт больше инструкций нежели предшественники. Наряду с увеличением общей производительности удалось значительно уменьшить энергопотребление. Общий кэш 2-го уровня позволяет производить более эффективный обмен данными между ядрами, не нагружая при этом процессорную шину. Технологии, оптимизирующие работу с ОЗУ, благодаря которым компенсируется влияние на производительность невстроенного контроллера памяти и больших задержек. Улучшенная работа с цифровым медиа-содержанием – скорость выполнения 128-разрядные команд SSE, SSE2 и SSE3 удвоилась по сравнению с предыдущим поколением процессоров.


В теории — все замечательно, да и результаты тестов первых образцов оказались достаточно впечатляющими. Однако пока это была всего лишь демонстрация, и чтобы сделать окончательные выводы, надо дождаться выхода серийных устройств, который запланирован на третий квартал 2006 года. Посмотрим, что сможет противопоставить новой микроархитектуре компания AMD.

2006.05.12
19.03.2009
В IV квартале 2008 г. украинский рынок серверов по сравнению с аналогичным периодом прошлого года сократился в денежном выражении на 34% – до $30 млн (в ценах для конечных пользователей), а за весь календарный год – более чем на 5%, до 132 млн долл.


12.03.2009
4 марта в Киеве компания Telco провела конференцию "Инновационные телекоммуникации", посвященную новым эффективным телекоммуникационным технологиям для решения задач современного бизнеса.


05.03.2009
25 февраля в Киеве компания IBM, при информационной поддержке "1С" и Canonical, провела конференцию "Как сохранить деньги в условиях кризиса?"


26.02.2009
18-19 февраля в Киеве прошел юбилейный съезд ИТ-директоров Украины. Участниками данного мероприятия стали ИТ-директора, ИТ-менеджеры, поставщики ИТ-решений из Киева, Николаева, Днепропетровска, Чернигова и других городов Украины...


19.02.2009
10 февраля в Киеве состоялась пресс-конференция, посвященная итогам деятельности компании "DiaWest – Комп’ютерний світ" в 2008 году.


12.02.2009
С 5 февраля 2009 г. в Киеве начали работу учебные курсы по использованию услуг "электронного предприятия/ учреждения" на базе сети информационно-маркетинговых центров (ИМЦ).


04.02.2009
29 января 2009 года в редакции еженедельника "Computer World/Украина" состоялось награждение победителей акции "Оформи подписку – получи приз!".


29.01.2009
22 января в Киеве компания "МУК" и представительство компании Cisco в Украине провели семинар для партнеров "Обзор продуктов и решений Cisco Small Business"

 

 
 
Copyright © 1997-2008 ИД "Комиздат".