Intel Haswell. Знакомство с микроархитектурой

Автор: Dimm. Опубликовано в Обзоры, тесты производительности

Статьи, посвящённые микроархитектуре принципиально новых процессоров Intel, обычно начинаются с отсылки к принятой в компании с 2007 года модели разработки «тик-так». Суть ее заключается в том, что разработка новых процессорных дизайнов и перевод производства на более совершенные технологические нормы чередуются друг с другом. Прошлая микроархитектура, Ivy Bridge, в этой классификации была «тиком», новая же, Haswell, — это «так». То есть в лице Haswell, по идее, мы должны увидеть кардинально обновлённый изнутри процессор, но выпускаемый по уже привычной 22-нм технологии с трёхмерными транзисторами.

Именно поэтому с предстоящим выходом Haswell связаны такие большие ожидания. Рынок персональных компьютеров находится в застое. Конкуренция между производителями x86-процессоров в высокопроизводительном сегменте сошла на нет, а сами настольные компьютеры потихоньку сдают свои позиции под натиском мобильных устройств. Не исправило этой ситуации даже появление операционной системы Windows 8 — ей не только не удалось вернуть былой интерес к персональным компьютерам, более того, у многих адептов традиционных форм-факторов она вызвала стойкую неприязнь. И теперь все энтузиасты ждут революции от Intel, надеясь на качественный скачок, который бы несмотря ни на что пробудил интерес к потерявшей былую динамику платформе x86. Кто-то верит, что классические десктопы и ноутбуки могут вновь сделаться модной тенденцией, а кто-то ожидает, что появление новой линейки процессоров хотя бы подтолкнёт владельцев уже имеющихся систем к их модернизации. Иными словами, Haswell в глазах энтузиастов производительных персональных компьютеров — это чуть ли не последняя надежда на оживление близкого сердцу сегмента рынка.

Однако у Intel на этот счёт, похоже, мнение совсем иное. Остывание интереса к производительным персональным компьютерам чувствуют и в компании, но, с учитом сложившейся конъюнктуры, планируется не пытаться разогревать старые рынки, а взяться за завоевание новых. Корректировке подвергается вся генеральная линия. Intel не намерена продолжать активно бороться за честь традиционных и привычных многим систем, а вместо этого она хочет заниматься внесением изменений в архитектуру x86 и имеющиеся продукты с тем, чтобы приспособить их для тех классов мобильных устройств, которые находятся сейчас на пике популярности. Отчасти этой цели служат начавшиеся коренные преобразования в хозяйстве Atom: активное продвижение процессоров этого класса в смартфоны и планшеты, а также подготовка новой микроархитектуры Silvermont. Но параллельно метаморфозы будут происходить и с процессорной линейкой Core, которая по замыслу разработчиков должна стать ещё более мобильной. И Haswell — хотя уже не первая, но, наверное, самая заметная веха на этом пути.

Все презентации и материалы для прессы, посвящённые перспективным процессорам, на первых же страницах рассказывают нам о том, что Haswell в первую очередь нацеливается на ультрабуки и ультрапортативные ноутбуки-трансформеры, которые легким движением руки превращаются в планшеты. И это как нельзя лучше отражает ту цель, которая стояла перед разработчиками новой микроархитектуры. Если на этапе создания микроархитектур Sandy Bridge и Ivy Bridge инженеры работали над дизайном процессоров с целевым энергопотреблением 35–45 Вт, в то время как остальные варианты получались путём варьирования числа ядер, частоты и напряжения, то с Haswell требования по потреблению были ещё более ужесточены. Теперь Intel считает наиболее привлекательным диапазон от 15 до 20 Вт. Таким образом, Haswell — ярко выраженная ультрамобильная микроархитектура, стоящая по уровню производительности на ступень выше Atom. Что же до десктопных модификаций Haswell, то это для Intel — побочный продукт. Конечно, получить из экономичного процессора обычный гораздо проще, чем выполнить это преобразование в обратную сторону. Но снятие ограничений по энергопотреблению и тепловыделению отнюдь не означает беспрепятственное масштабирование производительности. Так что насколько оправдает ожидания Haswell в своей десктопной ипостаси — вопрос не столь очевидный.

И здесь уместным будет вспомнить предыдущий цикл «так», процессоры с микроархитектурой Sandy Bridge. Они по сравнению со своими предшественниками поколения Westmere смогли обеспечить лишь примерно 15-процентный прирост производительности в десктопной среде именно потому, что разработчики стали смещать свои акценты на соотношение производительности и энергопотребления. Сейчас же разговор ведется и вовсе на другом языке: главные сильные стороны Haswell, по мнению производителя, — это превосходная экономичность и принципиально новый уровень графического быстродействия. Что же касается вычислительной производительности, то Intel почему-то не акцентирует на ней внимание, что вызывает всякие нехорошие подозрения. Только усугубляющиеся, если посмотреть на предварительные данные о быстродействии десктопных Haswell, которые к настоящему времени уже просочились в прессу.

Ждать выхода процессоров, построенных на микроархитектуре Haswell, осталось совсем недолго. И через несколько дней мы сможем дать развёрнутые ответы на любые вопросы. Однако перед этим уместно будет ознакомиться с теорией — она должна стать хоть и неприятным, но необходимым противоядием от слишком радужных иллюзий, которые вполне могли сформироваться в тягостном ожидании чего-то новенького.

Микроархитектура Haswell: тик или так

Честно говоря, вводная часть чрезмерно сгущает краски. Да, микроархитектура Haswell во многом действительно может считаться высокоэнергоэффективной, и разрабатывалась она в первую очередь с прицелом на мобильные применения. Однако Intel всё-таки не забывает о том, что принятая в компании бизнес-модель предполагает использование единого дизайна в обширной линейке продукции, включающей мобильные, десктопные и серверные компоненты. Это значит, что под модным фасадом низкого энергопотребления скрывается прочный фундамент, позволяющий направить Haswell в разные рыночные ниши. Иными словами, новая микроархитектура не потеряла своей универсальности. Путём манипулирования числом ядер, версиями графического движка, целевым уровнем энергопотребления, размером кеш-памяти и добавлением того или иного набора внешних интерфейсов из Haswell могут получаться разные по своей сути процессоры.

Впрочем, если касаться собственно микроархитектуры, то да, в ней на первом месте стоят нововведения, направленные на оптимизацию тепловых и энергетических режимов. Изменений же, способных поднять производительность, не так много, и на цикл разработки «так» они если и тянут, то с большим трудом. Действительно, когда Intel выпускала Nehalem или Sandy Bridge, перестройка затрагивала не только внутренние блоки вычислительных ядер, но и базовую концепцию процессорного дизайна. Каждый «так» казался чем-то действительно принципиально другим, а от степени новаторства захватывало дух. Но если посмотреть на обобщённую схему Haswell, то её легко перепутать с предшественником — Ivy Bridge.

Все функциональные блоки и принципы их объединения в процессоре остались теми же. Haswell наследует из прошлого все удачные технологии: турборежим, Hyper-Threading, кольцевую шину, но ничего нового к этому багажу не добавляет. Изменения есть лишь в недрах отдельных узлов. Причём инженерное вмешательство в глубинные слои микроархитектуры не слишком значительно. Исполнительный конвейер изменился не слишком сильно, его протяженность составляет те же 14–19 стадий, что и раньше. Фронтальная часть получила лишь отдельные косметические усовершенствования, а все сколько-нибудь значимые перемены касаются лишь механизма исполнения инструкций и поддержки новых наборов команд. Говоря о том, является ли Haswell более производительной микроархитектурой, нежели Ivy Bridge, Intel ссылается на улучшение быстродействия до 20–30 процентов, но следует иметь в виду, что эта оценка включает и выигрыш от использования новых команд AVX2, для которых длительный и непростой этап внедрения ещё впереди.

Экономичность: всё ради неё

Зато шагов, сделанных для улучшения экономичности процессорного дизайна, — хоть отбавляй. Львиная доля усилий разработчиков была потрачена на снижение энергопотребления, и, надо сказать, с точки зрения мобильных систем усилия эти прошли далеко не впустую. Ожидается, что системы на базе Haswell смогут работать от батареи примерно на 50 процентов дольше, чем аналогичные конфигурации на базе Ivy Bridge. В простое выигрыш Haswell по сравнению с процессорами предыдущего поколения составляет порядка 2–3 раз! А в состоянии готовности к работе при сохранении сетевых соединений (connected standby) общее потребление платформы по сравнению с системами на базе Sandy Bridge снизилось примерно в 20 раз.

Столь впечатляющий прогресс своими корнями уходит не в простое совершенствование технологического процесса, который на самом деле имеет лишь эволюционные отличия от 22-нм техпроцесса с трёхмерными транзисторами, используемого для производства Ivy Bridge. И уж тем более дело не в банальном увеличении количества зон процессорного кристалла, которые при отсутствии активности могут независимо друг от друга отключаться от питающей шины. Конечно, всё это вносит определённый вклад в экономичность Haswell, но подобные изменения происходят с каждым новым поколением интеловских процессоров, а качественный скачок случился только сейчас. Так что секрет успеха — в другом.

Вкратце: новые рубежи экономичности были достигнуты благодаря комплексу мероприятий, проведённых не столько с самим процессором, сколько с платформой и инфраструктурой в целом.

Во-первых, важную роль сыграла общая интеграция компонентов платформы: в процессорный кристалл перекочевала значительная часть схемы преобразователя питания, а для ультрамобильных применений был спроектирован специализированный SoC-вариант процессора, содержащий на той же подложке второй кристалл — набор системной логики.

Во-вторых, Intel провела значительную работу с основными производителями контроллеров, указав им на необходимость качественной поддержки состояний сна и глубокого сна. Попутно разработчики рассчитывают, наконец, добиться от производителей дисплейных матриц поддержки функции Panel Self Refresh, позволяющей сохранять изображение на экране без его постоянного обновления со стороны графического ядра.

В-третьих, на руку сыграла и операционная система Windows 8, ядро которой гораздо рачительнее относится к обработке прерываний, по возможности стараясь избегать разрозненных транзакций, пробуждающих процессор или устройства.

И наконец, в-четвёртых, в Haswell появился новый набор ACPI-состояний сна S0ix, похожих по уровню энергопотребления на S3/S4 (когда в пассив отправляются все составляющие платформы за исключением системной памяти), но со временем перевода системы в полностью рабочее состояние на уровне нескольких миллисекунд. Кроме того, добавились также и новые состояния простоя процессора C7 и далее, достигаемые при видимой работоспособности системы, но при которых с основной части CPU может быть полностью снято питающее напряжение.

Однако всё перечисленное в первую очередь касается мобильных платформ и длительности их работы от батареи. В настольных системах большинство из этих нововведений также имеет место, но для конечных пользователей они практически безразличны. Что же их затрагивает самым непосредственным образом, так это появление в процессоре Haswell новых зон, работающих на различных частотах. В Ivy Bridge таких зон было две: вычислительные ядра (вместе с кешем и системным агентом) и графическое ядро. Но это оказалось не лучшим решением с точки зрения экономичности, так как обращения графики к данным в L3-кеше приводили к выходу из энергосберегающих состояний всего процессора. Поэтому в Haswell Uncore-часть, объединяющая системный агент и кеш третьего уровня, получила свою собственную независимую частоту.

И это — отнюдь не позитивное изменение, а яркая иллюстрация тех приоритетов, которых придерживались инженеры Intel при разработке их нового дизайна. Асинхронная работа Uncore и вычислительных ядер приводит к тому, что кеш третьего уровня в Haswell имеет большую латентность, нежели у процессоров предыдущего поколения. Иными словами, ради улучшения экономичности Intel готова даже откатывать сделанные ранее для увеличения производительности шаги.

Но зато все меры, предпринятые Intel для снижения энергопотребления, позволяют компании значительно расширить спектр предлагаемых энергоэффективных процессоров Core. В мобильном сегменте ожидается появление обширной и включающей порядка двух десятков наименований U-серии, с характерным расчётным тепловыделением порядка 15 Вт. Кроме того, нас ожидает и Y-серия с тепловыделением на уровне 6–7 Вт. Эти цифры кажутся особенно впечатляющими, если принять во внимание, что речь идёт о тепловыделении сборки, включающей помимо процессорного ядра и кристалл набора логики.

Для тех, кто хотел побыстрее

Но всё-таки, увлёкшись идеями по переориентации процессоров Core на ультрамобильные ноутбуки-трансформеры и производительные планшеты, Intel не забыла о том, чтобы немного подрихтовать самое сердце своих процессоров. Хотя вычислительные ядра Haswell очень похожи на ядра Ivy Bridge, в них всё-таки можно обнаружить некоторое количество улучшений. Правда, сделаны эти улучшения совсем не из стремления поднять чистую производительность — количество обрабатываемых за такт инструкций. Причина их появления — внедрение в обиход новых инструкций AVX2 и желание увеличить эффективность работы технологии Hyper-Threading, которая должна будет компенсировать невозможность использования четырёх полноценных ядер в низковаттных процессорах. Но, к счастью, у сделанных нововведений есть и положительные побочные эффекты.

Передняя часть исполнительного конвейера Haswell осталась практически нетронутой. Новая микроархитектура, так же как и её предшественники, заточена под обработку четырёх инструкций за такт. Блок выборки инструкций и декодер имеют именно такую ширину. Остался без изменений и кеш инструкций первого уровня объёмом 32 Кбайт, а также введённый ещё в Ivy Bridge кеш для декодированных инструкций на полторы тысячи микроопераций. Преимуществ на этом этапе у Haswell перед прошлым дизайном есть только два. Во-первых, благодаря происходящему при каждом релизе нового процессорного дизайна увеличению размера всех внутренних буферов возросла точность работы блока предсказания переходов. Во-вторых, очередь уже декодированных инструкций получила явную оптимизацию под Hyper-Threading: её деление на два потока стало происходить динамически.

Собственно, отсутствие изменений в базовых алгоритмах выборки и декодирования инструкций и является явным указанием на то, что рассчитывать на увеличение темпа обработки инструкций в Haswell особенно не стоит. Более четырёх (или пяти в случае успешного срабатывания технологии macro-ops fusion) x86-команд эта архитектура переварить не может. И если ранее на цикле разработки «так» Intel делала нововведения, способные увеличить эффективность работы имеющихся декодеров, то теперь этого нет.

Заметные же изменения в микроархитектуре Haswell обнаруживаются, если двигаться по конвейеру глубже. Так, увеличение всех основных буферов коснулось не только предсказания переходов. Немаловажно, что при этом было увеличено окно внеочередного исполнения команд. Этим достигается некоторое улучшение возможностей по параллельной обработке инструкций одного потока, что в конечном итоге позволяет более плотно загружать работой исполнительные устройства (коих в Haswell стало не просто больше, а заметно больше).

Собственно, на фоне всех остальных достаточно жалких улучшений в потрохах микроархитектуры это, пожалуй, — главное достоинство нового микропроцессорного дизайна. Если в Ivy Bridge было предусмотрено всего шесть исполнительных портов, то в Haswell их стало восемь.

Таким образом, в теории Haswell может обрабатывать до восьми микроопераций за такт. Однако надо заметить, что три порта отведены на операции работы с памятью, то есть предназначаются для обслуживания вспомогательных микроопераций, возникающих при разборке x86-инструкций.

Поэтому первостепенное значение имеет появление отдельного порта для целочисленных операций и обработки ветвлений. Очевидно, предполагается, что со временем число используемых в программах 256-битных инструкций будет расти, и, чтобы они не блокировали работу самого обычного кода, его исполнение теперь может быть выделено на независимый порт. Такое «развязывание» портов по типам операций должно дать особенно сильный положительный эффект при одновременном исполнении одним ядром двух разнородных потоков с участием технологии Hyper-Threading. То есть мы вновь сталкиваемся с ростом её эффективности в Haswell.

Также в распоряжении процессора теперь оказалось суммарно четыре порта, способных работать с целочисленными инструкциями. А это значит, что самый ординарный целочисленный код может проходить через этап исполнения с тем же темпом, что и через декодер.

Впрочем, судя по общему подходу к проектированию новой микроархитектуры, Intel задумывалась о росте количества обрабатываемых за такт инструкций в последнюю очередь. Что же наверняка волновало разработчиков гораздо сильнее, так это работа с новыми командами из набора AVX2. В это множество инструкций входят 256-битные SIMD-команды для обработки целых чисел, разреженные операции с памятью и различные перестановки и сдвиги компонентов векторов. Но львиная и самая важная доля нового набора команд — принципиально новые вещественночисленные FMA-инструкции (Fused Multiply-Add), которые фактически одновременно включают в себя пару операций — умножение и сложение. Естественно, их выполнение старыми средствами вызвало бы значительные простои процессора, поэтому для них теперь сделано два отдельных порта и выделенные исполнительные устройства. В результате Haswell может выполнять по две сдвоенные FMA-инструкции за такт.

Таким образом, теоретически Haswell на AVX2-коде может показывать вдвое более высокую пиковую вещественночисленную производительность, нежели процессоры прошлых поколений. Хотя, на самом деле, если сопоставить скорость выполнения одной FMA-инструкции и раздельных инструкций умножения и сложения, то реальная величина ускорения окажется на уровне 60 процентов, что, конечно же, тоже очень неплохо.

В какой-то мере внедрение быстрого исполнения FMA-команд является ответом Intel на растущую популярность вычислений на графических процессорах. Набор AVX2 и имеющиеся аппаратные средства для его обработки делают Haswell отличной числодробилкой, а сами эти инструкции прекрасно вписываются в популярные вычислительные алгоритмы, используемые как в научных областях, так и при обработке различного мультимедийного контента.

Следовательно, процессоры Haswell всё-таки могут быть существенно производительнее своих предшественников. Но не за счёт более быстрого исполнения старого кода, а за счёт предоставления инструментов для лучшей реализации старых алгоритмов через новую систему инструкций. Это, естественно, требует определённых усилий от программистского сообщества, но зато не приводит к дополнительным затратам процессором электроэнергии, что отлично вписывается в ту генеральную линию, которой теперь придерживается Intel.

Желание сделать работу процессора с AVX2-инструкциями максимально гладкой заставило разработчиков Haswell задуматься об увеличении скорости работы кеш-памяти. Новые команды предполагают вдвое более быструю, чем ранее, обработку данных. Поэтому для поддержания баланса в новой микроархитектуре симметрично увеличена пропускная способность кеш-памяти первого и второго уровней. Подчеркнём, речь идёт именно о расширении полосы пропускания L1- и L2-кеша, латентность же кеш-памяти остаётся на том же уровне, что и раньше.

В результате кеш первого уровня стал способен отрабатывать два 32-байтных чтения и одну 32-байтную запись за такт. Кеш же второго уровня может принимать и отдавать за такт по 64 байта данных. И в том и в другом случае имеет место двукратное увеличение пропускной способности по сравнению с процессорными микроархитектурами прошлых поколений. Плюс к этому в Haswell, наконец, удалось ликвидировать все добавочные задержки, связанные с обращениями к невыровненным данным в L1-кеше.

К сожалению, при этом улучшения обошли кеш третьего уровня, который теперь работает на собственной частоте асинхронно с вычислительными ядрами. И хотя его частота близка к частоте основной части процессора, асинхронность вызывает увеличение латентности. Никакой же компенсации в виде роста пропускной способности не последовало. Внутрипроцессорная кольцевая шина в Haswell перенесена из Ivy Bridge без каких-либо изменений, так что вытянуть из L3-кеша более 32 байт данных за такт невозможно при всём желании.

Резюмируя, отметим, что хотя Haswell по микроархитектуре вычислительных ядер и похож на Ivy Bridge, улучшения, способные увеличить его скорость работы на обычном коде, всё-таки есть. Фактически между всеми этапами конвейера проведён серьёзный ребаланс, приведший к тому, что, хотя скорость выборки и декодирования инструкций и осталась практически той же, исполнение этих инструкций теперь может происходить ощутимо быстрее и с большей степенью параллелизма. Но отразится ли это на реальной производительности Haswell, зависит от того, действительно ли именно исполнение, а не декодирование было бутылочным горлышком в прошлых версиях микроархитектуры Core.

Интегрированная графика: выходим на уровень GeForce GT 650M

Тем не менее, для того, чтобы ощутить возросшую мощь Haswell с 100-процентной вероятностью, совершенно не обязательно переписывать под AVX2 имеющиеся программы. Дело в том, что в этом процессоре есть важная часть, занимающая примерно 30 процентов площади кристалла, над которой инженеры Intel поработали очень усердно. Это — интегрированное графическое ядро. Учитывая первостепенность мобильных применений своих процессоров, Intel в последние несколько лет проводит последовательные улучшения встраиваемой в них графики и стремится к тому, чтобы её собственный ускоритель смотрелся не хуже решений других разработчиков, включая и тех, которые графическими решениями занимаются целенаправленно. В Ivy Bridge мы уже видели почти двукратный рост графической производительности по сравнению с процессорами предыдущего поколения, произошедший одновременно с внедрением поддержки всех современных версий программных интерфейсов. Микроархитектура Haswell обещает поднять скорость работы графического ядра ещё примерно вдвое.

Планы у разработчиков, как видим, были грандиозные, но при этом, как и в вычислительных ядрах, в данном случае Intel смогла обойтись без внесения глубоких архитектурных изменений. Структура графического ядра осталось старой, а рост производительности обеспечивается в чистом виде экстенсивными методами. Новую же архитектуру видеоускорителя Intel обещает лишь в 2014 году — в следующем поколении процессоров с кодовым именем Broadwell. В результате, как и вычислительные ядра, графическое ядро Haswell навевает мысли о том, что «так» и из нового процессора получился не слишком правдоподобный. Впрочем, это не умаляет достигнутого роста быстродействия, который, безусловно, заслуживает того, чтобы познакомиться с его источниками несколько подробнее. Тем более что в новом поколении Intel HD Graphics место нашли весьма занимательные инженерные решения.

Если не считать отдельных оптимизаций графического конвейера, направленных на перенесение части нагрузки с драйвера на аппаратные блоки и на увеличение производительности большинства специализированных функциональных блоков, выполняющих в конвейере 3D-рендеринга подготовительные операции, новое графическое ядро сильно похоже на ядро из процессоров предыдущего поколения с добавленной поддержкой DirectX 11.1. Главное же преимущество нового дизайна — наличие существенно большего количества универсальных исполнительных устройств. Если максимальная версия графики Ivy Bridge располагала 16 исполнительными устройствами (включающими по 4 ALU каждое), то количество исполнительных устройств в графическом ядре Haswell может доходить до 40 штук.

Однако при этом Intel решила провести более явную сегментацию и на основе единого дизайна сделать несколько вариантов графики: GT1, GT2, GT3 и GT3e. Базовая версия — это GT2 с 20 исполнительными устройствами. Она предназначается для большинства десктопных моделей процессоров и предлагает на 4 устройства больше, чем старшая графика процессоров поколения Ivy Bridge. Однако её урезанная версия, GT1, имеет лишь 6 исполнительных устройств и мало отличается от графики, уже присутствующей в существующих процессорах Pentium и Celeron. Максимальный же вариант, GT3, который располагает 40 исполнительными устройствами, представляет собой GT2 с удвоенным исполнительным кластером. Такая прокачанная версия видеоускорителя нацеливается на большинство мобильных вариантов Haswell, включая в первую очередь процессоры для ультрабуков. Двух с половиной кратное увеличение количества исполнительных устройств и должно, по замыслу разработчиков, обеспечить двукратный рост производительности графики. Однако такая производительная версия видеодвижка, GT3, в настольные компьютеры не попадёт. А это значит, что у десктопной интегрированной графики Intel прирост производительности будет не кратный, а лишь примерно 30-процентный.

Любопытно, что на самом деле полупроводниковый кристалл Haswell будет иметь на одно или два исполнительных устройства больше, чем предусмотрено дизайном. Дополнительные устройства играют роль запасных, они нужны для подмены нерабочих блоков и для снижения количества бракованных процессоров.

Увеличение мощности исполнительного кластера графического ядра заставило разработчиков дизайна задуматься и о том, чтобы узким местом не стал этап наложения текстур. Поэтому скорость работы текстурного блока в Haswell была симметрично увеличена. Intel обещает четырёхкратный рост скорости текстурирования по сравнению с графикой Ivy Bridge, и это — вполне достаточное усиление, если учесть рост мощности остальной части движка.

Впрочем, несмотря на все принятые меры, даже производительность GT3 показалась Intel недостаточной, чтобы привлечь на сторону собственных интегрированных ядер самых требовательных пользователей. Поэтому для производительных игровых мобильных систем Intel создала специализированную заряженную модификацию GT3e. В процессорах с таким ядром, которые будут образовывать отдельную мобильную H-серию, встроенное графическое ядро GT3 будет дополняться быстрой eDRAM-памятью объёмом 128 Мбайт и 512-битной шиной. Идея состоит в том, что существенные ограничения на скорость встраиваемых видеоядер накладывает недостаточная пропускная способность системной памяти, которая в таких случаях играет также и роль видеопамяти. eDRAM же будет устанавливаться на одну подложку с процессорным ядром и выполнять роль L4-кеша, обеспечивая пропускную способность порядка 64 Гбайт/с. Однако никакого специализированного интерфейса между графическим ядром и eDRAM не предусматривается, так что такой L4-кеш будет буферизировать все обращения в память, а не только инициированные графическим ядром. Тем не менее Intel ожидает, что именно эта добавка сможет вывести Haswell по графической производительности на один уровень с NVIDIA GeForce GT 650M.

Но следует понимать, что добавление к процессорному кристаллу дополнительного кристалла eDRAM заметно увеличивает энергопотребление и стоимость процессора, поэтому CPU с GT3e предполагается использовать исключительно в высокопроизводительных геймерских ноутбуках, где речь об экономичности, компактности и бюджетности не идёт. А значит, компания AMD со своими APU поколения Richland пока что не будет ощущать особого давления со стороны конкурента. И особенно это касается десктопной среды: предлагать широкий ассортимент процессоров с производительными графическими ядрами для этого рыночного сегмента Intel не считает необходимым.

Впрочем, даже пользователи настольных систем смогут оценить прочие преимущества графического ядра нового поколения, например расширенные возможности по подключению мониторов. В Haswell поддерживается работа до трёх независимых дисплеев, причем все три подключения могут быть цифровыми. Благодаря же внедрению совместимости с последними версиями интерфейсов HDMI и DisplayPort, максимальные поддерживаемые разрешения достигли величин 4Kx2K.

Без улучшений не осталось и одно из любимых детищ Intel — встроенный в графическое ядро аппаратный видеокодер Quick Sync. Разработчики рассматривают его как один из путей снижения энергопотребления процессоров, так как Quick Sync позволяет высвобождать вычислительные ядра от энергоёмких и весьма распространённых задач кодирования и декодирования видео, перенося их выполнение на специализированный и экономичный узел. Поэтому в каждой новой версии процессорного дизайна производительность Quick Sync поднимается, а число поддерживаемых этой технологией форматов растёт. Так, Haswell в дополнение к уже освоенным форматам будет способен на аппаратном уровне работать с SVC (Scalable Video Coding — производная AVC H.264), декодировать MJPEG (motion JPEG) и кодировать видео в формате MPEG2. При этом будет обеспечена полноценная совместимость при кодировании и декодировании с видео в разрешении 4K (4096x2304, 4096x2160 и 3840x2160), которое в настоящее время приобретает всё большую популярность.

Возросла и чистая производительность кодера Quick Sync. Причём теперь ему присуща не только высокая пропускная способность, но и низкая латентность, открывающая аппаратному кодированию путь в телеконференции. Скорость же кодирования в Haswell заметно выше, чем у Ivy Bridge, однако в разных версиях графического ядра она различается, причём в разы. Зато качество получаемого при аппаратном кодировании видео улучшилось в любых модификациях графики. Обновлённая технология Quick Sync должна давать лучшее качество кодированного изображения, чем Ivy Bridge, даже при одинаковом битрейте.

Заключение

Очевидно, новая микроархитектура Haswell может вселять как надежды на светлое будущее, так и разочарование уровнем достигнутого прогресса. Всё зависит от того, на что вы рассчитываете. К сожалению, интеловская схема «тик-так» незримо подталкивает к завышению ожиданий, ведь Haswell относится к циклу разработки «так», то есть должен восприниматься как новое поколение микроархитектуры. Но принципиальных и революционных улучшений в нём сделано не так много. Речь идёт не о кардинальной переработке процессорного дизайна, а лишь о некотором наборе улучшений и усовершенствований. Конечно, улучшений этих немало, и можно даже говорить о переходе количества в качество. Но, как бы то ни было, Intel фактически форсировала имеющуюся микроархитектуру Ivy Bridge, а не предложила что-то принципиально новое. Причём основной упор при выполненной переработке делался не на поиски путей увеличения вычислительной производительности, а на улучшение энергоэффективности и развитие графических возможностей.

С точки же зрения традиционно процессорной парадигмы микроархитектура Haswell предлагает лишь поддержку нового набора инструкций AVX2, лучший параллелизм на уровне исполнения инструкций и возросшую пропускную способность кеш-памяти первого и второго уровней. Достаточно ли таких изменений для того, чтобы соответствовать ожиданиям приверженцев классических персональных компьютеров? Вряд ли. Поэтому большинство энтузиастов, увидев лишь незначительный прирост вычислительного быстродействия, лежащий предположительно в рамках 5-15 процентов, скорее всего, новыми процессорами будут недовольны. И это означает, что никакого всплеска интереса к привычным десктопам и ноутбукам не предвидится и с выходом нового семейства процессоров.

Но Intel, несмотря на всё это, может гордиться выполненной работой. Поставленную перед собой задачу компания решила. Дизайн Haswell получился настолько энергоэффективным и сбалансированным, что эти процессоры, вне всяких сомнений, смогут занять достойное место в лакомом для производителя подвиде мобильных устройств — производительных планшетах и ноутбуках-трансформерах. Намечающийся на этом рынке бум компания теперь точно не прозевает: в ответ на поползновения когорты приверженцев архитектуры ARM, а также на новые APU компании AMD у Intel теперь имеется хорошая домашняя заготовка. Ведь микроархитектура Haswell позволяет создавать модификации дизайна, которые обладают показателями энергопотребления, выражающимися в однозначных числах, и представляют при этом SoC-сборки, включающие не только процессор, но и набор системной логики.

На этом мы пока не ставим финальную точку. Данный материал лишь открывает цикл статей о процессорах с новой микроархитектурой. В самое ближайшее время мы сможем более подробно и с реальными процессорами в руках познакомиться как с десктопными, так и с мобильными воплощениями микроархитектуры Haswell. И тогда, быть может, наши выводы, сделанные лишь на основе знакомства с документацией, несколько изменятся. И в это действительно хочется верить...

Войдите чтобы комментировать

Еще статьи...

© "Дельта Информ", Магнитогорск,  2005 - 2024. Designed by Dimm © 2012 - 2024 Point