Особенности системной шины QPI

Официальный анонс Intel Core i7, первых процессоров архитектуры Nehalem, стал одним из главных событий в мире высоких технологий прошедшего 2008 года. Чем больше появлялось разнообразной информации касательно нового поколения CPU, тем чаще в кругах специалистов звучало мнение, что Nehalem с точки зрения эволюции настольных процессоров является шагом вперед и, одновременно, в сторону, если хотите — разбегом перед решительным прыжком.

Разработчики Core i7 заложили в него прочный технологический фундамент, частично пожертвовав производительностью в краткосрочной перспективе. Практическая ценность таких новшеств как вторая редакция технологии Hyper-Threading и тесно связанная с ней сложная иерархия кэш-памяти сегодня проявляется лишь частично. С одной стороны, в этом есть доля вины софтверных компаний, не заботящихся об оптимизации программ под многопоточные вычисления, а с другой стороны сказывается четкая серверная направленность микроархитектуры Nehalem.

Впрочем, оставим историко-философский аспект разработки Nehalem любителям околонаучных дискуссий и перейдем к непосредственному изучению Core i7. Начнем с теории и закончим практикой. Что из этого приятное, а что — полезное, решать нашим читателям.

Процессорный кристалл Core i7

Процессор Core i7 (Bloomfield, 45 нм) включает в себя: четыре физических ядра, распределенных на 8 виртуальных потоков с помощью технологии Intel Hyper-Threading, трехуровневый массив ячеек кэш-памяти, новый системный интерфейс Quick Path Interconnect, интегрированный контроллер памяти DDR3, блок очереди команд (на схеме — «Queue») и блок операций ввода-вывода («Miscellaneous I/O»). Кроме того, в структуре серверных четырехъядерников Nehalem EP найдет применение второй порт QPI для связи между двумя и более процессорами на одной материнской плате.


В отличие от Core 2 Quad — мультичипового модуля из пары Core 2 Duo, дизайн Core i7 изначально предполагает наличие четырех ядер в одном процессорном кристалле. Количество физических ядер легко варьируется в зависимости от намеченной цели. Например, во второй половине 2009 г. Intel планирует выпуск восьмиядерных CPU Nehalem EP, а вначале 2010-го — двухъядерных процессоров Havendale LGA1156 с интегрированной графикой.


Строение каждого из четырех ядер спроектировано согласно нижеприведенной схеме:


Ширина конвейера Intel Core i7, как и у представителей микроархитектуры Core 2, составляет 4 инструкции за такт. Во избежание перенасыщения очереди команд в многопоточном режиме, расширены основные буферы операций:
  • reservation station (буфер резервирования операций) — с 32 до 36 μops;
  • load buffers (буферы загрузки операций) — с 32 до 48 μops;
  • store buffers (буферы хранения операций) — с 20 до 32 μops;
  • out of order scheduling window (буфер внеочередного выполнения операций) — с 96 до 128 μops.

Intel Hyper-Threading Technology

Спустя четыре года после маловыразительного дебюта технологии Hyper-Threading (HT) в структуре настольных процессоров Pentium 4 (Northwood), специалисты Intel вернулись к концепции многопоточной обработки данных.


Эффективность HT по-прежнему зависит от конкретного приложения. Программы, использующие большой объем разнотипного кода (например, базы данных), практически идеально подходят Core i7, в тоже время основная масса игр демонстрирует 0,5-2-процентное падение фреймрейта. Впрочем, список программного обеспечения, адаптированного к особенностям Hyper-Threading, будет неуклонно расширяться.

Новая иерархия кэш-памяти, Integrated Memory Controller и Quick Path Interconnect

Встроенный контроллер оперативной памяти (IMC), разделяемый кэш третьего уровня и высокоскоростной интерфейс QPI (аналог HyperTransport) — все это было пройдено в процессорах AMD K8/K8L/K10 и теперь плавно перекочевали в ядро Bloomfield.

С переносом контроллера памяти из северного моста в тело CPU уменьшилась зависимость процессора от постоянного увеличения объема кэш-памяти. Иерархия кэша в Core i7 целиком подчинена многопоточным вычислениям: унифицированный L2 кэш урезан до 256 килобайт на каждое ядро, а основной акцент сделан на 8 МБ разделяемого кэша третьего уровня. Последний содержит все инструкции и данные из L1/L2 cache для уменьшения трафика запросов.


Ввиду того, что инженерам Intel изначально не удавалось поднять тактовую частоту Core i7 до конкурентоспособного уровня, латентность L1 кэша была увеличена по отношению к Core 2 на базе Penryn с 3 до 4 тактов. Данный маневр частично повлиял на итоговую производительность. Кэш-память второго уровня, наоборот, стала быстрее и экономичнее: вместо 15 тактов на выполнение одной операции уходит 11 тактов.

Встроенный контроллер оперативной памяти процессоров Core i7 поддерживает трехканальный (192-bit), двухканальный (128-bit) и одноканальный (64-bit) режимы работы памяти. В плане эффективности первые два смотрятся наиболее предпочтительно. Сразу отметим невозможность появления в будущем материнских плат для Core i7 со слотами DDR2: в отличие от AMD Phenom II, контроллер памяти Bloomfield поддерживает только модули стандарта DDR3.

С приходом процессоров нового поколения заканчивается эра системной шины FSB. На смену ей приходит высокоскоростной интерфейс Quick Path Interconnect (QPI):


QPI обеспечивает одновременный обмен данных в обоих направлениях (от CPU к северному мосту и от северного моста к CPU), что выгодно отличает его от Front Side Bus. Суммарная пропускная способность QPI достигает 25,6 GB/s — как минимум, в 2 раза выше, чем у FSB.

Чипсет для процессоров Core i7

Процессоры Intel Core i7 предназначены для работы с материнскими платами, оснащенными разъемом LGA1366, первые из которых будут основаны на чипсете Intel X58 Express (Tylersburg). Новый набор системной логики состоит из северного моста X58 IOH и южного моста ICH10/ICH10(R).


Материнские платы c 1366-контактным процессорным разъемом официально поддерживают модули оперативной памяти DDR3 частотой 800/1066 МГц, однако на практике Core i7 успешно взаимодействует и с более быстрыми комплектами RAM. Количество слотов DDR3 обычно варьируется от трех до шести.

Intel X58 Express программно совместим с технологиями NVIDIA SLI и ATI CrossFire. Впрочем, поддержка нескольких видеокарт GeForce связана с затратным для производителя материнских плат процессом сертификации. Так что присутствие NVIDIA SLI является лишь опцией для материнских плат премиум-класса. Подробнее о конфигурациях SLI можно прочитать в одном из наших предыдущих материалов.

Южный мост ICH10(R) сегодня широко используется в составе чипсета Intel P45 Express, поэтому его возможности хорошо известны энтузиастам.Процессоры Intel Core i7

Основные моменты архитектуры Nehalem мы рассмотрели и теперь перейдем к готовым изделиям на ее базе. Новые процессоры поначалу будут представлены на рынке высокоуровневыми моделями, что и не удивительно. Обычно выход очередных решений подразумевает продукты hi-end-класса, так как производителю необходимо удовлетворить спрос на новинки и, в какой-то степени, покрыть расходы на разработку. Да и производители материнских плат не против подзаработать на этом поприще.


На данный момент времени компания Intel предлагает всего три модели процессоров на базе ядра Bloomfield, которые отличаются между собой рабочей частотой ядер и частотой шины QPI: Core i7-920 (2,66 ГГц), Core i7-940 (2,93 ГГц) и Core i7-965 Extreme Edition (3,2 ГГц).
Intel Core i7-965 Extreme Edition Intel Core i7-940 Intel Core i7-920
Разъем LGA1366 LGA1366 LGA1366
Техпроцесс 45-нм, с применением high-k диэлектриков 45-нм, с применением high-k диэлектриков
Число ядер 4 (8 потоков) 4 (8 потоков) 4 (8 потоков)
Номинальная частота 3,20 ГГц 2,93 ГГц 2,66 ГГц
Объем L1 кэша 4 x (32+32) КБ 4 x (32+32) КБ 4 x (32+32) КБ
Объем L2 кэша 4 x 256 КБ 4 x 256 КБ 4 x 256 КБ
Объем L3 кэша 8 МБ 8 МБ 8 МБ
Множитель 24х, свободный 22х, заблокирован на повышение
Поддерживаемый тип памяти DDR3 800/1066/1333 DDR3 800/1066 DDR3 800/1066
Пропускная способность QPI 6,4 ГТ/с 4,8 ГТ/с 4,8 ГТ/с
Номинальное напряжение 1,20 В 1,20 В 1,20 В
TDP 130 Вт 130 Вт 130 Вт
Стоимость $999 $562 $284

Процессор Core i7-965 Extreme Edition, как видно из его названия, рассчитан на энтузиастов и оверклокеров и кроме высокой частоты имеет полностью разблокированный множитель, что позволяет его разгонять без проведения серьезных манипуляций с шиной QPI и остальными компонентами системы.

Что касается самой шины QPI, то ее частота формируется за счет умножения определенного коэффициента на частоту тактового генератора, равную в номинале 133 МГц.


Ее также называют опорной частотой шины QPI, QPI bclk или просто Bclk (утилита CPU-Z определяет ее как Bus Speed). По своему назначению она полностью соответствует частоте тактового генератора в современной платформе AMD — за счет нее формируется частоты ядер, кэш-памяти, контроллера памяти и частота системной памяти. Например, частота Core i7-920 получается умножением коэффициента 20х на 133 МГц. Естественно, при разгоне CPU путем повышения Bclk будут расти частоты всех блоков процессора, шины QPI и памяти, что может сказаться на их стабильной работе. Частота шины QPI для процессоров Intel Core i7-920 и Core i7-940 составляет 2,4 ГГц, что эквивалентно пропускной способности 4800 мегатранзакций в секунду (или 4,8 ГТ/с). Для Core i7-965 EE это значение соответствует 3,2 ГГц или 6,4 ГТ/с. Зная частоту QPI можно без проблем высчитать коэффициент умножения шины у каждого из процессоров: для Core i7-920 и Core i7-940 он равен 18, для Core i7-965 EE — 24.

Но частота шины Quick Path Interconnect не единственная проблема, с которой можно будет столкнуться при разгоне обычных Core i7. Дело в том, что в новых CPU кэш третьего уровня и контроллер памяти (данная часть процессора называется Uncore) работает на отличной от процессора частоте — по рекомендации Intel, частота этих блоков должна быть в два раза выше эффективной частоты памяти. Данный параметр изменяется в настройках BIOS Setup материнской платы (коэффициентом или выбором частоты).


Отслеживать значения Uncore можно при помощи все той же утилиты CPU-Z — за это отвечает параметр NB Frequency в закладке Memory.

Из поддерживаемой памяти для младших Core i7 заявлена только DDR3-800/1066 (коэффициенты 6х, 8х), для Core i7-965 Extreme Edition этот список расширен до DDR3-1333 (коэффициент 10х).

За счет переноса части северного моста в CPU, его размеры несколько увеличились, как и количество контактов — теперь их 1366, а сам процессор стал немного продолговатым по сравнению с Core 2.



Процессорный разъем также претерпел изменений и кроме увеличенных размеров и количества контактов обзавелся усилительной пластиной с обратной стороны материнской платы, которая прижимается четырьмя болтами.



Из-за расширения функциональности тепловой пакет новых процессоров достаточно высок — 130 Вт, хотя и меньше на шесть ватт, чем у топовых Core 2 Quad с 12 МБ кэшем. При этом напряжение питания новинок составляет 1,2 В. Несмотря на это, для Core i7 теперь необходимы новые системы охлаждения, так как расстояние между монтажными отверстиями на материнских платах увеличилось с 72 до 80 мм относительно платформы LGA775. Соответственно увеличились и габариты кулеров. Обладателям коробочных версий Core i7 на этот счет особо переживать не придется, но при разгоне необходимо будет подыскать что-то поэффективней (или новое крепление для «суперкулеров»), так как процессоры на базе ядра Bloomfield имеют достаточно горячий нрав.

Для слежения за состоянием процессора, в нем был размещен специальный микроконтроллер Power Control Unit (PCU), который отвечает за мониторинг и регулирование показателей напряжения, силы тока и температуры ядер.


Кроме того, Core i7 обладает технологией Turbo Boost, которая позволяет автоматически увеличить частоту процессора при недостаточной загрузке ядер путем поднятия коэффициента умножения CPU на один пункт (при номинальной Bclk разгон составляет 133 МГц) или на два пункта, но только для одного ядра.


Единственное условие работы «турбированного режима» — уровень TDP не должен превышать номинального значения. Частота нашего тестового процессора Core i7-920 с активированной технологией Turbo Boost во время прохождения тестов равнялась 2800 МГц, что соответствовало «слабому» разгону. На основании этого можно предположить, что режим Turbo Mode работает не только при слабой нагрузке на процессор.


Если при разгоне уровень TDP превысит 130 Вт коэффициент умножения CPU будет снижаться до того уровня, пока не нормализуется состояние процессора. В связи с этим для достижения высокой частоты придется либо отодвигать порог срабатывания защиты (на материнской плате Intel есть отдельные пункты для управления уровнем TDP и силы тока, проходящей через процессор) либо отключать защиту вовсе (например, на платах ASUS).

Наличие официального авторазгона будет полезно при работе технологии Hyper-Threading (или Simultaneous Multithreading — SMT, технология «одновременной мультипоточности»), так как некоторые приложения не способны задействовать все возможности процессора, а порой включение HT влечет за собой падение производительности системы. И в этом случае поднятие частоты CPU компенсирует этот недостаток. Как и ранее во времена Pentium 4 HT, операционная система видит логические и физические ядра как отдельные, и для процессоров Core i7 это количество достигает восьми штук.


При необходимости технологию Hyper-Threading, а также Turbo Boost можно отключить и тем самым перевести процессор в режим обычного четырехъядерного CPU.

Для установки Core i7 необходимы новые материнские платы с разъемом LGA1366 на базе единственного пока набора системной логики под новую платформу — Intel X58 Express. Данный чипсет является высокоуровневым решением, и ждать дешевых продуктов на его основе пока не стоит, хотя он сам в производстве выходит не дороже X48. Тем более что некоторые производители материнских плат смогут сертифицировать свои решения для поддержки технологии SLI, либо установить дополнительный чип nForce 200 для этой цели, а это уже точно скажется на цене готового изделия.

В качестве компаньона для нашего тестового процессора Core i7-920 использовалась материнская плата ASUS Rampage II Extreme, которая является продолжением серии Republic of Gamers и правопреемницей Rampage Extreme на базе Intel X48 Express. Нашей целью не было серьезное изучение данного продукта, так как основной темой статьи является новая платформа в целом. Но мы все же постараемся максимально рассмотреть ASUS Rampage II Extreme как представителя X58.

Модель
Чипсет Intel X58 + ICH10R
Socket LGA1366
Процессоры
QPI, МГц 3200/2400
Память 6 DIMM DDR3 SDRAM 1800(O.C.)/1600(O.C.)/1333/1066/800 (12 GB max)
Слоты PCI-E 3 PCI Express x16 (режимы 16+16+1 и 16+8+8)
2 PCI Express x1 (один для звуковой карты))
Слоты PCI 1
Количество подключаемых вентиляторов 8 (1x 4-pin, 7x 3-pin)
Порты USB 2.0 12 (6 разъемов на задней панели)
Порты PS/2 1
Порт LPT -
Порт COM -
Порты FireWire 2 (1 разъем на задней панели)
ATA-133 1 канал (два устройства, JMicron 363)
Serial ATA 6 каналов SATA II (ICH10R) + 1 канал SATA II + 1 eSATA (JMicron 363)
RAID 0, 1, 5, 10
Встроенный звук SupremeFX X-Fi на базе ADI AD2000B (7.1, HDA)
S/PDIF Коаксиальный + оптический
Встроенная сеть 2х Marvell 88E8056 (Gigabit Ethernet)
BIOS AMI BIOS
Форм-фактор ATX
Размеры, мм 305х269
Дополнительно Кнопки Power, Reset, Clear CMOS, управление LCD-Poster, возможность снятия показаний напряжений и световая индикация уровня напряжений основных узлов платы


Материнская плата поставляется в крупной коробке, выполненной в непривычной для ASUS красной гамме, на что сразу обратит внимание потенциальный покупатель. Хотя, для нашего рынка это не столь актуально, так как комплектующие либо лежат на витрине магазина уже распакованными, либо пылятся на складе пока не выпишет менеджер. Для удобства переноски коробка снабжена пластиковой ручкой.



Как и у всех плат серии ROG упаковка Rampage II Extreme имеет откидывающуюся крышку с информацией о продукте, под которой скрывается окошко, через которое можно увидеть материнскую плату.


Комплект поставки разделен по двум коробкам: в одной находится плата, во второй — аксессуары к ней.


В коробке можно обнаружить следующее:
  • Инструкцию;
  • Диск с драйверами и ПО;
  • Шесть кабелей SATA;
  • Один переходник питания на два SATA-устройства;
  • Один кабель IDE;
  • Брикет с двумя USB и одним FireWire-портом;
  • Три выносных термосенсора;
  • Гибкий SLI-мостик;
  • Мостик для 3-Way SLI;
  • Два переходника для подключения мультиметра;
  • Набор коннекторов ASUS Q-Connector;
  • Вентилятор;
  • LCD-Poster;
  • Звуковая карта SupremeFX X-Fi
  • Задняя планка I/O с подсветкой.


Как видите, комплект не маленький, но и плата самая дорогая на рынке среди решений на базе Intel X58 Express. Пусть не удивляет наличие SLI-мостиков в комплекте — Rampage II Extreme поддерживает помимо технологии CrossFire еще и SLI «программным» методом.

Плата выполнена на текстолите фирменного черного цвета и по размерам чуть шире стандартных ATX-решений. Оформление Rampage II Extreme сделано в одном стиле, в отличие от недавних высокоуровневых продуктов компании, в которых соседствовали радиаторы различных «цветов и красок».



На обратной стороне платы прикручена та самая усилительная пластина, о которой мы упоминали в описании Socket 1366. Тут же расположена часть элементов от подсистемы питания процессора, которые позволяют снять тепловую нагрузку с лицевой стороны платы.


Подсистема питания процессора построена по 16-фазной схеме с использованием дросселей в броневых сердечниках и конденсаторов с твердым электролитом. Первое позволяет избавиться от высокочастотного писка катушек под нагрузкой системы, второе скажется на длительности эксплуатации изделия в жестких условиях. Такие же элементы установлены во всех цепях питания платы. Для питания памяти предусмотрено три фазы, силовые транзисторы которых расположены возле южного моста. Они охлаждаются общим радиатором для микросхем чипсета, объединенным посредством тепловой трубки с системой охлаждения силовых элементов питания процессора. При необходимости можно установить комплектный вентилятор на один из радиаторов MOSFET.


Кроме того, в подсистеме питания процессора и памяти также используются высококачественные конденсаторы производства Fujitsu емкостью 1000 мкФ, рассчитанные на напряжение 3 В.


Возле северного моста расположен модуль VTT CPU Power Card, отвечающий за питание контроллера памяти и шины QPI (часть северного моста в процессоре, которая называется Uncore, но у плат ASUS в BIOS Setup за это отвечает параметр QPI/DRAM).


Модуль представляет собой небольшую платку с отдельным трехфазным контроллером питания. Для охлаждения элементов установлен небольшой радиатор с логотипом серии Republic of Gamers и с синей подсветкой, которую без проблем можно отключить.


Радиатор над северным мостом является съемным и вместо него можно установить совместимый с ASUS Rampage II Extreme водоблок — пока это лишь MCW-NBMAX от Swiftech.


Передача тепла от чипсета радиатору происходит через медную вставку, но судя по отпечатку на термопасте, прижим с одной стороны оставляет желать лучшего, так что, при установке водоблока придется следить за качеством монтажа.


В связи с использованием трехканального контроллера памяти в Core i7, материнские платы для этих процессоров будут оснащаться шестью, четырьмя или тремя слотами DIMM. На рассматриваемой плате установлено шесть разъемов, а максимальный объем памяти DDR3-800/1066/1333/1600 может достигать 12 ГБ. Можно использовать и два модуля — тогда будет функционировать лишь двухканальный режим, но после покупки ASUS Rampage II Extreme желательно обновить BIOS платы, так как с первой версией микрокода (достаточно часто продолжительное время на рынке присутствуют продукты со старой версией BIOS) наблюдаются проблемы с совместимостью с некоторыми комплектами памяти. Например, может теряться объем одной планки, как бы ни вставлялись модули в плату.


Рядом с разъемами DIMM расположены органы управления разгоном платы и кнопки включения/отключения и сброса системы.


Для удобства разгона необходимо подключить LCD-Poster к разъему возле задней панели, после чего будет возможность наблюдать за своими действиями на ЖК-экране.


Возле задней панели также есть разъем для подключения подсветки задней планки.


Пожалуй, одна из значимых «фишек» платы заключается в возможности снять показатели напряжений на основных компонентах системы при помощи обычного мультиметра, для чего выведены контакты возле органов управления разгоном. Тут же есть небольшие разъемы, куда можно подключить пару комплектных переходников для вольтметра.


В связи с возможностью установки трех видеокарт все разъемы для подключения периферии расположены по краям платы. Шесть разъемов SATA (ICH10R), и разъем IDE развернуты на 90°. Единственный канал параллельного интерфейса реализован за счет внешнего контроллера JMicron 363, который дополнительно поддерживает два канала SATA, разъем одного из которых установлен рядом с остальными, а второй канал выведен на заднюю панель в виде eSATA.


Рядом с ними распаяны чипы iROG, которые расширяют возможности системы при разгоне, контроле напряжений, управлении светодиодной индикацией состояния платы, среди которых уровень подаваемого напряжения на процессор, память и чипсет.


С нижнего края платы возле гребенок USB расположены две микросхемы BIOS и джампер Clear CMOS.


Для расширения функциональности дополнительно к трем разъемам PCI-E x16 на плате присутствуют один слот PCI, два PCI-E x1, один из которых отведен под звуковую карту SupremeFX X-Fi.


Графические интерфейсы способны работать в режиме «16+16+1» при установке двух видеокарт и «16+8+8» — при установки трех. Синие слоты снабжены удобными защелками, чего не скажешь о старых моделях материнских плат серии ROG, да и не только этой.


Задняя панель выглядит немного пустовато: один PS/2 для клавиатуры, шесть портов USB (еще шесть в виде гребенки на плате), по одному eSATA и FireWire и два RJ45, реализованных за счет двух гигабитных контроллеров Marvell 88E8056. Есть кнопка сброса настроек BIOS.


Звуковая подсистема выполнена на базе HDA-кодека ADI AD2000B и поддерживает технологии Creative EAX Advanced HD 4.0, X-Fi Crystalizer, X-Fi CMSS-3D.BIOS платы ASUS Rampage II Extreme

Учитывая переход на новую платформу, BIOS Setup материнских плат на базе Intel X58 Express обзавелся множеством неизвестных ранее параметров, которые в значительной степени влияют на уровень разгона и производительность процессоров Core i7. Естественно, от продукта к продукту наименование тех или иных параметров будет отличаться, но эффект при их изменениях будет один и тот же.

При входе в BIOS платы ASUS Rampage II Extreme, основанный на микрокоде AMI, нас сразу же приветствует раздел Extreme Tweaker, в котором сосредоточены все тонкие настройки системы, необходимые при разгоне. Ранее в платах ASUS первым пунктом стоял раздел Main, что вряд ли можно было назвать удобным, особенно при частой смене настроек во время разгона.


В данном разделе сразу же бросаются в глаза «статические» надписи желтого цвета, которые отображают текущие рабочие частоты процессора и памяти, напряжения и температуру CPU, микросхем чипсета, благодаря чему не надо перемещаться по всем разделам BIOS или перегружать систему, чтобы посмотреть те или иные значения.

Первый пункт в Extreme Tweaker отвечает за возможность разгона процессора до более производительной модели. Например, наш Core i7-920 можно повысить в «звании» до Core i7-940 или Core i7-965. Так как коэффициент умножения у младших моделей процессоров нового поколения заблокирован, то повышение частоты CPU происходит за счет увеличения частоты тактового генератора.


Аналогичная ситуация происходит и при выборе не поддерживаемого процессором режима работы памяти (DDR3-1600/1333), но при этом коэффициент CPU снижается до необходимого значения, при котором его частота будет приблизительно равна номинальной.


Следующий пункт — Ai Overclockers Tuner, знакомый по ранее выпускавшимся материнским платам ASUS, позволяет выбрать возможность настраивать все параметры системы вручную, использовать настройки X.M.P. (Extended Memory Profiles, интеловский «аналог» EPP, но для памяти DDR3) или же описанные выше режимы повышения частоты процессора или памяти.


В CPU Configuration собрана вся информация о процессоре и настройки различных функций и технологий, которые он поддерживает. Параметры Hardware Prefetcher и Adjacent Cashe Line Prefetch рекомендуется не отключать, так как произойдет падение производительности системы. При разгоне процессора параметр Turbo Mode, отвечающий за работу технологии Turbo Boost необходимо будет отключать. Также можно будет отключить CPU TM Function, но при этом придется следить за температурным режимом процессора.


Пункт DRAM Frequency позволяет выбрать режим работы памяти — для Core i7-920 и Core i7-940 это DDR3-800 и DDR3-1066. Для «экстремальной» версии Core i7 этот список значительно расширен, вплоть до DDR3-2133.


Настройки таймингов памяти сосредоточены в разделе DRAM Timing Control. Список внушительный, а с учетом Command Rate (значения 1T, 2T или 3T) — даже больше чем на платах ASUS на базе чипсетов X48/P45.


EPU II Phase Control отвечает за режимы функционирования «энергетического юнита», который управляет подсистемой питания платы.


BIOS платы ASUS Rampage II Extreme позволяет настраивать всевозможные напряжения в широких пределах с определенным безопасным уровнем, и для обхода последнего имеется параметр Extreme OV, благодаря которому на процессор можно подать до опасных 2,5 В.



Такое же напряжение можно подать и на память, но уже без активации Extreme OV. Правда, после перехода порога в 1,65 В появится предупреждение о возможности повреждения процессора при столь высоком напряжении. По технической документации на новые CPU максимально допустимым напряжением для памяти является около 1,85 В, при повышении которых уже идет большая нагрузка на встроенный контроллер памяти.


Достаточно давно известный по материнским платам ASUS параметр Load-Line Calibration, позволяющий избежать просадки напряжения на процессоре при его разгоне нашел применение и здесь. Также появился параметр CPU Differential Amplitude, который должен прибавить стабильности при разгоне процессора. Остальные напряжения, в том числе на северном и южном мостах занесены в следующую таблицу:
Параметр Диапазон изменений
CPU Voltage 0,85000-2,50000 В, с шагом 0,00625 В
CPU PLL Voltage 1,81592-2,50492 В, с шагом 0,01325 В
QPI/DRAM Core Voltage 1,20000-2,50000 В, с шагом 0,00625 В
IOH Voltage 1,11341-2,19991 В, с шагом 0,01325 В
IOH PCIE Voltage 1,51106-2,78306 В, с шагом 0,01325 В
ICH Voltage 1,11341-2,00116 В, с шагом 0,01325 В
ICH PCIE Voltage 1,51106-2,05431 В, с шагом 0,01325 В
DRAM Bus Voltage 1,51106-2,50492 В, с шагом 0,01325 В

Теперь перейдем к следующим не менее интересным разделам. В NorthBridge Chipset Configuration имеется настройка режимов работа второго и третьего разъема PCI-E x16 — это либо «x8+x8», либо «x16+x1».


В разделе LCD Poster and LED Control находятся настройки выносного ЖК-экрана и светодиодной индикации на материнской плате.


Раздел мониторинга разделен на четыре подраздела: напряжение питания, температура компонентов платы, скорость вращения вентиляторов и управление последними.


Мониторинг напряжений достаточно обширный — здесь собраны полностью все настраиваемые значения, плюс напряжения по трем основным линиям, выдаваемые блоком питания.


Мониторинг температур отслеживает показатели процессора, материнской платы и микросхем чипсета. Также здесь можно настроить порог срабатывания защиты при перегреве.


Количество сохраняемых профилей с настройками системы увеличилось до восьми — ранее в платах ASUS была возможность сохранить лишь пару профилей. Кроме того, в Rampage II Extreme теперь можно каждый профиль называть по своему усмотрению, чего так не хватало в старых решениях данного производителя.


Ну и под конец расскажем о возможностях обновления BIOS материнской платы. Итак, можно ипользовать утилиты AFUDOS для DOS или ASUS Update для Windows. Первый вариант предпочтительней и для него не обязательно пользоваться флоппи-дисководом. Достаточно воспользоваться возможностями EZ Flash в BIOS и обычной «флешкой», с предварительно сохраненной версией микрокода.


В случае повреждения или не правильной перепрошивки микрокода можно сделать откат на старую версию благодаря второй микросхеме с BIOS.

Так как использовался инженерный образец Intel Core i7-920, в котором заблокированы некоторые множители (для розничных процессоров все коэффициенты умножения, кроме процессорного на повышение, компания Intel решила разблокировать) нам не были доступны пункты UCLK Frequency и QPI Link Data Rate в разделе Extreme Tweaker, отвечающие за частоту контроллера памяти и L3-кэш, а также за частоту шины QPI. При тестировании и разгоне данные параметры устанавливались автоматически.
Разгон процессоров Core i7

Разгон процессоров нового поколения поначалу может показаться достаточно сложным занятием из-за появления неизвестных ранее параметров, которые необходимо настраивать для повышения частоты CPU. Но платформа Nehalem в плане разгона ничем не отличается от современной платформы AMD, а по сравнению с LGA775 имеет незначительные изменения. В этой статье мы не раз упоминали о некоторых параметрах, критичных при разгоне Intel Core i7 и в данном разделе попытаемся свести все вместе и на примере тестового процессора продемонстрировать возможности новых CPU.

Итак, в первую очередь следует отметить отказ инженеров Intel от системной шины Front Side Bus, которая служила верой и правдой не один десяток лет для связи процессора с чипсетом. Вместо нее теперь используется шина QPI с реальной частотой 2,4 или 3,2 ГГц, в зависимости от процессора, которая формируется за счет умножения коэффициента 18х или 24х на частоту тактового генератора, равную 133 МГц. Она также называется опорной частотой или просто Bclk, за счет которой формируются частоты ядра процессора, контроллера памяти и кэш-памяти третьего уровня (данный блок называется Uncore), а также частота памяти DDR3.

Ранее частота процессора формировалась за счет умножения определенного коэффициента на реальную частоту FSB, и разгон осуществлялся методом поднятия последней, так как множитель на процессорах Intel был заблокирован в сторону повышения (кроме версий Extreme Edition). Для новых CPU в этом плане ничего не изменилось — вместо FSB мы повышаем значение Bclk. При этом, естественно, пропорционально увеличиваются частоты шины QPI, блока Uncore и памяти. Если сравнивать с платформой конкурента, то у K8/K10 изначально предусмотрены низкие коэффициенты умножения основных блоков процессора, памяти и шины, благодаря чему частоту ядер можно повышать независимо от всего остального. С процессорами Core i7 дела обстоят несколько иначе. Минимальный множитель для шины QPI у новых процессоров Intel равен 18х, для контроллера памяти и L3-кэша — 16х, для памяти можно установить 6х (коэффициент «эффективный»), что соответствует 800 МГц. В итоге при увеличении частоты тактового генератора, скажем, до 200 МГц, частота процессора Core i7-920 составит 4 ГГц, шины QPI — 3,6 ГГц (7,2 ГТ/с, в BIOS Setup некоторых материнских плат может отображаться эффективная частота, например 7200 МГц), блока Uncore — 3,2 ГГц, а памяти будет равна 1200 МГц. Можно предположить, что изначально высокие множители станут преградой для достижения максимального разгона процессоров Core i7. Но как показывает практика из появившихся в Сети различных обзоров новой платформы, как раз с этим никаких проблем не наблюдается. Высокочастотная память DDR3 уже давно представлена на рынке, а стабильность остальных узлов системы может быть достигнута за счет повышения напряжения питания. Максимально рекомендуемое напряжение, подаваемое на процессор составляет 1,55 В (номинал 1,2 В), на контроллер памяти, шины QPI и кэш L3 — 1,35 В, для памяти это значение соответствует известным 1,65 В. При необходимости так же можно поднять напряжение CPU PLL (при разгоне Core 2 Quad в значительной степени влияло на результат) с 1,8 до 1,88 В. Конечно, процессору Core i7-965 Extreme Edition в плане разгона повезло куда больше — достаточно повышать коэффициент умножения и напряжение питания самого CPU.

Для информации все частоты и множители процессоров, шины QPI, контроллера памяти и L3-кэша, а также самой памяти занесены в таблицу:

Модель Частота процессора/множитель Частота Uncore/множитель Частота памяти/множитель Частота шины QPI/множитель
Core i7-965 EE 3,2 ГГц / 12-24 и выше 2,66 ГГц / 16-20 и выше 1333 МГц / 6, 8, 10 и выше 3,2 ГГц (6,4 ГТ/с) / 18, 20, 24
2,93 ГГц / 12-22 2,13 ГГц / 16 и выше 1066 МГц / 6, 8 и выше 2,4 ГГц (4,8 ГТ/с) / 18
2,66 ГГц / 12-20 2,13 ГГц / 16 и выше 1066 МГц / 6, 8 и выше 2,4 ГГц (4,8 ГТ/с) / 18

* — «Эффективный» множитель. Реальный составляет 3х, 4х, 5х и выше.


Технически, каждый из этих множителей может быть уменьшен до 2х, но где происходит блокировка — на уровне процессора или материнской платы — пока сказать сложно. Возможно, со временем мы точно сможем ответить на этот вопрос, а пока перейдем к остальным нюансам разгона новейших CPU от Intel.

Следующим важным пунктом является технология Turbo Boost, которая активируется при недостаточной загрузке всех ядер и повышает частоту процессора за счет увеличения множителя на один-два пункта. Достигнув при разгоне, например, предельных 4 ГГц система станет крайне нестабильной с Turbo Boost из-за более высокой частоты процессора во время слабой нагрузки. Поэтому данную технологию лучше отключать. Если же уровень разгона не превышает 3,5 ГГц, то можно попытаться оставить Turbo Boost в активном режиме, при этом следить за стабильностью системы при выполнении однопоточных задач.

И последний момент, на который необходимо обратить внимание при повышении частоты процессоров архитектуры Nehalem. Компания Intel ввела механизм защиты Core i7 от «переразгона», который тесно связан с Turbo Boost. Если тепловыделение или проходящий ток через процессор превысит 130 Вт или 100 А, будет задействован режим троттлинга, при котором начнет снижаться коэффициент умножения CPU. Естественно, данная «забота» будет мешать при разгоне, и для ее обхода достаточно отключить функцию CPU TM Function в решениях от ASUS или установить порог TDP и силы тока в материнской плате от Intel (для процессоров Core i7-965 EE). После этого необходимо тщательно следить за температурой процессора, так как нынешний степпинг C0 ядра Bloomfield обладает горячим нравом при повышении частоты и напряжения. Кроме того, для охлаждения Core i7, работающего в нештатных режимах, необходимо использовать высокопроизводительный кулер, иначе предел разгона будет ниже ожидаемого уровня, так как максимальная температура, при которой включается защита CPU, равна 100 °C.

Вот, пожалуй, и все, что необходимо знать для разгона процессоров на базе архитектуры Nehalem. Осталось практически закрепить полученные знания и для выяснения разгонного потенциала процессора Intel Core i7-920, который попал на тестирование, была собрана следующая конфигурация:

  • Оперативная память: Team Xtreem Dark TXDD2048M1866HC8DC (2x1024 МБ, DDR3-1866);
  • Видеокарта: Zotac GeForce 9600GT AMP!;
  • Блок питания: Silver Power SP-S850 (850 Вт).
Для охлаждения процессора использовался кулер Noctua NH-U12P с отдельным фирменным креплением LGA1366 Mounting-Kit, выпущенным специально для платформы Nehalem и предлагаемым пользователям систем охлаждения Noctua бесплатно .


В качестве вентиляторов применялись Akasa AK-183-L2B и Foxconn PV122512L с частотой вращения около 1700 об/мин, так как пара Noctua NF-P12 (1300 об/мин) были не в состоянии справиться с охлаждением радиатора при высоких частотах Core i7.

Чтобы при разгоне не было никаких препятствий технология Turbo Boost отключалась, напряжение питания на процессоре устанавливалось в значение 1,4 В, CPU PLL — 1,88 В, на контроллере памяти и шины QPI (QPI/DRAM Core Voltage) выставлялось на уровне 1,35 В. На модулях памяти напряжение питания равнялось 1,65 В, при этом тайминги составляли 7-7-7-21, а коэффициент — 6х. Тестом на стабильность использовалась утилита OCCT v.2.01 с часовым прогоном.

С такими настройками удалось достичь всего 3700 МГц, и дальнейший рост уперся в банальный перегрев — даже при таком уровне разгона температура процессора составляла 96 °C. И это на открытом стенде!


Частота тактового генератора равнялась 185 МГц, Uncore и памяти — 2960 и 1110 МГц соответственно. Шина QPI немногим отличалась от стандартной частоты у процессора Core i7-965 EE.


Теперь становится ясно, почему пресс-киты для тестирования выдавались с кулерами Thermalright Ultra 120 Extreme — процессоры Core i7 попросту не смогли бы пройти тест на разгон. Потенциал ядра Bloomfield в плане тепловыделения просто поражает. Уже начинаем представлять, как толпы разъяренных фанатов Core i7 сметают с полок системы водяного охлаждения по 200 долларов за штуку…

А как же 4 ГГц, которые так легко получают на воздушном охлаждении? Для нашего экземпляра Core i7-920 данная частота стала возможной после отключения технологии Hyper-Threading и повышения напряжения питания до уровня 1,42 В.


Максимальная температура в таком режиме составила всего лишь 89 градусов Цельсия, что значительно лучше, чем предыдущий результат. Но даже почти 90 °C можно назвать слишком высокой температурой. Возможно, с выходом нового степпинга ядра данная проблема будет исправлена, как это обычно происходит после обкатки технологии производства процессорных кристаллов.

Частота Bclk равнялась «магическим» 200 МГц, которой ранее не могли достичь счастливые обозреватели, получившие задолго до официального анонса архитектуры Nehalem экземпляры Core i7 и выражавшие после тестов свое недовольство в новостной ленте различных сайтов. Но, как оказалось, новые процессоры без проблем покоряют данную частоту. Главное знать, где и что настраивать для достижения желаемого результата.

С повышением частоты тактового генератора до 200 МГц значительно увеличились частоты шины QPI и Uncore — до 3600 и 3200 МГц. Память при этом функционировала на 1200 МГц.


Дальнейший разгон успехом не увенчался — Bclk хоть и удавалось поднять до 205 МГц, тест на стабильность процессор уже не проходил. Даже после повышения напряжения питания на CPU и контроллере памяти. Скорее всего, частота в 4 ГГц является пределом для тестового Core i7-920.Тестовые конфигурации

Что же, пора заканчивать затянувшуюся историю о новой платформе Nehalem. А для этого как раз подойдут сравнительное тестирование системы на базе Core i7 с представителями предыдущего поколения. В качестве процессоров для платформы LGA775 использовались Core 2 Duo E8200 и Core 2 Quad Q9400, работающие на частоте 2,66 ГГц. Первый из них является самым производительным двухъядерным решением на такой частоте, а второй на момент проведения тестирования оказался единственным доступным вариантом, обладающим четырьмя ядрами. Нет смысла говорить, что локальный рынок фактически «заморожен», поставки сократились, а продажи резко упали. И на этой ниве собрать высокопроизводительный тестовый стенд становится проблематично. Но как показало наше тестирование, даже Core 2 Quad Q9400 в некоторых задачах может спокойно конкурировать с Core i7, работающим на одинаковой с ним частоте.

Характеристики сравниваемых процессоров занесены в представленную ниже таблицу.

Процессор Intel Core i7-920 Intel Core 2 Quad Q9400 Intel Core 2 Duo E8200
Архитектура Nehalem Penryn Penryn
Ядро Bloomfield Yorkfield Wolfdale
Разъем LGA1366 LGA775 LGA775
Техпроцесс 45 нм 45 нм 45 нм
Степпинг C0 R0 C0
Количество транзисторов 731 млн. 2 х 410 млн. 410 млн
Площадь ядра 263 кв.мм 2 х 107 кв.мм 107 кв.мм
Число ядер 4 (8 потоков) 4 2
Номинальная частота 2,66 ГГц 2,66 ГГц 2,66 ГГц
Объем L1 кэша 4 x (32+32) КБ 4 x (32+32) КБ 2 x (32+32) КБ
Объем L2 кэша 4 x 256 КБ 2 x 3 МБ 6 МБ
Объем L3 кэша 8 МБ - -
Множитель 20х, заблокирован на повышение 8х, заблокирован на повышение
Hyper-Threading + - -
Поддерживаемый тип памяти DDR3 800/1066 - -
Шина QPI (4,8 ГТ/с) FSB (1333 МГц) FSB (1333 МГц)
Номинальное напряжение 1,20 В 1,20 В 1,20 В
TDP 130 Вт 95 Вт 65 Вт
Средняя стоимость $328 $294 $181


Система на базе Core i7-920 была собрана с тем же составом, что и при разгоне, за исключением видеокарты, памяти и блока питания:
  • Процессор: Intel Core i7-920 (2,66 ГГц, 8 МБ кэш L3);
  • Материнская плата: ASUS Rampage II Extreme (Intel X58);
  • Кулер: Noctua NH-U12P с креплением LGA1366 Mounting-Kit;
  • Оперативная память: Aeneon AEH860UD00-10F (3x2048 МБ, DDR3-1066, 6-6-6-18);
  • Жёсткий диск: Samsung HD252HJ (250 ГБ, SATA2);


Все настройки BIOS Setup платы, кроме основных таймингов памяти и напряжений, выставлялись по умолчанию. Кроме того, Core i7-920 разгонялся до 3540 МГц (опорная частота 177 МГц, напряжение 1,4 В), память при этом работала с коэффициентом 6х, что соответствовало 1062 МГц. Тайминги оставались прежними. Также использовалось несколько режимов работы системы, а именно:
  1. «2,66/8/3/T» — стандартная частота процессора (2666 МГц), технология Hyper-Threading активирована, трехканальный режим, Turbo Boost включен;
  2. «2,66/4/3/T» — стандартная частота процессора (2666 МГц), технология Hyper-Threading деактивирована, трехканальный режим, Turbo Boost включен;
  3. «2,66/4/3/noT» — стандартная частота процессора (2666 МГц), технология Hyper-Threading деактивирована, трехканальный режим, Turbo Boost отключен;
  4. «2,66/4/2/noT» — стандартная частота процессора (2666 МГц), технология Hyper-Threading деактивирована, двухканальный режим, Turbo Boost отключен;
  5. «3,54/8/3/noT» — разгон процессора до 3540 МГц, технология Hyper-Threading активирована, трехканальный режим, Turbo Boost отключен;
  6. «3,54/4/3/noT» — разгон процессора до 3540 МГц, технология Hyper-Threading деактивирована, трехканальный режим, Turbo Boost отключен;
  7. «3,54/4/2/noT» — разгон процессора до 3540 МГц, технология Hyper-Threading деактивирована, двухканальный режим, Turbo Boost отключен.
Такое количество комбинаций позволит выяснить о необходимости использования технологий Hyper-Threading и Turbo Boost, а также трехканального доступа к памяти.

«Конкурирующая» система имела следующий вид:

  • Процессор №1: Core 2 Quad Q9400 (2,66 ГГц, 6 МБ кэш L2);
  • Процессор №2: Core 2 Duo E8200 (2,66 ГГц, 6 МБ кэш L2);
  • Материнская плата: ASUS Rampage Formula (Intel X48);
  • Кулер: Noctua NH-U12P с креплением LGA1366 Mounting-Kit;
  • Оперативная память: Team Xtreem Dark TXDD4096M1066HC5-D (2x2048 МБ, DDR2-1066, 5-5-5-15);
  • Видеокарта: Leadtek WinFast GTX 280;
  • Жёсткий диск: Samsung HD252HJ (250 ГБ, SATA2);
  • Блок питания: Seasonic SS-600HM (600 Вт).
Как и в случае с первой системой настройки платы устанавливались в автоматическом режиме, все напряжения и тайминги — вручную. Оба процессора разгонялись до частоты 3544 МГц (FSB 443 МГц, напряжение питания 1,375 В), память при этом функционировала на частоте 1068 МГц с таймингами 5-5-5-15.

В качестве операционной системы использовалась Windows Vista Ultimate x86 c SP1. Драйверы для систем были следующие:

  • X58: Intel Chipset Software Installation Utility 9.1.0.1007;
  • X58: SoundMAX Audio Driver v6.10.1.6480;
  • X48: Intel Chipset Software Installation Utility 8.3.0.1013;
  • X48: SoundMAX Audio Driver V6.10.01.6280;
  • Общие: ForceWare 180.48.
Брандмауэр и Windows Defender отключались, файл подкачки устанавливался в размере 3072 МБ. Настройки видеодрайвера не изменялись.

Результаты тестирования в прикладном ПО

Синтетика

Начнем, пожалуй, с синтетического пакета PCMark’05, который пользовался особой популярностью во времена противостояния Pentium 4 и Athlon 64, хотя и не отражал реальной картины производительности обеих платформ. Но рассматриваемые в материале системы полностью на базе процессоров Intel, так что, ни о каком «читерстве» и речи быть не может.



Итак, общий балл и результаты по процессорному тесту оказались предсказуемы, так как PCMark’05 чувствителен к многоядерным решениям и высокой частоте. Верхние строчки рейтинга занимает разогнанный Core i7-920 с различными режимами работы, следом идет Core 2 Quad Q9400, работающий на частоте 3,54 ГГц. Разогнанный Core 2 Duo E8200 в процессорном тесте показал примерно такой же результат, как и Core i7-920 без разгона и с активированной технологией Turbo Boost. Но уже в номинальном режиме двухъядерный CPU, естественно, показывает самый низкий результат.


В тесте памяти распределение по результатам закономерное, учитывая встроенный контроллер памяти у Bloomfield, и только Core 2 Duo E8200 показывает более высокий балл, чем Core 2 Quad Q9400.

Подсистема памяти




По той же причине Core i7 демонстрируют высокую производительность подсистемы памяти в Lavalys Everest, которая при разгоне процессора еще больше повышается, особенно при записи. Судя по всему, более высокая частота контроллера способствует росту этого показателя. Переход к двухканальному режиму не так существенно отражается на ПСП, как могло бы показаться. С возможностями Core i7 при записи смогли потягаться Core 2 Duo и Core 2 Quad лишь после повышения частоты, и то, за счет именно FSB, работающей на эффективных 1772 МГц.


Латентность памяти уменьшилась почти в два раза по сравнению с процессорами прошлого поколения, и это несмотря на использование DDR3. Переход к двухканальному режиму даже предпочтительнее в этом плане и можно сразу предположить о более высоком быстродействии в некоторых приложениях систем с двумя модулями памяти.

Архивирование



Оптимизированный под многопоточность архиватор 7-Zip (использовался словарь в 32 МБ) склонен к большему количеству ядер, чем к высокой частоте. Использование HT позволяет увеличить производительность при архивировании до более высокого уровня по сравнению с разогнанным процессором с этой отключенной технологией. При компрессии четырехъядерный Core 2 Quad Q9400 смотрится достойно на фоне Core i7, но только с повышением частоты, хотя уже при декомпрессии способен на равных потягаться с новым CPU.


Встроенный в архиватор WinRAR определяет быстродействие подсистемы «процессор-память» и всегда был неплохим мерилом производительности этой связки, но c Core i7-920 ведет себя странным образом: при частоте 3,54 ГГц с двухканальным режимом результат такой же, как и при «турбированных» 2,66 ГГц и задействованных трех каналах. Естественно, незначительное падение пропускной способности памяти при двух каналах не может так сильно отразиться на результатах. Возможно, с выходом новой версии данная проблема будет исправлена.

Рендеринг



В CINEBENCH 10 при рендеринге сцены с использованием одного CPU все режимы работы процессоров выстроились аккуратной лесенкой: Core 2 в номинале, Core i7 без Turbo Boost и с ним же, разогнанные Core 2 и Core i7. Количество задействованных каналов памяти в системе с Bloomfield особой роли не играет. Переход к мультиядерному тесту немного меняет картину и на первое место становится именно количество ядер в процессоре, а уже потом — частота.


А вот в тесте видеокарты все кардинально меняется и система на новой платформе набирает в полтора раза меньше баллов, чем на базе Core 2 Duo и Core 2 Quad. Что это, ахиллесова пята архитектуры Nehalem или попросту проблемы микрокода BIOS платы или драйверов? Будем надеяться на последнее.



Результаты в POV версии 3.7 beta 29 аналогичны CINIBENCH за исключением того, что при активации Hyper-Threading происходит падение производительности на Core i7 и его место на графике занимает четырехъядерный процессор архитектуры Penryn. Подобная проблема наблюдалась еще с Pentium 4 HT, который показывал более низкое быстродействие, когда одновременно обрабатываемые потоки были чувствительны к размеру кэшей. В случае активирования Hyper-Threading, объем кэш-памяти каждого физического ядра делится пополам и при слабой оптимизации кода программ под эту технологию как раз и будет наблюдаться падение производительности.

Работа с видео


Для кодирования видео все средства хороши: и количество ядер и их частота. Программой Virtual Dub кодировался ролик MPG2 объемом 0,97 ГБ при помощи кодека DivX 6.8.5, который поддерживает несколько ядер. Использование HT положительным образом сказалось на производительности, хотя и не значительно. Процессоры Core 2 лишь с разгоном могут конкурировать с новинкой от Intel.


Еще один тест по кодированию видео — x264 HD Benchmark, благосклонно отнесся к процессору новой архитектуры и безразлично к технологии Hyper-Threading. На графике представлен средний FPS по первому проходу версии 0.58.819M.

Кроме того, были сняты показания температуры во время прохождения всех четырех прогонов этого теста. Напоминаем, что при разгоне напряжение питания на процессоре Core i7-920 было 1,4 В, на остальных — 1,375 В.


Как ни странно, самым холодным оказался Core 2 Quad Q9400. Даже при увеличении частоты его температура не превышала 56 градусов Цельсия. Весьма горячий степпинг Core 2 Duo E8200 позволил ему нагреться при разгоне до 64 °C. Такая же температура у Core i7-920, работающего на номинальной частоте с отключенным Turbo Boost. Активирование HT значительно повышает температуру CPU, особенно при поднятии частоты. Как уже отмечалось выше, нынешняя ревизия Bloomfield отличается высоким тепловыделением и при повышении частоты и напряжения этот показатель сильно увеличивается. Поэтому для работы в нештатных режимах придется позаботиться о производительной системе охлаждения.

Математические расчеты


Fritz Chess Benchmark рассчитывает количество ходов за определенное время и, как и в случае с 7-Zip, решающим является количество логических/физических ядер и их частота.



Бенчмарк wPrime хорошо оптимизирован под многопоточность и в большей степени реагирует именно на количество ядер. Идеальная картина низкой производительности E8200 относительно своих четырехъядерных оппонентов наблюдается и здесь. И если так было бы во всех приложениях, то можно было бы заявить о приходе эры «квадов» в декстопные системы. Но, увы…


Утилита Super PI никакой поддержкой мультиядерности не обладает и полностью зависит от архитектурных особенностей процессора и его частоты, а также от подсистемы памяти. Лидирует по расчету 1-млн. знака числа Пи Core i7-920 на частоте 3,54 ГГц с результатами в 11 секунд. Следом за ним расположился Core 2 Duo E8200, за счет более емкого кэша, и Core 2 Quad Q9400, работающие на той же частоте, что и Core i7. Далее расположение мест идет таким же образом.Результаты тестирования в игровых приложениях

Ну и, конечно же, игры. Использовались известные синтетические тестовые пакеты от Futuremark Corp., а также небольшое количество игр, при тестировании в которых снималось несколько результатов. Один был при разрешении 1024х768 и среднем качестве, а два — при 1280х1024, 1600х1200 и высоком качестве.

Синтетика


В 3DMark 2001SE (который через пару лет отметит свой первый десяток лет) быстродействие Core i7 и Core 2 Duo практически одинаковое. Core 2 Quad отстает от них за счет меньшего кэша, и будь на его месте Q9450 с 12 МБ кэш-памяти второго уровня, возможно, расстановка сил немного изменилась бы. Использование двух каналов памяти благоприятно сказывается на производительности новой платформы.



Пакет 3DMark’06 в должной мере поддерживает многопоточность, что отразилось на результатах Core i7-920 с Hyper-Threading. Естественно, четырехъядерный процессор на базе архитектуры Penryn никаких шансов не оставил своему двухъядерному собрату, несмотря на два раза меньший L2-кэш, относящийся к каждой паре ядер.



3DMark Vantage еще больше реагирует на количество ядер. При номинальной частоте Core i7 все также опережает своих оппонентов за счет архитектурных особенностей. Следующий график не такой показательный, как предыдущие, но дает почву для дальнейших размышлений.


Итак, разница в GPU-тесте между режимами работы процессоров составляет доли процентов. Если же присмотреться к графику, то система с Bloomfield в большинстве случаев занимает последние строчки. К чему бы это?

Игры


Известный фейк о поддержке многопоточности в игре F.E.A.R. перекочевал и на ее продолжение Extraction Point, что делает игру сугубо измерителем потенциала процессора, как одноядерного решения. И если с Core i7 и так все ясно, то Core 2 Duo E8200 благодаря своему 6-мегабайтному кэшу второго уровня становится производительней четырехъядерного процессора.


Аппетиты движков Unreal Tournament становятся все умереннее и умереннее. Добавим современные тенденции и получим рост производительности 50% при переходе с двухъядерного процессора на платформу Nehalem. А если еще и разогнать… Core i7-920, то более 200 кадров в секунду обеспечены. Хотя, Core 2 Quad Q9400 тоже не промах при разгоне.



При использовании графики с максимальным качеством рост производительности уже не такой стремительный, а с повышением разрешения между разогнанным и не разогнанным Core i7 разница начинает нивелироваться. И, конечно же, обладателям мониторов с большей диагональю станет все равно, какой именно процессор у них установлен.


Вышедший осенью прошлого года шутер Far Cry 2 уже в полной мере поддерживает четырехъядерные процессоры, что видно по результатам.



Только вот незадача — опять непонятное падение производительности на системе с Bloomfield. Даже разогнанный двухъядерный E8200 показывает больший результат, чем Core i7-920, работающий на частоте 3,54 ГГц. Причем, минимальный FPS на последнем ниже, чем у оппонентов.


Математические расчеты берут свое и Core i7 в CPU тесте игры Crysis на 20-50% производительней процессоров предыдущего поколения. Лишь при разгоне Core 2 Quad Q9400 может конкурировать с новичком.



Ой, а мы это уже где-то видели: опять падение производительности на Core i7 при переходе к высоким разрешениям и качественной графике. Может, архитектура Nehalem вовсе и не игровая? Или это все та же проблема «BIOS-драйвера»? Пока сказать сложно, что именно является проблемой. Возможно, это как-то связано только с нашей системой и с другими в этом плане все в порядке. А для подтверждения этого факта необходимо провести исследование на платах других производителей, что и будет сделано в следующий раз.




В X3: Terran Conflict есть зачатки поддержки многоядерности и распределение мест по результатом как и положено, от Core 2 Duo до Core i7.


Процессорозависимая игра World in Conflict отлично отреагировала на новую архитектуру, что дало 50% прибавку к производительности при переходе со старой платформы на Nehalem. Использование Hyper-Threading немного сказалось на производительности, чего не скажешь о двухканальном доступе к памяти: в отличие от некоторых программ, играм достаточно пропускной способности двухканального режима.



С повышением качества и разрешения расстановка сил нисколько не изменилась, только Core 2 Quad Q9400 при разгоне «затесался» среди режимов работы Core i7-920 в номинале.

Выводы

В свое время выход архитектуры AMD64 и процессоров на ее базе назвали «Бархатной революцией». Об архитектуре Nehalem у нас сложилось схожее впечатление: если разработку Core 2 можно было действительно охарактеризовать как революционную, то Core i7 в ближайшем рассмотрении оказался «бархатным». Пойдя по пути своего конкурента, компания Intel отказалась от использования шины FSB, интегрировала в кристалл процессора кэш-память третьего уровня и контроллер памяти, причем, трехканальный. Давно забытая технология Hyper-Threading снова нашла место под солнцем, и для ее поддержки процессоры «научились» себя разгонять благодаря функции Turbo Boost. Теперь нет необходимости повышать частоту системной шины, пропускная способность памяти стала избыточной, а для дальнейшего развития платформы осталось лишь наращивать частоту самого процессора. Проектировать наборы системной логики стало легче, так как часть северного моста перекочевала в CPU, а учитывая планы Intel по выпуску процессора с графическим ядром, интегрированные чипсеты также лишатся своей основной функции, если и вовсе не исчезнут.

С другой стороны, мы имеем дело с переходом на совершенно другую платформу, которая требует материнские платы с разъемом LGA1366 на базе чипсета Intel X58 Express, стоимость которых выше решений на Intel X48. Добавим сюда необходимость использования дорогой памяти стандарта DDR3 (правда, для большинства задач достаточно использования двухканального режима), цену на сами процессоры, и получим просто нереальные цифры. Здесь как раз можно провести параллели с выходом платформы AMD64, которая хоть и поддерживала распространенные тогда память DDR и видеокарты AGP, доступной многим стала спустя год своего присутствия на рынке.

Но, несмотря на высокую стоимость старших моделей Core i7, самый доступный процессор на базе архитектуры Nehalem вполне реально может стать сердцем системы энтузиаста или даже рабочей станции. И для последней есть все основания: Core i7-920 силен в математических расчетах, архивировании, кодировании видео и рендеринге. За счет архитектурных особенностей и технологий Hyper-Threading и Turbo Boost новый процессор производительней четырехъядерных Core 2, работающих на равной или более высокой частоте.

Для оверклокеров платформа Nehalem станет очередным инструментом для самовыражения и покорения рейтингов ORB и hwbot.org . Особенности разгона Core i7 дают повод для новых исследований в этой области, а высокое тепловыделение процессоров при повышении частоты и напряжения станет «катализатором» для поиска новых и эффективных систем охлаждения. Введенная компанией Intel защита от переразгона в большинстве случаев обходится средствами материнских плат, благодаря чему частоты порядка 4 ГГц можно достичь без особых усилий.

А как же тогда геймеры? - спросите вы. А никак. Игры, которые сильно зависят от производительности процессора и оптимизированные под большое количество ядер, действительно будут чувствовать себя куда лучше на платформе Nehalem. Это в большей степени стратегии, симуляторы, шутеры с графикой, не особо нагружающей видеокарты. Если же движок «стрелялки» может похвастаться поддержкой модных технологий и эффектов, то разница от используемой платформы сводится к нулю. И в таком случае нет необходимости разбираться в математике, чтобы понять о целесообразности перехода на новую платформу.

Но как бы там ни было, выход Nehalem стал большим шагом в будущее. Наконец-то такой консервативный разработчик как Intel избавился от архаизмов в виде системной шины и контроллера памяти в чипсете. Сам же узаконил разгон в своих процессорах, хоть и незначительный. И, подчеркиваем, впервые получил право для чипсета поддерживать технологию NVIDIA SLI, которая была прерогативой сугубо калифорнийской компании. Теперь материнские платы на базе X58 смогут поддерживать как CrossFire, так и SLI, а это уже дает широкий выбор для постройки мультичиповых конфигураций.

Благодарим следующие компании за предоставленное тестовое оборудование:

  • Представительство Intel за процессор Core i7-920;
  • Представительство ASUS за материнские платы ASUS Rampage II Extreme и Rampage Formula;
  • Eletek за память Team Xtreem Dark TXDD2048M1866HC8DC и TXDD4096M1066HC5-D;
  • Leadtek Research за видеокарту Leadtek WinFast GTX 280;
  • Квазар-Микро за видеокарту Zotac GeForce 9600GT AMP!;
  • MaxPoint за блок питания Silver Power SP-S850;
  • Синтекс за блок питания Seasonic SS-600HM;
  • Мастер Групп за процессор Intel Core 2 Quad Q9400 и память Aeneon AEH860UD00-10F;
  • Noctua за кулер Noctua NH-U12P, крепление LGA1366 Mounting-Kit и термопасту Noctua NT-H1.

Казалось бы, интеграция контроллера памяти должна разгрузить процессорную шину, которая в этом случае оказывается освобождена от передачи данных между процессором и памятью. И это отчасти верно, но только для однопроцессорных систем. Микроархитектура Nehalem же универсальна, её предполагается использовать как в настольных и мобильных, так и в серверных продуктах. Поэтому при разработке новой микроархитектуры Intel уделила внимание и проектированию новой процессорной шины, которая бы оказалась применима и в многопроцессорных системах, обеспечивая необходимую пропускную способность и масштабируемость. Впрочем, иного выхода у инженеров и не было, так как привычная шина FSB в данном случае оказывается неприменима: многопроцессорные системы, построенные на процессорах со встроенными контроллерами памяти, должны использовать «распределенную» модель памяти NUMA (Non-Uniform Memory Access), а, следовательно, нуждаются в прямом и высокоскоростном соединении между процессорами. Для решения этой задачи был построен специальный последовательный интерфейс CSI (Common System Interface) с топологией точка-точка, переименованный впоследствии в QPI (QuickPath Interconnect). С технической точки зрения шина QPI представляет собой два 20-битных соединения, ориентированных на передачу данных в прямом и обратном направлении. 16 бит предназначаются для передачи данных, оставшиеся четыре – носят вспомогательный характер, они используются протоколом и коррекцией ошибок. Эта шина работает на максимальной скорости 6,4 миллиона передач данных в секунду (GT/s) и имеет, соответственно, пропускную способность 12,8 Гбайт/с в каждую сторону или 25,6 Гбайт/с суммарно.

Рис. 11. Шина данных

На сегодня пропускная способность QPI такова, что эту шину можно смело назвать самой скоростной процессорной шиной. Так, старая Quad Pumped Bus достигает суммарной пиковой скорости 12,8 Гбайт/с только при частоте 1600 МГц. Похожая же на QPI шина HyperTransport 3.0, применяемая в современных процессорах AMD, может похвастать пиковой скоростью лишь 24 Гбайт/с. В зависимости от рыночного ориентирования, процессоры с микроархитектурой Nehalem могут комплектоваться одним или несколькими интерфейсами QPI. В итоге в многопроцессорной системе каждый из процессоров может иметь прямую связь со всеми остальными процессорами для снижения латентности при обращении к памяти, подключенной к «чужому» контроллеру. Модели же для однопроцессорных настольных систем будут снабжаться единственным QPI, который будет использоваться для связи с набором логики материнской платы.

Управление питанием и Turbo-режим

Многие изменения, реализованные инженерами Intel в процессорах Nehalem, связаны с оптимизацией микроархитектуры под врождённое многоядерное строение. Поэтому необходимость пересмотра системы управления питанием процессора назрела сама собой. Многоядерные процессоры с микроархитектурой Core очень неэкономичны с той точки зрения, что управление энергосбережением в них происходит по единому алгоритму, который практически не учитывает состояния отдельных ядер. И поэтому, например, нередки ситуации, когда одно находящееся под вычислительной нагрузкой ядро препятствует переходу в энергосберегающие состояния остальных ядер, несмотря на то, что они, фактически, простаивают. Именно поэтому микроархитектура Nehalem предполагает наличие в процессоре ещё одного важного блока – PCU (Power Control Unit). Этот блок представляет собой встроенный в процессор программируемый микроконтроллер (то есть, по сути процессор в процессоре), целью которого является «интеллектуальное» управление потреблением энергии. Неудивительно, что при этом PCU имеет достаточно сложную конструкцию: на его реализацию ушёл примерно 1 миллион транзисторов.

Основным предназначением PCU является управление частотой и напряжением питания отдельных ядер, для чего этот блок имеет все необходимые средства. Он получает от всех ядер со встроенных в них датчиков всю информацию о температуре, напряжении и силе тока. Основываясь на этих данных, PCU может переводить отдельные ядра в энергосберегающие состояния, а также управлять их частотой и напряжением питания. В частности, PCU может независимо друг от друга отключать неактивные ядра, переводя их в состояние глубокого сна, в котором энергопотребление ядра приближается к нулевой отметке. Для реализации такой возможности инженеры и технологи Intel разработали специальный полупроводниковый материал, посредством которого стало возможно независимое отключение ядер от общей шины питания. Главное преимущество этой технологии состоит в том, что управление питанием отдельных ядер осуществляется целиком внутри процессора и не требует усложнения схемы конвертера питания на материнской плате. Что же касается общих для всех ядер процессорных блоков, таких как контроллеры памяти и интерфейса QPI, то они переходят в энергосберегающие состояния, когда в состоянии сна находятся все процессорные ядра. Наличие в процессоре контроллера, способного независимо управлять состоянием процессорных ядер, позволило Intel реализовать и ещё одну интересную технологию, получившую название Turbo Boost Technology. Эта технология вводит понятие турбо-режима, в котором отдельные ядра могут работать на частоте, превосходящей номинальную, то есть разгоняться. Основной принцип Turbo Boost Technology состоит в том, что при переходе отдельных ядер в энергосберегающие состояния снижается общее энергопотребление и тепловыделение процессора, а это в свою очередь позволяет нарастить частоты остальных ядер без риска выйти за установленные рамки TDP. Фактически, прообраз этой технологии уже был реализован в двухъядерных мобильных процессорах поколения Penryn, однако в Nehalem её развитие продвинулось ещё дальше. В новых процессорах, если нет риска выйти за границу типичного энергопотребления и тепловыделения, PCU может повышать частоты процессорных ядер на один шаг выше номинала (133 МГц). Это может происходить, например, при слабо распараллеленной нагрузке, когда часть ядер находится в состоянии простоя.

Рис. 13. Повышение частоты работы

Более того, при соблюдении описанных условий, частота одного из ядер может быть увеличена и на два шага выше номинала (266 МГц).

Рис. 14. Сверхповышение частоты работы

Следует отметить, что необходимым условием включения турбо-режима вовсе не является переход одного или нескольких ядер в энергосберегающее состояние. Это – всего лишь один из возможных сценариев. Так как PCU имеет все средства для получения данных о фактическом состоянии процессорных ядер, турбо-режим может задействоваться и в тех случаях, когда все ядра работают, но нагрузка на часть из них невелика. Большим преимуществом Turbo Boost Technology является её полная прозрачность для операционной системы. Эта технология реализована исключительно аппаратными средствами и не требует использования никаких программных утилит для своей активации. Чтобы посмотреть, как это выглядит на практике, мы проследили за состоянием четырёхъядерного процессора Nehalem с номинальной частотой 3,2 ГГц при запуске от одного до восьми вычислительных потоков, создаваемых утилитой Prime95. При отсутствии нагрузки срабатывает технология Intel Enhanced SpeedStep – частота процессора сбрасывается до 1,6 ГГц. Запуск одного потока приводит к активации единственного ядра, что позволяет процессору поднять собственный множитель с 24x до 26x, тем самым увеличивая тактовую частоту до 3,46 ГГц. Два потока увеличивают загрузку процессора настолько, что PCU находит возможным лишь повышение частоты до 3,33 ГГц. Такая ситуация остаётся неизменной и при дальнейшем росте количества потоков – вплоть до пяти. И только шестой поток, поднимающий загрузку процессора до 75 %, приводит его частоту к положенной штатной величине 3,2 ГГц. Иными словами, Turbo Boost Technology представляется отнюдь не эфемерной вещью, её эффект более чем осязаем.

Системная шина играет ключевую роль во взаимодействии CPU с остальными компонентами компьютера. Intel разработала для своих новых многоядерных процессоров скоростной и экономичный интерфейс QPI. Последовательная шина QPI позволила ликвидировать многие "узкие места. В случае, если процессору потребуется доступ к выделенной памяти другого CPU, он сможет связаться с ней посредством одного из каналов QPI.

Основное достоинство нового интерфейса QPI - это сочетание высокой пропускной способности - до 15 Гбит/с и низкого энергопотребления (не более 5,0 мВт на каждый гигабит в секунду при пропускной способности 15 Гбит/с). При скорости передачи данных 5 Гбит/с новый интерфейс Intel обладает уровнем энергопотребления не более 2,7 мВт на каждый гигабит в секунду. Эти результаты сегодня являются рекордными с точки зрения эффективности работы современных приёмников данных Теоретически, Intel может повысить пропускную способность существующих интерфейсов в три раза, довольствуясь только 25% уровня энергопотребления нынешних интерфейсов.

Главный параметр системы, влияющий на частоту практически всех узлов системы - частота тактового генератора - Host Clock Frequency (при конфигурировании задаётся на первом же экране раздела «Performance»). Штатное значение этой частоты - 133 МГц, однако некоторые платы предлагают широкие возможности для её увеличения, например, до 240 МГц (пределы медных линий см. на рис. 1).

Частота шины QPI формируется за счет умножения определенного коэффициента на частоту тактового генератора, равную в номинале 133 МГц. Ее также называют опорной частотой шины QPI - QPI bclk или просто Bclk (есть, например, специальная утилита «CPU-Z», которая определяет ее как Bus Speed). За счет Bclk формируются частоты ядер процессора, кэш-памяти, контроллера памяти и частота системной памяти.

Рис. 1.

Таким образом, в современных системах на процессорах Intel в Core i7 частота 133 МГц - это просто частота тактового генератора, формирующего все остальные частоты.

Аналогичным образом формируется и частота шины памяти, которая использует свой собственный набор множителей.Для частоты шины памяти процессоры Core i7 предложат несколько доступных множителей. Например, процессор Core i7-965 Extreme Edition предлагает выбор между 6x, 8x, 10x и 12x, что означает поддержку этим процессором памяти DDR3-800/1067/1333/1600 SDRAM.

Интерфейс QPI, связывающий процессор с северным мостом (и другими процессорами см. рис. 2), также использует эту частоту в качестве базовой, умножая её на свой собственный коэффициент. Частота интерфейса QPI будет варьироваться на разных моделях CPU. Так, в Core i7-965 Extreme Edition эта шина работает на частоте 3,2 ГГц, в то время как на Core i7-940 и i7-920 её частота понижена до 2,4 ГГц.

Рис. 2.

Что касается возможности разгона шины QPI, то почти все процессоры будут ею обладать в полной мере. Множитель частоты шины QPI - от 4x до 64x (но процессоры Core i7 920 -2.66 ГГц и Core i7 940 - 2.93 ГГц не будут позволять повышать множитель, определяющий тактовую частоту ядер и, соответственно, технология Intel Dynamic Speed Technology ими тоже поддерживаться не будет).

Частота шины QPI для процессоров Intel Core i7-920 и Core i7-940 составляет 2,4 ГГц, что эквивалентно пропускной способности 4800 мегатранзакций в секунду (или 4,8 ГТ/с). Для Core i7-965 EE это значение соответствует 3,2 ГГц или 6,4 ГТ/с. Зная частоту QPI можно высчитать коэффициент умножения шины у каждого из процессоров: для Core i7-920 и Core i7-940 он равен 18, для Core i7-965 EE - 24. Но частота шины Quick Path Interconnect не единственная проблема, с которой можно будет столкнуться при разгоне Core i7. При разгоне CPU путем повышения Bclk будут расти частоты всех блоков процессора, шины QPI и памяти, что может нарушить их стабильную работу.

В новых CPU кэш третьего уровня и контроллер памяти (данная часть процессора называется Uncore) работает на отличной от процессора частоте (по рекомендации Intel, частота этих блоков должна быть в два раза выше эффективной частоты памяти). Данный параметр изменяется в настройках BIOS Setup материнской платы (коэффициентом или выбором частоты). Отслеживать значения Uncore можно, например, при помощи все той же утилиты CPU-Z - за это отвечает параметр NB Frequency в закладке Memory.

Значительного повышения эффективности новой шины удалось добиться за счёт динамического управления частотой и напряжением принимающего и передающего чипов, а также некоторых других нововведений. Кроме того, компания также разработала чип-диспетчер, который позволяет аппаратно распределять потоки между ядрами процессора. Производительность симулированного 64-ядерного процессора при его помощи удалось повысить в два раза. Все эти новые разработки Intel приведут к появлению еще более эффективных и экономичных многоядерных процессоров. Новая технологии приёма/передачи данных, которая будет использоваться в многопроцессорных системах следующего поколения, требующих не только повышенной пропускной способности канала ввода/вывода, но и более эффективного с точки зрения потребляемой мощности интерфейса передачи информации.

Шина QPI, является аналогом шины HyperTransport от AMD, и тоже предназначена для связи процессора с другими компонентами. Она призвана обеспечить согласованный обмен данными между небольшими группами локальных процессоров, а также взаимодействие между банками памяти (даже не обязательно одного типа) в распределенных системах, включающих не более 128 процессоров. QPI обеспечивает меньшие задержки и более высокую производительность, по сравнению с HyperTransport.

Шина QuickPath дебютировала в рамках серверной платформы Tylersburg, которая использует процессоры поколения Nehalem с разделяемым кэшем третьего уровня и поддержкой "виртуальной многоядерности", в частности, система на базе двух четырёхъядерных процессоров сможет имитировать работу шестнадцати процессорных ядер.

Ключевой особенностью новой архитектуры является применение концепции масштабируемой разделяемой памяти (scalable shared memory). В рамках новой архитектуры каждый CPU будет иметь собственную выделенную память, к которой он будет обращаться напрямую, через свой интегрированный контроллер памяти.

В случае, если процессору потребуется доступ к выделенной памяти другого CPU, он сможет связаться с ней посредством одного из каналов QuickPath Interconnect. Как и шина HyperTransport, применяемая в процессорах компании AMD, QPI будет использовать последовательную связь по схеме "точка-точка" (point-to-point), что обеспечит высокую скорость при малой латентности. Итак, основными ключевыми характеристиками Intel QuickPath Architecture являются:

Производительность каналов QuickPath Interconnect до 6,4 гигатранзакций в секунду (благодаря чему общая пропускная способность может достигать 25,6 Гбайт/сек)

QPI уменьшает количество служебной информации, необходимой для функционирования многопроцессорных систем (что, соответственно, позволяет повысить скорость передачи полезных данных);

Реализация контроля при помощи циклического избыточного кода (CRC) и повторной передачи при обнаружении ошибок на канальном уровне (что позволяет обеспечить целостность данных без ощутимого влияния на производительность);

Возможность реализации высокоуровневых функций обеспечения надежности, готовности и удобства обслуживания (RAS, Reliability, Availability and Serviceability) благодаря реконфигурации каналов в случае повреждения отдельных участков, поддержке "горячей замены". При нарушении сигнала в одной или нескольких из линий контроллер шины может автоматически перенастроить QPI на ширину 15 и даже 5 бит, не теряя работоспособности, таким образом, серверы, например, на базе мощных процессоров Xeon 5500 будут обладать повышенной устойчивостью к сбоям шины (рис. 3). При организации шины с различной шириной линий, управ-лением потоком данных занимает-ся специальный агент QPI, который распределяет поток данных перед тем, как от-править его по различным физи-ческим линиям, а при приеме аналогичный агент собирает разные потоки данных в один (рис. 3).

Рис. 3. Пример конфигурирования 20 каналов в четыре группы по 5 каналов

В случае, если процессору потребуется доступ к выделенной памяти другого CPU, он сможет связаться с ней посредством одного из каналов QPI (рис. 2). Шина QPI использует последовательную связь по схеме "точка-точка" (point-to-point), что обеспечивает высокую скорость при малой латентности.

Рис. 4. Архитектурные особенности процессоров Core i7 с шиной QPI

Серверные модели оборудованы двумя (и более) линиями QPI (рис. 4), что позволяет выделить всем критичным направлениям (например, связь двух процессоров между собой и каждого из них с северным мостом) по собственному соединению. В любом случае, производительности QuickPath Interconnect вполне достаточно, чтобы обеспечить нормальную работу платформ с несколькими CPU. Интерфейс QPI в 2-3 раза эффективнее и к тому же не обременен взаимодействием с оперативной памятью (этим занимается встроенный контроллер памяти DDR3).

Рис. 5. Принципы организации шины QuickPath Interconnect (каждую отдельную дифференциальную пару называют линией. 20 линий для обмена плюс линии синхронизации в каждом направлении образуют 84-х контактный интерфейс)

Специальный последовательный интерфейс с топологией точка-точка, именованный как QPI (QuickPath Interconnect) с технической точки зрения представляет собой два 20-битных соединения, ориентированных на передачу данных в прямом и обратном направлении (рис. 5). Из 20 битного соединения 16 бит предназначаются для передачи данных, оставшиеся четыре - носят вспомогательный характер, они используются протоколом и коррекцией ошибок. Таким образом, QPI является последовательной, высокоскоростной двунаправленной шиной. Ее ширина в каждую сторону (передача и прием) составляет по 20 бит (20 отдельных пар линий), при этом 16 бит отводится для передачи данных, две линии зарезервированы для передачи служебных сигналов и еще две - для передачи кодов коррекции ошибок CRC. C учетом еще двух пар линий, используемых для сигналов синхронизации (одна на прием и одна на передачу), получаем, что шина QPI состоит из 42 пар линий, то есть является 84-контактной. Это соединение представляет собой пару из двух шин функционирующих в режиме полного дуплекса, снабженных задающей тактовую частоту линией.

Базовый физический уровень состоит из двойного симплексного канала, осуществляющего функции приемной и передающей пары (т. е. по сути реализован дуплексный коммуникационный канал). На физическом уровне шина об-разована двумя парами проводников: одна пара служит для передачи данных, а вторая - для их приема (рис. 6. Две такие пары позволяют организовать двунаправленную линию передачи данных, если полосы пропускания не-достаточно, то для того, что-бы обеспечить большую пропус-кную способность, поддержива-ется не одна, а несколько таких двунаправленных линий связи. Этот уровень интерфейса определяет операцию и особенности индивидуальных сигналов линий шины QPI.

Физический уровень содержит все необходимые схемы для выполнения интерфейсных операций обмена данными, включая драйвер и входные/входные буферы, параллельное-последо-вательное и последовательно-параллельное преобразование, схему(ы) ФАПЧ и схемs согласования импеданса. Кроме того, он включает также логиче-ские функции, связанные с инициализацией и поддержкой интерфейса.

Логическая часть физического уровня обеспечивает соединение со уровнем связи и управляет потоком информации между ними (вперед и назад). А также управляет инициализацией и конфигурированием канала связи и управляет шириной информационной магистрали в операции обмена.

Рис. 6. Общая блок-схема физического уровня

Физический интерфейс шины отличается простотой реализации, в нем используются низковольтные, дифференциальные сигналы (рис. 7). Для передачи сигналов используются две линии, по которым синхронно передается прямой и инверсный сигнал. Для мобильных систем могут использоваться сигналы снижающие энергопотребление шиной, на линиях шины обеспечивается низкий уровень перекрестных помех.

Рис. 7. Принципы физической реализации линий связи шины

Физический уровень разделен на две секции. Аналоговая (или электрическая) секция управляет передачей цифровых данных. Эта секция формирует соответствующие аналоговые уровни сигналов с надлежащим выбором времени относительно сигнала синхронизации и затем принимает сигналы данных на другом конце и преобразовывает их обратно в цифровые данные. Этот уровень ответственен за сигналы и специфические детали выполнения операции обмена между двумя агентами. Этот уровень непосредственно управляет передачей сигналов данных на проводах шины, включает электрические уровни, рассчитывая аспекты, и решает логические проблемы, возникающие при посылке и получении каждого бита информации по параллельным шинам. Передача сигналов в обе стороны выполняется на высокой скорости в дифференциальном виде по 20 отдельным парам в одном цикле шины, реализующем одну операцию обмена. Отдельная линия синхронизации сопровождает свой набор из 20 пар линий передачи данных.

Интерфейс Intel® QuickPath чтобы для обеспечения передачи всей номенклатуры сигналов одной шины QPI, работающей в ее полной ширине, на физическом уровне использует восемьдесят четыре линии и соответственно 84 контакта. В некоторых случаях, связь может осуществляться в половине или четверти ширины шины, например, чтобы уменьшить расход энергии или из-за отказов на линии. Единицу информации, переданной в каждой единице времени физическим слоем называют phit, который является акронимом для физической единицы. Например, каждый phit может содержать 20 бит информации. Типичные скорости передачи сигналов связи в текущих продуктах обеспечивают в операциях обмена в 6.4 GT/s для систем с короткими связями между компонентами, и 4.8 GT/s для более длинных связей, используемых в больших мультипроцессорных системах. Управ-лением потоком данных занимает-ся специальный «агент», который распределяет поток данных перед тем, как от-править его по различным физи-ческим линиям, а при приеме аналогичный агент собирает разные потоки данных в один.

Для обмена информацией между компонентами системы используются пакеты. Пакетная связь начинается на канальном уровне для реализации функций управления каналом. Паке-ты формируются для того, чтобы надежно перенести информацию от передающего к принимающему компоненту. Поскольку па-кеты передаются через соответствующие уровни, они дополняются вспомогательной информацией, необходимой для обработки пакета на соответствующем уровне. На принимающей стороне происходит обратный процесс, и пакет преоб-разовывается обратно, начиная с физического уровня и далее, до формата, в котором он может быть обрабо-тан принимающим устройством.

Рис. 8. Типовая обобщенная структура пакета и состав пакета для разных уровней

Физический уровень принимает с линий связи кадр проверяет его корректность и выделяет из него пакет. Физическим уровнем биты phits и биты контроля циклического избыточного кода не контролируются. Физический уровень объединяет phits в пакеты, и передает пакеты на уровень связи. Каждый пакет, состоит из 80 бит (рис. 8). Рис. 9 иллюстрирует возможности физического уровня передачи информации кадра по шине QPI.

Рис. 9. Физический уровень Intel® QPI (Phit) требует для передачи 20 физических линий передач.

Поддержка ассиметричных связей и хорошая масштабируемость по скорости, по ширине шины, частоте и направлению, позволяет разработчикам систем выбирать решение полностью соответствующее их задачам. Широкая полоса пропускания позволяет в проектируемых многопроцессорных системах легко добавлять новые высокопроизводительные компоненты. Использование шины QPI позволяет сократить время на разработку этих проектов, так как добавление в систему новых чипов не вызывает проблем.

FSB - наверняка, многие пользователи не раз слышали о таком компьютерном термине. Это название носит один из важнейших компонентов материнской платы – системная шина.

Как известно, сердцем любого персонального компьютера является центральный процессор. Но не только процессор определяет архитектуру ПК. Она также во многом зависит и от используемого на материнской плате набора вспомогательных микросхем (чипсета). Кроме того, процессор не может функционировать и без внутренних шин, представляющих собой набор сигнальных проводников на системной плате. В функции шин входит передача информации между различными устройствами компьютера и центральным процессором. Характеристики внутренних шин, в частности, их пропускная способность и частота во многом определяют и характеристики самого компьютера.

Пожалуй, наиболее важной из шин, от которой больше всего зависит производительность компьютера, является шина FSB. Аббревиатура FSB расшифровывается как Front Side Bus, что можно перевести как «передняя» шина. В основные функции шины входит передача данных между процессором и чипсетом. Точнее говоря, FSB располагается между процессором и микросхемой «северного моста» материнской платы, где находится контроллер оперативной памяти.

Связь же между северным мостом и другой важной микросхемой чипсета, называемой «южным мостом» и содержащей контроллеры устройств ввода-вывода, в современных компьютерах обычно осуществляется при помощи другой шины, которая носит наименование Direct Media Interface.

Как правило, процессор и шина имеют одну и ту же базовую частоту, которая называется опорной или реальной. В случае процессора его конечная частота определяется произведением опорной частоты на определенный множитель. Вообще говоря, реальная частота FSB обычно является основной частотой материнской платы, при помощи которой определяются рабочие частоты всех остальных устройств.

В большинстве старых компьютеров реальная частота системной шины определяла и частоту оперативной памяти, однако сейчас память часто может иметь и другую частоту – в том случае, если контроллер памяти располагается в самом процессоре. Кроме того, следует иметь в виду, что реальная частота шины не эквивалентна ее эффективной частоте, которая определяется количеством передаваемых бит информации в секунду.

В настоящее время данная шина считается устаревшей и постепенно заменяется более новыми – QuickPath и HyperTransport. Системная шина QuickPath является разработкой фирмы Intel, а HyperTransport – компании AMD.

Front Side Bus в традиционной архитектуре чипсета

QuickPath

Шина QuickPath Interconnect (QPI) была разработана Intel в 2008 г. для замены традиционной шины FSB. Первоначально QPI использовалась в компьютерах на основе процессоров Xeon и Itanium. Разработка QPI была призвана бросить вызов уже использовавшейся в течение некоторого времени в чипсетах AMD шине Hypertransport.

Хотя QPI принято называть шиной, тем не менее, ее свойства существенно отличаются от свойств традиционной системной шины, и по своему устройству она представляет собой проводное соединение типа interconnect. QPI является неотъемлемой частью технологии, которую Intel называет архитектурой QuickPath. Всего QPI имеет в своем составе 20 линий данных, а общее количество проводников шины QPI равно 84. Как и Hypertransport, технология QuickPath подразумевает, что контроллер памяти встроен в сам центральный процессор, поэтому она используется лишь для связи процессора с контроллером ввода-вывода. Шина QuickPath может работать на частотах в 2.4, 2.93, 3.2, 4.0 или 4.8 ГГц.

Схема расположения QuickPath Interconnect

Hypertransport

Шина Hypertransport является разработкой AMD. Hypertransport имеет рабочие характеристики, сближающие ее с шиной QuickPath, но при этом она была создана на несколько лет раньше последней. Шину отличают оригинальные архитектура и топология, совершенно непохожие на архитектуру и топологию FSB. В основе шины Hypertransport лежат такие составные элементы, как тоннели, мосты, линки и цепи. Архитектура шины призвана исключить узкие места в схеме соединений между отдельными устройствами материнской платы и передавать информацию с высокой скоростью и небольшим количеством задержек.

Существует несколько версий Hypertransport, работающих на разной тактовой частоте – от 200 МГц до 3,2 ГГц. Максимальная пропускная способность шины для версии 3.1 составляет более 51 ГБ/с (в обоих направлениях). Шина используется как для замены шины FSB в однопроцессорных системах, так и в качестве основной шины в многопроцессорных компьютерах.

Схема расположения шины Hypertransport

Direct Media Interface

Пару слов стоит сказать и о такой разновидности системной шины, как Direct Media Interface (DMI). DMI предназначена для соединения между двумя основными микросхемами чипсета – северным и южным мостами. Впервые шина типа DMI была использована в чипсетах Intel в 2004 г.

Шина DMI имеет свойства архитектуры, объединяющие ее с такой шиной для подключения периферийных устройств, как PCI Express. В частности, DMI использует линии с последовательной передачей данных, а также имеет отдельные проводники для передачи и приема данных.

Место DMI (обозначена красным) в архитектуре компьютера.

Оригинальная реализация DMI обеспечивала передачу данных до 10 ГБит/c в каждом направлении. Современная же версия шины, DMI 2.0, может поддерживать скорость в 20 ГБ/c в обоих направлениях. Многие мобильные версии DMI имеют вдвое меньшее количество сигнальных линий по сравнению с версиями DMI для настольных систем.

Заключение

Системная шина является своеобразной кровеносной «артерией» любого компьютера, обеспечивающей передачу данных от «сердца» материнской платы – процессора к остальным микросхемам материнской платы и, прежде всего, к северному мосту, управляющем работой оперативной памяти. В настоящее время в различных архитектурах материнских плат можно встретить как традиционную шину FSB, так и имеющие сложные топологии высокоэффективные шины Hypertransport и QPI. Характеристики, производительность и архитектура системной шины являются важными факторами, которые определяют потенциальные возможности компьютера.

Появление семейства новых процессоров Intel Core i7 (кодовое название Nehalem) ознаменовало собой новую эпоху в развитии компьютеров. Дело в том, что эти процессоры не просто имеют новую микроархитектуру - они несовместимы с предыдущими компьютерными платформами. Изменились и принципы разгона систем и настройки BIOS. В этой статье мы рассмотрим особенности настройки BIOS систем на базе процессоров семейства Intel Core i7.

Несмотря на глобальный экономический кризис, под конец года компания Intel все же порадовала своих поклонников и в полном соответствии с ранее намеченными планами приступила к массовому производству новых процессоров семейства Intel Core i7, известных также под кодовым названием Nehalem.

Увы, но даже топовым моделям процессоров предыдущего поколения семейств Intel Core 2 Duo и Intel Core 2 Quad конкурентам Intel было просто нечего противопоставить, что уж говорить о новом поколении процессоров. Так что о процессорах компании AMD теперь можно вспоминать только как об основе разве что для самых дешевых компьютеров начального уровня.

В настоящее время компания Intel производит несколько моделей четырехъядерного процессора Intel Core i7 с кодовым названием Bloomfield для сегмента высокопроизводительных настольных ПК, а в следующем году собирается расширить модельный ряд процессоров Intel Core i7.

В этой статье мы не будем рассматривать микроархитектуру процессоров Intel Core i7 (о ней подробно рассказывается в статье «Процессоры семейства Intel Core i7», опубликованной в данном номере журнала), а сконцентрируемся на особенностях настройки BIOS компьютеров на базе новых процессоров. Дело в том, что настройка BIOS новых систем имеет ряд принципиальных отличий от настройки BIOS систем на базе процессоров предыдущего поколения, что связано с кардинальным изменением микроархитектуры процессора.

Отличия процессора Intel Core i7 от процессоров предыдущего поколения

Прежде чем переходить к обсуждению особенностей настройки BIOS систем на базе новых процессоров Intel Corei7, вкратце рассмотрим принципиальные отличия новых процессоров Intel от процессоров предыдущих поколений на примере четырехъядерного процессора Bloomfield.

Все процессоры Bloomfield изготавливаются по 45-нанометровой технологии, а их TDP составляет 130 Вт. Конструктивно процессор Bloomfield представляет собой четыре ядра на одном кристалле, то есть является истинно четырехъядерным и содержит 731 млн транзисторов.

Забегая вперед, отметим, что в настоящее время производится три варианта процессора Bloomfield: Intel Core i7-965 Extreme Edition, Intel Core i7-940 и Intel Core i7-920. Процессор Intel Core i7-965 Extreme Edition имеет тактовую частоту 3,2 ГГц и скорость QPI 6,4 GT/s; процессор Intel Core i7-940 - тактовую частоту 2,93 ГГц и скорость QPI 4,8 GT/s, а процессор Intel Core i7-920 - 2,66 ГГц и скорость QPI 4,8 GT/s. Для всех трех моделей процессоров Bloomfield размер L3-кэша составляет 8 Мбайт.

Сегодня процессоры Bloomfield совместимы только с чипсетом Intel X58 Express (кодовое название Tylersburg), который представляет собой двухчиповое решение (северный мост в паре с южным мостом). В качестве южного моста используется ICH10R.

Основные особенности процессора Bloomfield, кардинально отличающие его от процессоров предыдущего поколения, следующие:

  • новый разъем процессора LGA 1366;
  • наличие в процессоре интегрированного трехканального контроллера памяти DDR3;
  • связь с северным мостом чипсета по новой шине QPI;
  • наличие кэша L3 и изменение иерархии кэш-памяти процессора;
  • поддержка режима Hyper-Threading;
  • поддержка режима Turbo Mode.

При этом, говоря об отличиях процессора Bloomfield, мы, как уже отмечалось, не рассматриваем особенности микроархитектуры ядра процессора.

Новый разъем процессора LGA 1366

Одна из особенностей четырехъядерного процессора Bloomfield заключается в том, что он оснащен новым разъемом LGA 1366, то есть имеет уже не 775, а 1366 контактов. Собственно, даже по своим размерам новый процессор Bloomfield превосходит процессоры предыдущих поколений. Так, если процессоры семейств Intel Core 2 Duo и Intel Core 2 Quad с разъемом LGA 775 имели размер упаковки 37,5x37,5 мм, то упаковка процессора Bloomfield - 42,5x45 мм.

Изменение типа разъема процессора повлекло за собой изменение системы крепления кулера - для процессоров Bloomfield потребуется кулер с системой крепления под разъем LGA 1366, а вот кулеры для процессоров с разъемом LGA 775 уже не подойдут.

Интегрированный трехканальный контроллер памяти DDR3

Пожалуй, главной особенностью процессора Bloomfield является наличие в нем интегрированного трехканального контроллера памяти DDR3, то есть теперь контроллер памяти интегрируется не в северный мост чипсета, а в процессор.

С памятью DDR2 процессоры Bloomfield несовместимы и поддерживают только память DDR3-1333, DDR3-1066 и DDR3-800. Причем контроллер памяти может использовать до двух DIMM-слотов на каждый канал, то есть на материнских платах для процессоров Intel Core i7 будет располагаться шесть слотов памяти. Платы с шестью слотами памяти позволяют устанавливать максимум 12 Гбайт памяти DDR3 с учетом того, что в настоящее время на рынке максимальный объем одного модуля памяти DDR3 составляет 2 Гбайт. Естественно, применение такого объема памяти в системе возможно только при наличии 64-битной операционной системы. В случае 32-битной операционной системы оптимальный объем памяти DDR3 будет равен 3 Гбайт. Дело в том, что 32-битные операционные системы могут адресовать до 4 Гбайт памяти, однако адресное пространство от 4 Гбайт и ниже зарезервировано для системных устройств, поэтому, даже если в системе устанавливается 4 Гбайт памяти, реально для приложений и операционной системы оказывается доступным чуть более 3 Гбайт памяти. Соответственно устанавливать 4 Гбайт памяти бессмысленно.

При использовании 3 Гбайт DDR3-памяти в случае 32-битных операционных систем оптимальным будет применение трех модулей памяти емкостью по 1 Гбайт каждый. Дело в том, что именно в этом случае можно добиться максимальной производительности подсистемы памяти, поскольку память будет функционировать в трехканальном режиме.

Важно отметить, что никакой особой трехканальной DDR3-памяти для новых процессоров не потребуется. Сегодня на рынке появилась трехканальная DDR3-память для процессоров Intel Core i7. Это означает лишь то, что если ранее для двухканальных контроллеров памяти продавались наборы, состоящие из двух одинаковых модулей памяти, то для процессоров Intel Core i7 теперь будут продаваться наборы DDR3-памяти, состоящие из трех одинаковых модулей. В принципе, никто не запрещает использовать один или два модуля DDR3-памяти в ПК на базе процессора Intel Core i7, но в этом случае память будет работать в одно- и двухканальном режимах соответственно.

Контроллер памяти процессора Intel Core i7 поддерживает память DDR3-1333, DDR3-1066 и DDR3-800, а также спецификацию XMP, что при использовании соответствующих модулей обеспечивает эффективный разгон памяти. Важно отметить, что различные модели процессоров семейства Intel Core i7 рассчитаны на поддержку разных типов памяти. Причем тип памяти (DDR3-1333, DDR3-1066 или DDR3-800) определяется скоростью QPI, о чем будет рассказано далее.

Связь с северным мостом чипсета по новой шине QPI

Следующая особенность процессоров семейства Intel Core i7 заключается в том, что связь процессора с северным мостом чипсета осуществляется не по традиционной шине FSB, а по новой шине QPI (Intel QuickPath Interconnect).

Шина QPI является последовательной высокоскоростной двунаправленной шиной с шириной 20 бит в каждую сторону (на прием и передачу). При этом 16 бит отводится для передачи данных, две линии зарезервированы для передачи служебных сигналов и еще две - для передачи кодов коррекции ошибок CRC. Теоретическая пропускная способность шины QPI составляет 25,6 Гбайт/с, однако такая единица измерения, как Гбайт/с, более не будет служить характеристикой QPI-шины. Вместо этого будет использоваться термин «трансферы в секунду» (GT/s), то есть количество передач запакетированных данных по шине в секунду.

Скорость QPI является характеристикой самого процессора, а не чипсета. Для процессоров Bloomfield скорость QPI может составлять 6,4; 4,8 и 3,2 GT/s.

Как уже отмечалось, скорость QPI процессоров Bloomfield определяет и тип поддерживаемой ими памяти. Процессор с QPI 6,4 GT/s поддерживает память DDR3-1333, процессор с QPI 5,8 и 4,8 GT/s - память DDR3-1066, ну а процессор с QPI 3,2 GT/s - память DDR3-800.

Привязка скорости QPI к типу поддерживаемой процессором памяти объясняется модульной двухуровневой структурой процессора. Четырехъядерный процессор Bloomfield состоит из нескольких конструктивных модулей: на уровне Core Logic располагаются четыре ядра процессора, а на уровне Uncore Logic - такие компоненты процессора, как L3-кэш, контроллер памяти и интерфейсы QPI. При этом все компоненты уровня Uncore Logic работают на одной частоте, но не синхронизированы по частоте с ядрами процессора. Фактически это означает, что контроллер памяти синхронизован по частоте с шиной QPI, чем и объясняется жесткая привязка скорости QPI к типу поддерживаемой памяти.

Через настройки BIOS можно разгонять по частоте элементы Uncore Logic, но разгон будет производиться синхронно для всех элементов Uncore Logic.

Наличие кэша L3 и изменение иерархии кэш-памяти процессора

С точки зрения настройки системы наличие кэша L3, равно как и изменение иерархии кэш-памяти процессора, значения не имеет. В то же время нужно отметить, что, поскольку кэш L3 находится на уровне Uncore Logic, его частота не совпадает с частотой работы ядра процессора, а следовательно, с частотой кэшей L2 и L1. Частота работы кэша L3 неизвестна (точно так же, как не указывается частота работы контроллера памяти и шины QPI), но, поскольку все элементы уровня Uncore Logic синхронизованы по частоте, разгон шины QPI автоматически приведет и к увеличению частоты работы L3-кэша.

В качестве справочных данных укажем, что в процессоре Bloomfield размер L3-кэша составляет 8 Мбайт. Кэш L3 по своей архитектуре по отношению к кэшам L1 и L2 является инклюзивным (inclusive), то есть в нем всегда дублируется содержимое кэшей L1 и L2. В процессоре Bloomfield каждому ядру процессора отводится кэш L2 размером 256 Кбайт.

Поддержка режима Hyper-Threading

Процессор Bloomfield, как и все процессоры семейства Intel Core i7, поддерживает технологию многопоточной обработки Hyper-Threading. Эта технология отнюдь не нова - она использовалась в процессорах Intel Pentium 4 с микроархитектурой NetBurst. К настройке системы на базе процессора Bloomfield сам факт поддержки процессором этой технологии отношения не имеет, однако напомним, что с учетом технологии Hyper-Threading операционная система будет видеть четырехъядерный процессор как восемь отдельных логических процессоров. Одни версии BIOS позволяют отключить использование технологии Hyper-Threading, а другие - нет.

Поддержка режима Turbo Mode

Еще одна особенность процессоров Bloomfield заключается в том, что они поддерживают новый режим Turbo Mode. Поскольку этот режим оказывает существенное влияние на производительность системы и полностью настраивается через BIOS, остановимся на нем подробнее.

Смысл режима Turbo Mode заключается в динамическом разгоне тактовых частот ядер процессора, причем уровень такого разгона каждого ядра процессора задается по отдельности в настройках BIOS.

Динамический разгон ядер процессора происходит в том случае, если его энергопотребление не превышает заданного в BIOS значения. То есть в BIOS можно устанавливать максимальное значение энергопотребления, до достижения которого будет производиться динамический разгон ядер процессора. Уровень разгона каждого ядра задается коэффициентом умножения. Для процессора Bloomfield опорная частота (частота системной шины) составляет 133,33 МГц, а частота ядра процессора вычисляется умножением опорной частоты на соответствующий коэффициент. Отметим, что в настройках BIOS режим Turbo Mode может быть отключен.

Настройка BIOS системы

Настройка параметров процессора Bloomfield, равно как и его разгон, реализуется через настройки BIOS. Далее на примере процессора Intel Core i7-965 Extreme Edition мы рассмотрим, каким образом можно настраивать частоту процессора (а также реализовывать разгон частоты) и производить настройки памяти. Естественно, материнские платы различных производителей имеют разные варианты настройки BIOS, и отнюдь не факт, что все возможности по настройке, о которых речь пойдет далее, будут реализованы на той или иной плате. Мы будем ориентироваться на платы самой компании Intel на базе чипсета Intel X58 Express.

Сразу отметим, что процессор Intel Core i7-965 Extreme Edition обладает особой функциональной возможностью, которая существенно отличает его от всех остальных процессоров Bloomfield - только этот процессор имеет разблокированный коэффициент умножения, что предоставляет пользователю широкие возможности по разгону.

Настройка частоты процессора Bloomfield

Существует два основных способа установки частоты процессора Bloomfield:

  • изменение коэффициента умножения;
  • изменение опорной частоты.

Изменение коэффициента умножения

Как уже отмечалось, для процессора Bloomfield опорной является частота 133,33 МГц (частота по умолчанию). Частоты всех компонентов процессора получаются умножением опорной частоты на соответствующий коэффициент. Для того чтобы задать тактовую частоту процессора, необходимо выбрать соответствующий коэффициент умножения, выбор которого осуществляется в BIOS посредством настройки, которая может иметь названия Maximum Non-Turbo Ratio, CPU Ratio Setting или им подобные. К примеру, для процессора Intel Core i7-965 Extreme Edition номинальная тактовая частота составляет 3,2 ГГц, что соответствует коэффициенту умножения 24 (133,33 МГц x 24 = 3,2 ГГц). Если у процессора разблокирован коэффициент умножения не только вниз, но и вверх (как у процессора Intel Core i7-965 Extreme Edition), то можно разогнать процессор по тактовой частоте, выбрав более высокий коэффициент умножения. К примеру, если для процессора Intel Core i7-965 Extreme Edition задать коэффициент умножения 29, то его тактовая частота станет равной 3,86 ГГц. Конечно, не факт, что процессор «заведется» с такими установками и будет стабильно работать, но попробовать всегда можно. Отметим, что изменение коэффициента умножения процессора отражается на изменении тактовой частоты всех четырех ядер процессора, но никак не сказывается на тактовой частоте элементов Uncore Logic, то есть частота работы кэша L3, скорость QPI-шины и частота контроллера памяти при этом остаются неизменными.

Следующий важный аспект, связанный с коэффициентом умножения процессора, - это настройка режима Turbo Mode. Прежде в BIOS нужно разрешить использование режима Turbo Mode (настройке Turbo Mode присваивается значение Enable). Затем необходимо задать максимальное значение энергопотребления процессора в ваттах и максимальное значение силы тока в амперах. В случае если текущее значение энергопотребления процессора и значение силы тока будут меньше заданных максимальных значений, то будет реализован динамический разгон ядер процессора.

Для задания максимального значения энергопотребления процессора необходимо в настройках BIOS найти параметр TDP Power Limit Override (Watts) (название может быть другим) и присвоить ему значение максимально допустимого энергопотребления процессора в ваттах. Номинальное значение максимального энергопотребления процессора Bloomfield составляет 130 Вт. Это значение можно увеличить или уменьшить.

Для задания максимального значения силы тока необходимо в настройках BIOS найти параметр TDC Current Limit Override (Amps) (название может быть другим) и присвоить ему значение максимально допустимого значения силы тока в амперах. Номинальное значение максимальной силы тока процессора Bloomfield составляет 110 А.

Далее для каждого из четырех ядер процессора Bloomfield необходимо задать коэффициент умножения для режима Turbo Mode. Тогда, если не достигнуты заданные максимальные значения энергопотребления и силы тока, для ядер процессора реализуется динамический разгон. Повышение частоты каждого ядра процессора производится в соответствии с установленным для этого ядра коэффициентом умножения.

Рассмотрим, к примеру, вариант настройки режима Turbo Mode для процессора Intel Core i7-965 Extreme Edition. Для него номинальный коэффициент умножения, определяющий тактовую частоту процессора без режима Turbo Mode, составляет 24. Максимальному значению энергопотребления и силы тока можно присвоить номинальные значения (130 Вт и 110 А соответственно), а для каждого ядра процессора задать коэффициент 30. В этом случае до тех пор, пока не превышено энергопотребление процессора в 130 Вт, а сила тока не достигла значения в 110 А, все четыре ядра процессора будут работать на частоте 4 ГГц.

Изменение опорной частоты

Установку тактовой частоты процессора, а также разгон процессора можно производить за счет изменения опорной частоты, значение которой по умолчанию, как уже отмечалось, составляет 133,33 МГц. К примеру, если для процессора Intel Core i7-965 Extreme Edition с номинальным коэффициентом умножения равным 24 значение опорной частоты задать равным 155 МГц, то тактовая частота процессора составит 3,72 МГц (по умолчанию значение тактовой частоты процессора Core i7-965 Extreme Edition равно 3,2 ГГц).

Важно отметить, что изменение опорной частоты повлечет за собой изменение не только тактовой частоты ядер процессора, но и частоты работы памяти. Кроме того, изменение опорной частоты отразится и на режиме Turbo Mode динамического разгона процессора.

Разумеется, разгон процессора Bloomfield можно реализовать и путем одновременного изменения опорной частоты и коэффициента умножения.

Задание напряжения питания процессора

При разгоне процессора путем увеличения опорной частоты или коэффициента умножения важно и значение напряжения питания процессора. Более высоким значениям тактовой частоты процессора должно соответствовать и более высокое напряжение питания. Естественно, что повышать напряжение питания процессора нужно только в том случае, если достигнуто значение тактовой частоты, при котором процессор не «стартует» или работает нестабильно.

В настройках BIOS имеется несколько параметров, позволяющих задавать напряжение процессора. Прежде всего можно изменить статическое значение напряжения питания. Параметр Static CPU Voltage Override позволяет задавать значение превышения напряжения процессора по отношению к номинальному значению. Данный параметр имеет смысл задействовать только в том случае, если используется статический разгон процессора путем установки более высокого (в сравнении с номинальным) значения коэффициента умножения или более высокого значения опорной частоты.

Также возможно реализовать динамическое изменение напряжения питания процессора. Параметр Dynamic CPU Voltage Offset позволяет в милливольтах (мВ) задавать значение напряжения, на которое будет динамически (в зависимости от загрузки) увеличиваться напряжение питания процессора.

Еще один параметр, касающийся напряжения питания процессора, - это Enhanced Power Slope. Он задает процент уменьшения напряжения питания процессора в том случае, если достигнуто максимальное значение силы тока.

Настройка памяти

Контроллер памяти в процессоре Bloomfield находится на уровне Uncore Logic. Как мы уже отмечали, элементы уровня Uncore Logic не синхронизованы по частоте с элементами уровня Core Logic (ядрами процессора). Контроллер памяти находится на уровне Uncore Logic, и для его настройки необходимо использовать коэффициенты умножения уровня Uncore Logic.

Поэтому для настройки памяти в разделе Memory Optimization необходимо прежде всего установить значение коэффициента UCLK Multiplier, то есть коэффициента умножения для элементов уровня Uncore Logic. Для процессора Intel Core i7-965 Extreme Edition по умолчанию значение коэффициента UCLK Multiplier составляет 20. Это означает, что для элементов уровня Uncore Logic базовой является частота 2,66 ГГц (133,33 МГц x 20 = = 2,66 ГГц). Однако из этого не следует, что все элементы уровня Uncore Logic (контроллер памяти, контроллер QPI, кэш L3) функционируют на данной частоте, поскольку для элементов Uncore Logic могут использоваться и внутренние коэффициенты умножения. Кроме того, нужно учитывать, что внутренняя частота работы контроллера и внешняя частота, которую контроллер «выдает» на шину (к примеру, частота работы памяти), - это не одно и то же. При этом очень может быть, что коэффициент UCLK Multiplier определяет частоту работы кэша L3 или, во всяком случае, его изменение влияет на частоту кэша L3.

В принципе, можно поэкспериментировать со значениями коэффициента Uncore Logic, но прямого влияния на настройку памяти его величина не имеет. Частота работы памяти задается коэффициентом Memory Multiplier. При этом опорной частотой для памяти является частота в 133,33 МГц. Следовательно, если мы хотим задать частоту DDR3-памяти 1333 МГц, то коэффициенту Memory Multiplier необходимо присвоить значение 10. При значении 12 частота памяти станет равной 1600 МГц, значение 8 соответствует частоте 1066 МГц, а 6 - частоте 800 МГц. При задании значения коэффициента Memory Multiplier необходимо руководствоваться правилом, что оно должно быть как минимум в два раза меньше, чем значение коэффициента UCLK Multiplier. То есть при значении коэффициента UCLK Multiplier равном 20 максимальное значение коэффициента Memory Multiplier может составлять не более 10 (соответствует памяти DDR3-1333). Таким образом, поддержка более скоростной памяти возможна только в условиях разгона, при котором требуется изменить значение коэффициента UCLK Multiplier. Так, коэффициент Memory Multiplier может иметь значение 12 (для поддержки памяти DDR3-1600) только в том случае, если коэффициенту UCLK Multiplier присвоено значение не ниже 24.

Кроме задания частоты памяти, можно настраивать тайминги памяти и задавать напряжение питания. Правда, ничего нового в данном случае нет. Тайминги памяти настраиваются точно так же, как и раньше, что вполне логично, поскольку в системах с процессором Intel Core i7 используется самая обычная DDR3-память.

Для справки напомним, что настройке подлежат следующие тайминги:

  • tCL (CAS Latency) - промежуток времени между поступлением команды чтения (записи) данных (сигнал CAS# переводится в низкий уровень) до выдачи первого элемента данных на шину (записи данных в ячейку памяти);
  • tRCD (RAS to CAS Delay) - промежуток времени между командой активации нужной строки памяти (команда ACTIVE) (сигнал RAS# переводится в низкий уровень и происходит считывание адреса логического банка памяти и строки в этом банке памяти) до команды записи (WRITE) или чтения (READ) данных (сигнал CAS# переводится в низкий уровень);
  • tRP (RAS Precharge Time) - минимальный промежуток времени между командой активации и командой записи (WRITE) или чтения (READ) данных уже другой строки памяти (в следующем логическом банке);
  • tRASmin (RAS Precharge Time) - минимальный промежуток времени, который должен пройти с момента подачи команды активации строки (RAS#) до команды PRECHARGE (завершение цикла обращения к банку памяти осуществляется подачей команды PRECHARGE, приводящей к закрытию строки памяти). Фактически tRASmin - это время, в течение которого строка остается активированной;
  • tRFC (RAS Refresh Cycle Timing) - минимальный промежуток времени между активацией двух различных строк одного и того же логического банка памяти;
  • tRRD (RAS to RAS Delay) - минимальный промежуток времени между командами активации строк (RAS#) в разных логических банках памяти;
  • tWR (Write Recovery Time) - минимальный промежуток времени между приемом последней порции данных, подлежащих записи, и готовностью строки памяти к ее закрытию с помощью команды PRECHARGE;
  • tWTR (Write to Read Delay) - минимальный промежуток времени между приемом последней порции данных, подлежащих записи, и командой чтения;
  • tRPT (Read to Precharge Time) - минимальный промежуток времени между подачей команды на чтение до команды Precharge;
  • Command Rate - задержка в тактах системной шины между командой CS# выбора чипа и командой активации строки. Задержка Command Rate составляет один или два такта (1T или 2T).

Кроме возможности изменения частоты и таймингов памяти, через настройки BIOS можно также изменить напряжение питания модулей памяти. Напомним, что для памяти DDR3 номинальным является напряжение питания 1,5 В. В то же время при разгоне памяти иногда требуется увеличить напряжение питания. Кроме того, некоторые производители выпускают разогнанные модули памяти, требующие более высокого напряжения. В принципе, при изменении напряжения памяти в системах с процессором Intel Core i7 нужно руководствоваться только одним правилом: напряжение не должно превышать значения 1,6 В (даже в том случае, если BIOS позволяет это сделать). Установка более высокого напряжения питания модулей памяти может вывести процессор из строя.

Настройка скорости QPI

Как уже отмечалось, каждый процессор Bloomfield привязан к определенной скорости QPI, то есть точно так же, как раньше поддерживаемая процессором частота FSB являлась его характеристикой, теперь его характеристикой служит поддерживаемая им скорость QPI. И точно так же, как раньше можно было разгонять частоту FSB, теперь можно разгонять скорость QPI. Правда, сам принцип разгона несколько иной. Напомним, что ранее увеличение частоты системной шины автоматически приводило к увеличению частоты FSB. Однако в процессорах Bloomfield изменение опорной частоты не отражается на изменении скорости QPI.

Для того чтобы изменить скорость QPI, необходимо в настройках BIOS установить подходящее из трех (6,4; 5,866 и 4,8 GT/s) значений параметра QPI Data Rate. Выбор небогатый, и если процессор, к примеру, поддерживает скорость QPI 6,4 GT/s, то увеличить эту скорость не получится.