Digital World: Intel Nehalem. Часть 2

В Intel обещают существенное уменьшение задержек и радикальное увеличение пропускной способности памяти. По внутренним тестам компании, выигрыш в ПСП системы на базе Nehalem по сравнению с Harpertown будет более чем четырехкратным.

Перейдём к детальному рассмотрению подсистемы кэширования, принятой в рамках новой микроархитектуры и представляющей собой дальнейшее развитие технологии Intel Smart Cache. Структура кэш-памяти первого уровня осталась без изменений - 32 Кб для хранения команд и 32 Кб - для данных. Подсистема кэш-памяти второго уровня предусматривает выделение отдельного массива ячеек емкостью 256 Кб каждому ядру, при этом отмечается низкая латентность кэш-памяти. Кроме того, предусмотрен также кэш третьего уровня емкостью до 8 Мб, который будет общим для всех ядер процессора.

Особенностью подсистемы кэширования является применение инклюзивного способа вытеснения информации. По утверждениям Intel, такой подход позволяет существенно сократить так называемый снуп-траффик (snoop traffic), что особенно актуально для систем с большим количеством ядер. Еще одним важным архитектурным усовершенствованием является внедрение двухуровневого буфера преобразования адресов (TLB, Translation Look-aside Buffer) размером 512 записей, что, по утверждению Intel, также позитивно сказывается на производительности.

К важным микроархитектурным усовершенствованиям отнесём также следующие, которые Intel условно разбивает на три ключевых направления:
1.дальнейшее развитие параллелизации - увеличение количества микроопераций, хранимых в буфере реорганизации/переупорядочивания (ReOrder Buffer), на 33% по сравнению с Core (увеличение емкости ROB с 96 до 128 записей);
2.совершенствование алгоритмов - использование так называемого не выровненного доступа к кэшу, а также повышение скорости выполнения элементарных функций (примитивов) синхронизации, что должно улучшить производительность многопоточных приложений;
3.улучшение механизма предсказания ветвлений - в рамках этого направления отмечается добавление второго уровня в целевой буфер ветвлений (BTB, branch target buffer), что должно повысить точность предсказания, уменьшение времени простоя (пенальти) в случае неправильного предсказания, а также добавление нового буфера Renamed Return Stack Buffer, который призван уменьшить количество ошибок предсказания адресов возврата.

Digital World

Labels

Blog Archive

среда, 24 сентября 2008 г.

Intel Nehalem. Часть 2

0 коммент.: