Архитектура IA-32
Категория реферата: Рефераты по информатике, программированию
Теги реферата: зимнее сочинение, реферат на тему образование
Добавил(а) на сайт: Приходько.
Предыдущая страница реферата | 2 3 4 5 6 7 8 9 10 11 12 | Следующая страница реферата
Суперскалярное исполнительное ядро содержит аппаратные ресурсы, которые могут выполнять множество микроопераций параллельно. Возможности ядра при использовании доступного параллелизма исполнительных блоков могут быть улучшены поддержкой программным обеспечением следующих возможностей:
. Выбор IA-32 инструкций так, чтобы они были декодированы меньше чем в четыре микрокоманды и/или имели меньшие задержки
. Упорядочивание IA-32 инструкций для сохранения доступного параллелизма с помощью минимизирования цепочек длинной зависимости и перекрытия задержек длинных инструкций
. Упорядочивание инструкций так, чтобы их операнды были готовы и их исполнительные блоки и выводные порты были свободны к моменту достижения ими диспетчера
Этот раздел рассматривает распределение портов, задержки выработки
результатов и задержек вывода (так же относящиеся к производительности).
Эти концепции формируют основу для помощи программному обеспечению в
упорядочивании инструкций для увеличения параллельно выполняемых
микрокоманд. Порядок команд поставляемых в ядро процессора далее поступает
в ведение ресурсов машинного диспетчера.
Исполнительное ядро – это блок, реагирующий на постоянно изменяющуюся
ситуацию в машине, реорганизуя микрокоманды для более быстрой обработки или
откладывая их из-за занятости или ограниченности ресурсов.
Переупорядочивающие инструкции в программном обеспечении позволяют более
эффективно использовать аппаратные средства. Некоторые блоки не имеют
конвейеров (имеется в виду, что микрокоманды не могут быть размещены в
последовательных циклах и их производительность меньше одной микрокоманды
за цикл). Количество микрокоманд ассоциированных с каждой инструкцией
позволяет выбирать инструкции для генерации. Все микрооперации, вырабатываемые ROM-микрокода, вызывают экстренную нагрузку.
Исполнительные блоки и выводные порты
На каждом цикле ядро может посылать микрокоманды в один или несколько из четырех портов вывода. На микроархитектурном уровне операции хранения делятся на две группы:
1. операции хранения данных
2. операции хранения адресов
Четыре порта, через которые микрокоманды выводятся в исполнительные блоки
и служащие для операций загрузки и хранения показаны на рисунке 4.
Некоторые порты могут выводить до двух микрокоманд за такт. Они обозначены
как исполнительные блоки двойной скорости.
Порт 0. В первой половине цикла, нулевой порт может вывести либо одну
сдвиговую микрокоманду с плавающей точкой (сдвиг стека для плавающей точки, обмен между операндами с плавающей точкой или сохранение данных с плавающей
точкой), либо одну из микрокоманд арифметико-логического устройства
(арифметические, логические, ветвление или сохранение данных). Во второй
половине цикла порт может вывести схожую микрокоманду АЛУ.
Порт 1. В первой части цикли первый порт может вывести либо одну из
исполнительных операций с плавающей точкой (все исключительные сдвиговые
операции с плавающей точкой, все операции SIMD), либо одну арифметическую
АЛУ микрокоманду. Во второй части цикла порт может вывести одну схожую
микрокоманду АЛУ.
Порт 2. Этот порт обеспечивает вывод одной загрузочной операции за цикл.
Порт 3. Этот порт обеспечивает вывод одной операции сохранения адреса за цикл.
Общая выводная мощность может варьироваться от нуля до шести микрокоманд
за цикл. Каждый конвейер состоит из нескольких исполнительных блоков.
Микрокоманда помещается в блок конвейера, отвечающий правильному типу
операций. Например, целочисленный АЛУ и блок исполнения операций с
плавающей точкой (сумматор, множитель или делитель) могут разделять один
конвейер.
[pic]
Рисунок 4. Исполнительные блоки и порты беспорядочного ядра
Кэши
Микроархитектура Intel NetBurst поддерживает до трех уровней встроенного
КЭШа. По крайней мере, два уровня КЭШа встроены в процессоры, основанные на
микроархитектуре Intel NetBurst. Процессоры Intel Xeon MP могут содержать
кэш третьего уровня.
Кэш первого уровня (ближайший к исполнительному ядру) состоит из раздельных КЭШей инструкций и данных. Они включают кэш данных первого уровня и кэш трасс (улучшенный кэш инструкций первого уровня). Все остальные кэши делятся между инструкциями и данными.
Уровни в иерархии КЭШа не взаимовключающие. Факт того, что нить
находиться на уровне N не означает, что она так же находиться на уровне
N+1. Все кэши используют алгоритм замен псевдо-НЧИ (наименее часто
используемые).
Таблица 1 приводит сравнительные параметры КЭШей всех уровней процессоров
Pentium 4 и Xeon.
Таблица 1. Параметры кэша процессоров Pentium 4 и Intel Xeon
[pic]
Рекомендуем скачать другие рефераты по теме: цель реферата, ответы по контрольной.
Предыдущая страница реферата | 2 3 4 5 6 7 8 9 10 11 12 | Следующая страница реферата