Процессор AMD. История развития
Категория реферата: Рефераты по информатике, программированию
Теги реферата: методы изложения, психологические рефераты
Добавил(а) на сайт: Даная.
Предыдущая страница реферата | 1 2 3 4 5 6 7 8 | Следующая страница реферата
Благодаря наличию трех конвейерных блоков исполнения целочисленных команд (Integer Execution Unit) AMD Athlon может выполнять три целочисленные инструкции одновременно. Что же касается Pentium III, то его возможности ограничиваются одновременным выполнением только двух команд.
Отдельно хочется затронуть вопрос конвейеров. Оптимальной глубиной
конвейера для процессоров с современными скоростями считается 9 стадий.
Увеличение этого числа приводит к ускорению процесса обработки команд, так
как скорость работы конвейера определяется работой самой медленной его
стадии. Однако, в случае слишком большого конвейера при ошибках в
предсказании переходов оказывается что большая часть работы по исполнению
команд, уже вошедших на конвейер выполнена напрасно. Его приходится очищать
и начинать процесс заново.
Потому в AMD Athlon глубина целочисленных конвейеров составляет 10 стадий, что близко к оптимуму. К сожалению, поклонники продукции Intel снова не услышат ничего утешительного, так как конвейер в Pentium III состоит из 12-17 стадий в зависимости от типа исполняемой инструкции.
Вещественные операции
С замиранием сердца обращаем наш взгляд на блок FPU, встроенный в
Athlon. Как мы все хорошо помним, для предыдущих процессоров AMD операции с
плавающей точкой были настоящей ахиллесовой пятой. Главной проблемой было
то, что блок FPU в K6, K6-2 и K6-III был неконвейеризированый. Это
приводило к тому, что хотя многие операции с плавающей точкой в FPU от AMD
выполнялись за меньшее число тактов, чем на интеловских процессорах, общая
производительность была катастрофически низкой, так как следующая
вещественная операция не могла начать выполняться до завершения предыдущей.
А что-то менять в своем FPU AMD в то время не хотела, призывая
разработчиков к отказу от его использования в пользу 3DNow!.
Но, похоже, прошлый опыт научил AMD. В Athlon арифметический сопроцессор имеет конвейер глубиной 15 стадий против 25 у Pentium III. Не следует забывать, что, как уже говорилось выше, более длинный конвейер не всегда обеспечивает лучшую производительность. К тому же, существенным недостатком Intel Pentium III, которого в Athlon, естественно нет, является неконвейерезируемость операций FMUL и FDIV.
FPU в Athlon объединяет в себе три блока: один для выполнения простых операций типа сложения, второй - для сложных операций типа умножения и третий - для операций с данными. Благодаря такому разделению работы Athlon может выполнять одновременно по две вещественночисленные инструкциии. А ведь такого не умеет даже Intel Pentium III - он выполняет инструкции только последовательно!
Так что, как это ни странно, FPU интеловских процессоров оказался не таким уж замечательным, как это принято было считать ранее.
MMX
На первый взгляд с выполнением MMX-операций у Athlon по сравнению с K6-
III изменений не произошло. Однако это не совсем так. Хотя и MMX-инструкции
используются в крайне небольшом числе приложений, AMD добавила в этот набор
еще несколько инструкций, которые также появились в MMX-блоке процессора
Pentium III. В их число вошли нахождение среднего, максимума и минимума и
изощренные пересылки данных.
Если обратить внимание на архитектурные особенности, то в AMD Athlon
имеется по два блока MMX, потому на обоих процессорах - и на Athlon, и на
Pentium III - может выполняться одновременно пара MMX-инструкций. Однако,
MMX-блоки в AMD Athlon имеют большую, чем у Pentium III латентность, что
теоретически должно приводить к отставанию этого CPU в MMX-приложениях.
3DNow!
Блока 3DNow! в AMD Athlon коснулись сильные изменения. Хотя его
архитектура и осталась неизменной - два конвейера обрабатывают инструкции, работающие с 64-битными регистрами, в которых лежат пары вещественных чисел
одинарной точности, в сам набор команд было добавлено 24 новинки. Новые
операции должны не только позволить увеличить скорость обработки данных, но
и позволить задействовать технологию 3DNow! в таких областях, как
распознавание звука и видео, а также интернет :) Кроме этого, по аналогии с
SSE были добавлены и инструкции для работы с данными, находящимися в кеше.
Поддержка обновленного набора 3DNow! уже встроена в Windows 98 SE и в
DirectX 6.2.
Таким образом, в набор 3DNow! входит теперь 45 команд, против 71
инструкции в SSE от Intel. Причем, судя по всему, использование новых
команд должно дать еще больший эффект от 3DNow! В доказательство этого
факта AMD распространила дополнительный DLL для известного теста 3DMark 99
MAX, задействующий новые возможности процессора.
Специально для оценки эффективности процессора в 3D-играх, 3DMark 99
MAX предлагает индекс CPU 3DМark, просчитывающий 3D-сцены, но не выводящий
их не экран. Таким образом, получается результат, зависящий только от
возможностей процессора по обработке 3D-графики и от пропускной способности
основной памяти.
Чипсеты
Прекратив разрабатывать процессоры под гнездо Super 7 и начав
продвигать собственный Slot A и системную шину EV6, AMD оказалась отрезана
от всех интеловских наработок на поприще чипсетов и системных плат. Теперь
AMD придется самой создавать необходимую инфраструктуру, чтобы мы могли
приобрести не только процессор, но и системную плату, оборудованную Slot A.
И, судя по первым успехам, ей это удалось. На первое время компания разработала собственный набор логики AMD 750, имеющий кодовое имя Irongate, а также собственный дизайн системной платы - Fester, который был растиражирован рядом тайваньских производителей.
Сам чипсет AMD 750 не представляет собой ничего особенного - по
возможностям он аналогичен i440BX. Но большего, в принципе, и не надо. AMD
Athlon, как мы видели, и так работает нормально и даже обгоняет по
производительности конкурирующие продукты.
AMD 750 имеет традиционую архитектуру и состоит из северного моста AMD
751 и южного AMD 756. Северный мост обеспечивает взаимодействие посредством
шины EV6 процессора с памятью и шинами PCI и AGP, поддерживая до 768 Мбайт
оперативной памяти PC100 в не более чем трех модулях, AGP 2x и 6 PCI bus
maser устройств. Южный мост, осуществляющий интерфейс со всей периферией, кроме обычных функций, умеет работать с UltraDMA/66 IDE-устройствами.
AMD Athlon (Thunderbird) 800
Итак, взвесив все плюсы и минусы L2-кеша на ядре, AMD, пришла к выводу
о необходимости переноса кеша на ядро. Тем более, что оба завода AMD, находящиеся в Дрездене и Остине вполне успешно освоили технологию 0.18 мкм, по которой, кстати, некоторое время уже выпускались старшие модели обычных
AMD Athlon. Так появился новый старый AMD Athlon с кодовым именем
Thunderbird, архитектурно отличающийся от старого Athlon наличием
интегрированной кеш-памяти второго уровня размером 256 Кбайт вместо
внешнего 512-килобайтного L2-кеша. Посмотрим на его спецификацию:
. Чип, производимый по технологии 0.18 мкм с использованием алюминиевых или медных соединений
. Ядро Thunderbird, основанное на архитектуре Athlon. Содержит 37 млн. транзисторов и имеет площадь 120 кв.мм
. Работает в специальных материнских платах с 462-контактным процессорным разъемом Socket A (Slot A версии доступны в ограниченных количествах только OEM)
Рекомендуем скачать другие рефераты по теме: ответы, мировая экономика.
Предыдущая страница реферата | 1 2 3 4 5 6 7 8 | Следующая страница реферата