Когда мы покупаем себе компьютер, возникает вопрос
о выборе процессора. Реальный выбор возникает только между двумя фирмами, AMD и
Intel и соответственно между их процессорами Athlon и Pentium. В настоящее
время, как известно, выпускаются процессоры AMD Athlon XP и Intel Pentium 4,
недавно вышли 64-разрядные процессоры для PC от AMD - Athlon 64 и Athlon 64 FX.
Мы постараемся сравнить производительность распространенных в настоящее время
процессоров Athlon XP и Pentium 4, и сказать несколько слов об Athlon 64.
Впереди противостояние Athlon 64 и Intel Prescott, так что мы постараемся
произвести итоговое сравнение архитектур Athlon XP и Pentium 4. Автору не
приходилось программировать под такие наборы инструкций, как 3DNow!, SSE, SSE2,
однако определенные навыки программирования он имеет. Основная сфера интересов
автора - это компьютерное «железо» и компьютерные сети. Поэтому можете
попытаться опровергнуть данные, полученные тестерами и приведенные в этом
обзоре. Но главной нашей задачей был сбор фактов в Интернете, которые составили
бы непротиворечивую картину.
Возвращаясь к теме, фирма Intel долгое время была
безусловным лидером по производству процессоров для IBM-совместимых
персональных компьютеров. Они первыми выпускали такие процессоры, как 8088,
80286, 80386, 80486. Каждое новое поколение процессоров имело более высокие
тактовые частоты и более высокое соотношение производительность/тактовая
частота. Другие фирмы - преимущественно AMD и Cyrix сначала только повторяли архитектуру
этих процессоров. На процессоре AMD 80286 можно даже увидеть надписи AMD и
Intel одновременно. О продукции всех фирм-производителей процессоров, кроме
Intel, у пользователей сравнительно невысокой квалификации прочно сложилось
впечатление, как о чем-то вторичном, второсортном. А вдруг будет «тормозить»? А
вдруг будет «глючить»? А вдруг какая-то программа не пойдет? Бывали такие
случаи в прошлом? Бывали, но редко. Это мнение особенно усилилось после того,
как Интел выпустил свой процессор 80586 и дал ему коммерческое имя Pentium,
которое не имели право использовать другие фирмы. В свое время даже спрашивали
- у тебя 386, 486 или Pentium? То есть в сознании обычного юзера получалось
так, что процессоры 3 и 4 поколений - могут быть любой фирмы- производителя, а
5 поколения - только от Интел. Фирма AMD выпустила процессоры пятого и
шестого поколений K5 и K6, а фирма Интел - Pentium MMX и процессоры типа 80686
Pentium Pro, Pentium II (80686 MMX), Pentium III (80686 MMX+SSE). Процессоры K6
поддерживали MMX а в K6-2 появился набор команд 3DNow!. Такие наборы команд,
как MMX, Enhanced MMX, 3DNow!, Enhanced 3DNow!, SSE, SSE2 называются
SIMD-инструкциями (Single Instruction Multiple Data).
Цитата:
Сокращение SIMD – Single Instruction Multiple
Data обозначает инструкции, оперирующие большим количеством аргументов
сразу. Основным направлением их использования являются мультимедийные
приложения, которым необходимо выполнять однотипные операции над большими
потоками цифровой информации. И первое применение они нашли именно в различных
программах обработки цифровой мультимедийной информации. Это объяснялось тем,
что приложения было довольно легко оптимизировать – достаточно было переписать
наиболее трудоемкий участок кода – библиотеки кодирования-декодирования – и
сразу был виден значительный прирост скорости. Конечно, данные наборы
инструкций можно применять и в программах научных расчетов, однако это
сопряжено с большими сложностями по оптимизации кода.
Казалось бы, лидерство в то время Интел можно было
бы списать только на раскрученность марки, но вот был какой недостаток у
процессоров K6. Они не уступали процессорам Интел в вычислениях с целыми
числами, но сравнительно медленно проводили вычисления с плавающей точкой, или,
проще говоря, с десятичными дробями. Представьте, вызывают двух учеников к
доске. Дают им задачу сложить или перемножить целые числа. Оба решают ее
быстро. Потом дают им задачу с десятичными дробями. Один быстро ее решает, а
другой долго думает. К этому вопросу мы еще вернемся.
И вот появляются процессоры AMD K7 Athlon и Duron,
которые при той же тактовой частоте работают быстрее, чем соответственно Intel
Pentium III и Celeron. (Duron и Celeron, как известно, отличаются от Athlon и
Pentium уменьшенным объемом памяти, установленной на процессоре - кэш памяти
второго уровня. Стоят дешевле и работают медленнее процессоров с полным объемом
кэша). А народ привык оценивать процессоры по тактовой частоте и отдавать
предпочтение процессорам Intel. А тут оказывается, что процессоры AMD дешевле и
быстрее при той же тактовой частоте, да и частоты тогда у них были выше.
Большинство высококвалифицированных пользователей стали отдавать предпочтение
процессорам AMD, отдают предпочтение им и сейчас. А вот малоквалифицированные
пользователи остались в своем большинстве под влиянием рекламы, раскрученности
марки Pentium и прошлого лидерства Интела. Что сделала в этой ситуации Интел?
Можно было бороться улучшением архитектуры процессоров, чтобы достичь более высокой
производительности при той же тактовой частоте. А можно было наоборот -
выпустить процессор с высокой тактовой частотой и более низкой
производительностью на единицу частоты и затратить больше денег на рекламу. Тем
более, что их у нее было накоплено много, когда Интел была лидером по
производительности процессоров. Так вот, Интел пошла по второму, более легкому
пути. Действительно, повысить тактовую частоту легче, если при этом удельная
производительность ниже. Pentium 4 поначалу встретил не особенно хорошие
отзывы. И не случайно.
По поводу производительности
Цитата:
При выпуске нового процессора в линейке Pentium
компания Интел учла отсутствие знаний о компьютерах у потенциальных
покупателей, а также многолетнюю привычку брать все от Интел, так как достойной
альтернативы до сегодняшнего времени не существовало. В итоге было принято
решение все силы бросить на увеличение количества мегагерц, забыв про
производительность. В итоге количество операций за 1 такт было уменьшено до
предела, а конвейер увеличен для наилучшего разгона. Процессор был создан для
достижения наибольшей частоты. В итоге первые камни P4 1500 Mhz - 1800Mhz
оказались медленнее Pentium III 1200-1300Mhz. Люди приходили в магазин и брали
процессор с самой большой частотой не задумываясь о том, что частота - не
значит производительность.
Цитата оттуда же. По поводу стабильности материнских плат для Pentium 4:
После этих перестановок переходов с одной
платформы на другую, материнки не отличаются особой стабильностью, если они
дешевле 160 баксов. Каждый производитель "мамок" лепит то, что в
голову взбредет, что ни мама, то "сюрприз". И сейчас P4 постоянно не
хватает пропускной способности памяти. Миф о стабильности P4 потихоньку
рассеивается. P3 гораздо стабильней и надежней. Вот такие грабли. А вам хочется
на них наступать? Неизвестно что еще выдумает Интел в новом году. Причем цена
урезанного Celeron 2000 равна полноценному Athlon 2000 от AMD, а
производительность почти вдвое [меньше].
Я выбираю AMD. Мне шишки на лбу не нужны.
Что же, я согласен с автором и тоже выбираю AMD. Тем
более, что мои знакомые действительно гораздо чаще жалуются на нестабильность
(«глючность») систем на Pentium 4, чем на «глючность» систем на процессорах
AMD. У кого-то другая статистика? Что же, возможно. Но я говорю о своих
знакомых. Собственно процессоры сами по себе практически никогда не «глючат». В
нестабильной работе системы виноваты обычно другие компоненты. Но именно
материнские платы для разных процессоров различны. До сих пор среди
малоквалифицированных пользователей распространено ложное представление о
«глючности» систем на базе AMD. Как было уже сказано, в основе этого лежит
представление об AMD, как о чем-то вторичном, по сравнению с Интелом. Хотя уже
давно системы на AMD отличаются высокой стабильностью и производительностью. А
Интел - это всего лишь одна из фирм, выпускающих процессоры для PC. Я еще ни
разу не сталкивался с тем, чтобы программа, идущая на процессорах Интел, не
пошла бы на процессорах AMD.
Есть еще одно предубеждение против процессоров AMD. Оно
заключается в ложном мнении об их низкой надежности. Кристаллы процессоров
Athlon не имеют крышки, которая есть в Pentium 4 и появилась в Athlon 64. Эта
крышка защищает процессоры от механических и тепловых повреждений при сборке
системы. При неправильной установке кулера есть опасность повредить кристалл.
Раньше существовала опасность выхода процессора из строя от перегрева также
из-за неправильной установки кулера, однако сейчас материнские платы отключают
питание при достижении процессором опасной температуры, и процессор не выходит
из строя. Некоторую опасность на старых материнских платах представляли также
остановка кулера и некачественная термопаста, однако при этом процессор если и
выходил из строя, то через довольно длительное время в течение которого можно
было отследить температуру. Из всего этого следует только один вывод - если вы
не умеете собирать компьютеры, пусть это сделает специалист, после чего процессоры
AMD будут работать долгие годы. Работа пользователя на компьютере с
процессорами AMD ничем не отличается от работы на компьютере с процессорами
Интел, и проблем возникает ничуть не больше, чем на компьютерах с процессорами
Интел. Однако до сих пор существует немало совершенно необоснованных
предубеждений, что процессоры AMD якобы нельзя использовать в офисе, на сервере
и т.д. И совершенно несерьезным звучит утверждение, что «Атлоны греются». Какая
разница для пользователя, чему равна температура процессора, если это не
приводит к его отказу или к нестабильной работе? Любой компонент компьютера
«греется» не выше допустимой для него температуры. Есть еще мнение, что кулеры
для Атлонов шумят. Совсем не обязательно. Например, Glacial Tech Igloo очень
тихий кулер, хорошо охлаждающий процессор.
Возвращаемся к вопросу о производительности. Со временем
реклама Интела сделала свое дело, количество информации о высокой
производительности Pentium 4 увеличилось. Стали ли они действительно лучше по
своей удельной производительности на единицу частоты, об этом мы еще скажем.
Вот, впрочем, довольно положительная статья об архитектуре Pentium 4.
Цитата:
Конвейер Pentium 4 состоит из 20 ступеней, то
есть команда выполняется в 20 приемов. А у Pentium III - 10 ступеней. При
неправильном предсказании ветвления выполнение программы может пойти по
неправильному пути. Выяснится это только тогда, когда команда условного
перехода, которая отвечает за ветвления в программе, будет окончательно
выполнена. Последующие команды (не те, которые нужны), оказавшиеся на конвейере
и находящиеся в разных стадиях выполнения, должны быть сброшены процессором и
все 20 (или 10) ступеней загружены снова. А перезагрузка 20 ступеней
накладывает больше "штрафных" тактов, чем перезагрузка 10.
Еще одна
цитата:
Pentium 4 отличается от предшественников
огромным конвейером, длина которого составляет не менее 20 стадий. Конвейер
Pentium III насчитывает 10 стадий. Именно благодаря ему новый процессор
способен работать на сверхвысоких частотах. И в самом деле: если
последовательность исполнения команды разбита на более мелкие этапы, то каждый
из них процессор сможет выполнять быстрее, следовательно, тактовую частоту ЦП
можно повысить.
...
К сожалению, длинный конвейер не лишен недостатков. Основной его враг
инструкции условных переходов, проще говоря, развилки в программах.
...
Однако предвидеть результаты всех условных переходов ЦП не может в принципе,
поэтому за высокую тактовую частоту флагман Intel расплачивается
простоями."
Говоря проще, Интел сделал что-то вроде автомобиля, у
которого быстро
вращается двигатель, но сравнительно медленно вращаются колеса. А пользователи
привыкли оценивать компьютеры по частоте вращения "двигателя" то есть
тактовой частоте процессора, которая сама по себе еще ничего не значит. Интел
пожертвовал производительностью ради частоты, которую проще поднять при более
низкой реальной производительности. И особенно низкой она оказалась на
вычислениях с плавающей точкой. И вот почему.
Цитата из той же статьи:
Чтобы максимально сократить время исполнения
зависимых инструкций, Pentium 4 оснащен двумя АЛУ (блок вычисления с целыми
числами), работающими на удвоенной частоте процессора. Каждый из них может
исполнить за такт две простых операции: сложение, вычитание и логические. Иными
словами, у протестированного нами Pentium 4 1,5 ГГц пара АЛУ трудилась на
нереальной частоте 3 гигагерца. Стоит отметить, что на удвоенной частоте
обрабатываются не все арифметические команды, а лишь простейшие из них. Сложные
операции, например умножение, Pentium 4 переваривает на своей номинальной
частоте.
Говоря проще, чтобы скомпенсировать довольно низкую производительность
на операциях с целыми числами, фирма Интел оснастила свой процессор двумя
элементами, отвечающими за обработку целых чисел. Кроме того, еще некоторые
операции выполняются на удвоенной частоте. И все равно на целых числах Pentium
4 сильно уступает равночастотным как Атлону, так и Pentium III. А на
вычислениях с плавающей точкой такой компенсации сделано не было, поэтому здесь
Pentium 4 показывает еще более низкую производительность. Соответственно
медленно работают и программы, где это является лимитирующим звеном,
преимущественно расчетные. Цифры мы еще приведем. Кроме того, фирма Интел ввела
новый набор инструкций SSE2, способный, в отличие от 3DNow! и SSE выполнять
расчеты с двойной точностью. Существует точка зрения, что это якобы полноценная
замена классического блока вычислений с плавающей точкой (FPU). На самом деле
выигрыш от этого набора инструкций проявляется по-прежнему преимущественно в
обработке аудио, видео информации и графики. Мы приведем цифры, как мало он
помогает при расчетах, а заодно цифры, полученные независимыми тестерами при
оценке сравнения производительности AMD Athlon XP и Intel Pentium 4 в
мультимедиа.
Pentium 4 обогнал Athlon по частоте, но обогнал ли его по
производительности? Когда AMD выпустила процессор AMD Athlon XP, оснащенный
набором команд SSE, впервые появившемся в Pentium III, она стала маркировать их
рейтингом. Официально рейтинг рассчитывается по отношению к более ранним
процессорам Athlon. Однако многие привыкли сравнивать производительность Athlon
XP c производительностью Pentium 4 с той же частотой. Так вот, мы хотим
показать, что Athlon XP с определенным рейтингом (например, 3200+) быстрее, чем
Pentium 4 с частотой, выраженной той же цифрой в мегагерцах (например, 3,2
ГГц).
Но постойте, спросите Вы. В различных изданиях печатаются
сравнительные тесты производительности самых быстрых процессоров от Интел и
AMD. И на большинстве из них побеждает Pentium 4. Но Вас, например, не смущает
следующая вещь? Почему тестирования проводятся на одном и том же наборе
программ? Причем излюбленные приложения тестеров это - quake3 и winrar с
максимальной плотностью сжатия? Неужели больше программ нет? А может быть это
те немногие программы, которые быстрее на Интеле? Почему тестеры очень не любят
тестировать процессоры на математических приложениях, где Атлон как правило,
побеждает, даже если программа оптимизирована под SSE2 и об этом мы еще скажем?
А вот какие методы использует знаменитый тестер Том:
Приведем разбор его методов, которые он применяет
для того, чтобы у пользователя сложилось впечатление о том, что якобы Athlon 64
отстает от Pentium 4. Пока что, кажется, никто не сомневается в превосходстве
Athlon 64 над Pentium 4, и только Том утверждает обратное.
На этой странице процессоры у Тома расположились в
следующем порядке по производительности, с разницей в 10 % между самым
«медленным» Athlon 64
3200+ и самым быстрым Athlon 64 FX-51. Между ними идут Pentium 4 3,2 ГГц, несколько
быстрее него Pentium 4 3,2 ГГц Extreme Edition и еще несколько быстрее, чем оба
P4, Athlon XP 3200+. Разница не такая уж большая. А может быть просто теперь
главная задача Тома показать «проигрыш» Athlon 64? Поэтому теперь можно выдать
верную информацию, о том, что топовый (самый быстрый) Athlon XP быстрее
топового Pentium 4 (заметьте, на мультимедийной задаче, победа в которой Athlon
XP над P4 для таких тестеров, как Том, большая редкость), зато об Athlon 64
3200+ надо сказать, что он медленнее? Теперь внимание: приводятся данные для
разогнанного (!) Pentium 4 Extreme Edition, чтобы у пользователя сложилось
впечатление о том, что это самый быстрый процессор.
И вывод: «Технология P4 Hyper-Threading (о ней будет
сказано ниже, Макс1)
прекрасно показывает себя в этом тесте: Athlon 64 FX-51 отстает на 19,6
процента.»
Хотя на самом деле Athlon 64 FX-51, работающий на
номинальной частоте, опережает все Pentium 4, работающие на номинальной частоте
и отстает на 7 % только от разогнанного Pentium 4 EE. Теперь из этих цифр сами
сделайте вывод, говорит Том правду или нет? А еще один из приемов, которые
использует Том, это тестирование процессоров AMD на более медленной памяти, чем
процессоров Интел.
Еще один знаменитый тестер, Ананд, проводит свои тесты
и преподносит их в том
же духе.
Цитата из его статьи:
«В предыдущих версиях UT2003, Botmach не мог
использоваться для сравнения
различных систем, поскольку в тесте присутствовала ошибка, приводящая к
вздутым результатам систем AMD против Intel. Мы обратились к Epic для решения
этой проблемы, и компания выслала нам бета-версию патча для этого обзора, также
исправление войдёт в ближайшую версию официального патча, который
планируется выпустить через несколько недель».
Проговорился о своих методах. Если AMD побеждает,
Ананд просит выслать патч. И после такого к его результатам еще есть доверие? А
вот какие выражения он использует, которые просто неприлично употреблять
серьезному тестеру:
«С введением 800 МГц FSB Intel забила
последний гвоздь в гроб Athlon XP»
О том, насколько реально помогает шина 800 МГц
Pentium 4, мы еще скажем. Скажем мы и о расхождениях с тестами обычных
пользователей. А теперь о том, что происходит, если несколько изменить набор
тестовых программ.
Вот тестирование на www.fcenter.ru.
Благодаря тому, что в тесты было включено много счетных программ и графических
пакетов типа Autocad, Athlon XP выиграл на 17 тестах, а Pentium 4 только на 12.
А какой же вывод делает тестер? «Что касается соперничества в
производительности между старшими моделями Athlon XP и Pentium 4, то и тут
положение складывается для AMD не лучшим образом». Как говорится, без
комментариев. Можно ли после этого верить в объективность таких тестеров,
которые делают выводы, совершенно противоположные своим же результатам.
Справедливости ради следует отметить, что этот
тестер более объективен по сравнению с Томом и Анандом. Мы приводим его данные
потому, что этот пример особенно ярок в том смысле, как можно подбирать
тестовые программы и интерпретировать данные, чтобы у пользователя сложилось
впечатление о превосходстве продукции Интел по производительности. Мы еще
скажем, о том, какие приемы он использует на сайте www.overclockers.ru для этой
цели.
А теперь мы все больше и больше будем переходить к
главному - цифрам. Вот еще
одно тестирование, на этот раз, кажется, действительно независимое. Там
тоже отошли от Томовско-Анандовского набора программ, причем еще больше, и
теперь для Pentium 4 все еще хуже. На большинстве приложений он проигрывает
Атлону, причем разгромно. На многих приложениях он проигрывает не только Атлону,
но и Pentium III с вдвое меньшей частотой.
Цитата:
Были протестированы три системы: одна - на
процессоре AMD Athlon XP с памятью DDR, а две другие - на процессорах Intel
Pentium 4 с ОЗУ типа DDR и RDR (Rambus). Все три системы имели по 512 Мбайт памяти
и были укомплектованы видеоадаптерами на кристалле NVidia GeForce4 Ti 4600, а
также звуковыми платами Creative SB Audigy. Кроме того, часть тестов «вне
конкурса» проходила машина с морально устаревшим (по мнению Intel) процессором
Pentium III, который тем не менее, еще способен оказывать лидерам достойное
сопротивление. Его скорое списание фирмой Intel связано в основном с
маркетинговой политикой — Pentium III, сохраняя паритет производительности с
Athlon, несколько уступает Athlon XP и не обладает чертами, пригодными для
успешного проведения рекламных акций, тогда как у Pentium 4 они есть: высокая
тактовая частота (при низкой производительности, как вы увидите ниже) и набор
дополнительных инструкций (SSE2).
Всего протестированы AMD Athlon XP 2200+ 1,8 ГГц, 2 компьютера Intel Pentium 4
2,53 ГГц с памятью DDR и RDR (RIMM) Intel Pentium III 1,2 ГГц.
Измерив скорость произвольного и
последовательного доступа к ОЗУ (и кэш-
памяти), мы перешли к тестам процессорного ядра, и здесь Pentium 4 ждала
очередная крупная неудача.
В диаграмме 3 приведено суммарное время построения восьми различных
фракталов (за вычетом времени, необходимого для вывода их на экран), в том
числе
Жюлиа и Мандельбротта. Как видим, результат схож с предыдущим:
первое место — у Athlon,
второе — у Pentium III,
а на почетном третьем — Pentium 4.
Цифры в диаграмме 2 (тот самый предыдущий результат)
Время построения фракталов, с
Athlon 8,6 с
Pentium 4 DDR - 14,3 c
Pentium 4 RDR - 14,1 c
Pentium III - 11,9 c
В диаграмме 3 много цифр, но они свидетельствуют о примерно трехкратном
превосходстве Атлона над Pentium 4 в 16-разрядном режиме и двукратном - в32-
разрядном.
По-моему, третье место Pentium 4 не почетное, а
позорное для процессора с такой тактовой частотой.
Еще несколько цитат оттуда же.
Цитата:
Перейдем к вычислениям с плавающей точкой.
Классической контрольной задачей здесь является тест Ветстоуна. И тут во
всех тестах лидер прежний — Athlon.
Добавлю - быстрее в 2-3 раза.
Цитата:
В тесте с LZH безусловным лидером оказался
Pentium III; несмотря на двукратное превосходство «четверки» по тактовой
частоте, она во столько же раз отстала по производительности. Итого: разница
более чем вчетверо. При переходе в защищенный режим лидером стал Athlon, а
двукратное отставание P4 от P3 сохранилось. Athlon же обходит своего конкурента
почти втрое.
А архиваторы работают с целыми числами, то есть и
здесь Pentium 4 демонстрирует низкую производительность. А как же winrar -
спросите Вы? Вскоре мы коснемся и этого вопроса. По результатам статьи, можно
сделать также вывод, о том что Pentium III был последним высокопроизводительным
процессором от Интел. Да вот его производство свернуто и уступает он сейчас на
большинстве задач самому быстрому, «топовому» Athlon XP 3200+, который фирма
AMD справедливо назвала (до выхода еще более быстрого Athlon 64) World’s
Highest Performing Desktop PC Processor, the AMD Athlon™ XP Processor 3200+ или
самый производительный процессор для настольного ПК - AMD Athlon™ XP 3200+.
И один из выводов из той же статьи:
Процессор Pentium 4 обладает очень быстрой
встроенной кэш-памятью, но крайне медленным ядром.
Вот еще одна
ссылка о вычислениях с плавающей точкой:
Cpu right mark Model1 Rendering fps MMX/FPU без
SSE 1 и 2.
Celeron 1.3 GHz 8,9
Duron 1,3 GHz 10,1
Celeron 1,7 GHz 5,2
Athlon XP 1700+ 11,5
Блок FPU у Celeron 1,7 GHz на базе Pentium 4 точно
такой же, как и у Pentium 4 c полным объемом кэша. Заметьте, что он проигрывает
всем остальным процессорам, близким, кстати, по цене, примерно в два раза.
Вообще, Celeron на базе Pentium 4, крайне неудачная покупка. С этим мало кто
пытается спорить из
квалифицированных пользователей, а вот насчет якобы более высокой
производительности Pentium 4, по сравнению с Athlon заблуждаются даже многие
квалифицированные пользователи.
Но, спросите Вы, у Pentium 4 есть набор команд
SSE2, позволяющий производить вычисления с плавающей точкой с двойной
точностью. Но, во-первых, не все программы оптимизированы под SSE2. Допустим, у
Вас есть старая программа, делающая свою задачу. Программист уволился и не
оставил исходных текстов программы. Каким образом Вы будете использовать
Pentium 4 для расчетов? Вам понравится автомобиль, который сравнительно быстро
едет только по асфальту, который разработала фирма - производитель автомобилей?
Была тема, сейчас, к сожалению, удалена, поэтому даю ссылку на свою цитату из нее:
Pentium 4 1400 Вилли тормозит (Dell Dimension
8100)
Цитата:
FPU:
P4(s423,256kb) 1400 =1400
Tualatin 150*10=1500 =4000
...
да, программа на Fortran 90 скомпилирована под п2... ..если компилировать под
р3 - ничего не меняется сами проги по расчёту солитонов в световодах/лазерах
методы - Runge-Kutt, БПФ (Fortran IMSL) и т.д. В 2(!) раза медленнее, чем на
overclocked Celeron.
Поясняю, Celeron Tualatin, последний процессор,
основанный на ядре Pentium 3 и архитектуре 80686 демонстрирует
производительность на вычислениях с плавающей точкой в два с лишним раза
бОльшую, чем примерно равночастотный Pentium 4. Покупатели думали, что делают
апгрейд, перейдя на новую модель процессора от Интел. Ждали повышения
производительности в расчетах и были разочарованы. Автор спрашивал там, что
делать? Единственный вариант - сменить Pentium 4 на другой процессор.
А как проявляют себя в расчетах программы,
оптимизированные под SSE2? Я уже приводил ссылку на тестирование.
Вот тот же автор сравнивает топовые модели Athlon XP 3200+ и Pentium 4 3,2 ГГц.
На
этот раз автор подобрал другие приложения для тестирования и вследствие
этого, в отличие от предыдущего тестирования, Pentium 4 оказался быстрее на
большинстве тестов. 16 синтетических тестов, в 3-х из которых победил Атлон. О
том, что говорят в Интернете, как Интел влияет на создателей синтетических
тестов, мы еще скажем. Winrar - с максимальным объемом сжатия, где победил
Pentium 4 - о нем тоже скажем. 4 приложения мультимедиа, только на MPEG2
победил Атлон, а что получают независимые тестеры в форумах, мы это тоже
скажем. Игры - quake 3 и Return to castle Wolfenstein на его движке - и об этом
тоже будет сказано, почему они побеждали еще на Pentium III. Serious Sam,
Splinter Cell и Gun Metal - разница в пределах ошибки измерения, но надо же для
Pentium 4 опубликовать чуть более высокие результаты и преподнести это как
«безнадежное отставание» Athlon. А вот на Unreal Tournament 2003 получить более
высокие результаты для Pentium 4 не удалось.
Теперь собственно о научных расчетах и о том, как им помогает SSE2.
Цитата:
Для тестирования скорости новых CPU от AMD при
научных расчетах был использован пакет ScienceMark 2.0. Подробности об этом
тесте можно получить на сайте http://www.sciencemark.org. Этот бенчмарк
поддерживает многопоточность, а также все наборы SIMD-инструкций, включая MMX,
3DNow!, SSE и SSE2.
В двух тестах из трех победил Атлон. В следующей
задаче MD@home победил Pentium 4, но, как утверждается, не благодаря SSE2, а
благодаря гипертрейдингу. Эта технология, разработанная Интел, позволяет
аппаратно несколько улучшить параметры многозадачности в Windows XP. Когда
запущено несколько задач, обычно наблюдается некоторый прирост в
производительности. А если запущена одна задача, гипертрейдинг как правило
приводит к замедлению системы в среднем на 3 %, но на сайте
AMD был приведен пример замедления системы
более чем на 30 %. К сожалению, я ее не могу найти. Все пользователи в форумах
жалуются на замедление системы в результате включения гипертрейдинга, а
некоторые тестеры каким-то образом даже на одной задаче получают ускорение.
Поскольку ссылку на сайте AMD я найти не могу, я не буду искать ссылку и на
этот факт. Я и так уже привел много ссылок, поверьте мне на этот раз на слово.
Так вот в тесте MD@home было запущено две задачи и
приведен суммарный результат. Прием, который дает не очень объективные
результаты для Pentium 4. Очень ли удобно запускать, скажем, два архиватора,
каждый из которых будет архивировать половину файла или две программы Virtual
Dub, каждая из которых будет сжимать в формат MPEG4 половину фильма. На склейку
уйдет больше времени, чем получится экономия времени благодаря гипертрейдингу.
А вот еще одна цитата:
Решение системы нелинейных дифференциальных
уравнений
...
"Включение" SSE2-инструкций не оказало никакого влияния на
производительность Athlon XP (как это и должно быть, поскольку он не
"умеет" работать с инструкциями этого типа), а вот у Pentium 4
производительность выросла еще на 15%.
...
Что же касается победителя в этом тесте среди процессоров, то им стал Athlon XP
1900+ с результатом в 1 мин 29 с, более чем в 2 раза (!) опередив Pentium 4 2,0
ГГц (3 мин 47 с). Отметим также, что здесь Pentium 4 уступил Pentium III
Coppermine 1,0 ГГц (3 мин 27 с), что стало для нас полной неожиданностью!
Независимые тестеры, на которых я привел ссылку,
были "удивлены", что на счетных задачах SSE2 показал столь низкие
результаты.
SSE2 Pentium 4 в этой математической задаче всего
на 15 % быстрее его слабого блока FPU, а Атлону он уступает в два с половиной
раза! И снова заметьте - Pentium 4 уступает в расчетах процессору Pentium III с
вдвое меньшей частотой.
Программисты знают, что в программах бывают
различные участки, в том числе циклы, когда одну и ту же последовательность
команд надо выполнить несколько раз. По приведенной ссылке рассматриваются
отдельные участки кода программы, в данном случае циклы.
Цитата:
Так, эффект от "включения"
SSE2-инструкций для процессора Pentium 4 на элементарных циклах был трояким: скорость
работы оставалась без изменений, увеличивалась в 1,7-4,3 раза или снижалась (!)
в 2,2 раза. На сложных циклах ситуация в принципе была похожей (без изменения,
увеличение в 1,2-2,9 раза, снижение в 5,0-6,9 раза), однако потеря
производительности на некоторых циклах была просто катастрофической - более чем
в 5 раз!
Циклы в программе бывают разные, так что ждать
высокой производительности Pentium 4 в математических расчетах не приходится.
Представьте, что вы едете по дороге. Один автомобиль едет все время быстро
(Атлон), а другой (Pentium 4) то на короткое время развивает высокую скорость,
то в большинстве случаев едет медленно. Так, что средняя скорость Pentium 4
оказывается более, чем в два раза меньше. А если включить дополнительный
двигатель, он ускоряется на 15 %, но все равно, более чем в два раза отстает.
Почему же такая неравномерность SSE2 на различном
коде? По всей видимости, набор команд SSE2 быстрее переваривает код, который
часто встречается в приложениях обработки графики, аудио и видео информации. И
когда подобные участки попадаются в счетной задаче, а попадаются они там реже,
чем в приложениях мультимедиа, SSE2 на этом участке программы временно
показывает хорошие результаты, а потом опять тормозит на типичном для счетном
задачи коде. Если вы хотите опровергнуть эти данные, попробуйте написать
счетную программу с инструкциями SSE2, которая будет идти быстрее на Pentium 4.
Моя задача - привести факты, а они таковы, что на большинстве счетных задач
Athlon быстрее, чем Pentium 4, причем иногда более, чем в два раза.
Пользователь может спросить: «А кому нужны сейчас
особенно математические расчеты? Если набор команд SSE2 оптимизирован под
мультимедиа, то вот и хорошо. Тем более, что все тестеры говорят о том, что в
обработке видео и аудио информации Pentium 4 быстрее. Мало кто сейчас
занимается расчетами, вот фильм или музыку сжать, чтобы на компакт-диск
переписать - это другое дело. Вот я и возьму себе Pentium 4, а те немногие,
которые занимаются расчетами, пусть берут себе Атлон. Тем более, что в
современных играх Pentium 4 неплох, да и вообще все зависит в основном от
видеокарты, да и кому нужны запредельные fps, кроме ярых игроков. Говорите, в
business winstone Pentium 4 уступает Атлону? Так кому же, нужна высокая
производительность в word и excel? Для офисных приложений сойдет и Celeron, а
Вы говорите, Pentium 4 тормозит. А мне и незаметно, что он тормозит». Тогда я
хочу спросить, а что у Вас из «офисных» приложений только Word и Excel стоит? А
Corel Draw, Photoshop? Ресурсов требуют немало. Вот ссылка, которая говорит о
том, что в Photoshop Pentium 4 уступает Атлону.
Цитата:
Помимо этого, был представлен стенд с двумя
системами - одна на процессоре Athlon 3000+ и чипсете nForce2, другая - на 3,06
ГГц Intel Pentium 4 и чипсете i845PE, в остальном конфигурация схожа. На обеих
системах запущена задача - скрипт в программе Photoshop, с реализацией Intel
Hyper-Threading. Результаты: 1500 мс для системы от AMD и 1700 мс для системы
от Intel.
В ссылке ошибочно указывается на Athlon 64. На
самом деле здесь идет речь об Athlon XP 3000+ и Pentium 4 3,06 ГГц. Была
ссылка, где все было описано правильно. Но упоминание материнской платы на
чипсете nForce2 однозначно говорит об Athlon XP. Так вот в Photoshop он
оказался на 13 % быстрее примерно равнорейтингового Pentium 4. Причем на тесте,
который разработал сам Интел. Вы скажете, немного. А зачем для Photoshop
покупать процессор, который на 13 % медленнее и при этом в 1,5 раза дороже?
Теперь об архиваторах и мультимедиа. Мало кто
сомневается в том, что где-где, а здесь-то уж Pentium 4 лидирует. Возможно, это
единственная причина, по которой есть смысл брать Pentium 4? Ведь это самые
ресурсоемкие приложения. Привожу данные тестера под ником Dregor c forum.ixbt.com:
Архиваторы:
Использовались WinRAR 3.10 и WinACE 2.2.
Сжатие в WinACE:
Система Размер словаря 4096 128
-----------------------------------------------------------------------------------
iP4 2.0A 19:46 13:12
AXP1700+ (2) 19:11 12:20
AXP2000+ (3) 18:39 11:56
-----------------------------------------------------------------------------------
Видно, что Pentium 4 медленнее равнорейтингового Атлона.
Сжатие в WinRAR:
Система Размер словаря 4096 128
--------------------------------------------------------------------------------------
Dual Athlon МP 1600+ (1 в инфо) 15:28 09:51
AXP1700+ (2) 11:40 07:32
AXP2000+ (3) 11:25 07:18
iP4 2.0A 11:18 08:07
--------------------------------------------------------------------------------------
Цитирую автора:
Интересные результаты, не правда ли?
Наконец-то Р4 показал всем Кузькину мать! С размером словаря 4096 Кб он
"оторвался" на целых 7 секунд! Но со словарём 128 Кб проиграл сражение
даже АХР1700, не говоря уж о 2000.
А теперь я задам вопрос, почему все тестеры
тестируют WinRar на максимальной степени сжатия (от редактора: по-моему странно
использовать не максимальную степень сжатия, обладая машиной в в 1ГГц и более)?
Все-таки, почему winrar на максимальной плотности
сжатия на Pentium 4 быстрее? Причина здесь в том, что Pentium 4 быстрее
работает с памятью. Поскольку Athlon 64 работает с памятью еще быстрее, он
обладает встроенным контроллером памяти, а не использует контроллер памяти на
материнской плате, как всегда было раньше, то и производительность при
архивировании WinRar у него еще выше. Приведем данные
с сайта AMD.
При архивировании с помощью WinRar Athlon 64 3200+
быстрее, чем Pentium 4 3,2 ГГц на 29 %, а Athlon 64 FX-51 - на 38 %. Вы
спросите, но ведь AMD - заинтересованная сторона? А Вы обратите внимание на
методику тестирования фирмой AMD. Конфигурация компьютеров и программное
обеспечение подробно описывается, так, что каждый может подтвердить или
опровергнуть их результаты. Пока что, впрочем, на той же конфигурации никто не
опроверг.
И
еще:
Каждый тест выполняется три раза, вычисляется
среднее значение. Если один из результатов отклоняется от среднего значения
более, чем на 1 %, тестирование повторяется.
Как это отличается от тестирования на сайтах, где
Pentium 4 «побеждает» Athlon на доли процента, а конфигурация если и
описывается, то в общих чертах. А какой контраст с методами Тома. Так что
доверия к сайту AMD, который убедительно доказывает превосходство своих
процессоров по производительности, у меня больше, чем к тем сайтам, где быстрее
оказывается Pentium 4. Вообще, на сайте AMD можно найти очень много полезной
информации. Очень грамотный и толковый сайт, который тоже говорит о высоком
уровне фирмы AMD и уважительном ее отношении к пользователю. Возвращаемся к
тестам на forum.ixbt.com.
Мультимедиа - вот тут то Pentium 4 должен, если
верить тестированиям на сайтах типа Томовского и Анандовского, просто
разгромить Athlon. А что же получают независимые тестеры в форумах? Автор тот же - Dregor,
Сжатие видео DivX'ом:
Итак, перейдём к самому интересному - к
результатам. Вот они, в порядке улучшения:
1. Р4 2.0 GHz - fps 22.18; time 2:22:55
2. AXP1700+(133x11=1466) - fps 23.27; time 2:16:13
3. АХР2000+(133х12.5 ;) - fps 24.45; time 2:09:44
4. АХР2000+(166х10 ;) - fps 25.35; time 2:05:06
5. АХР2000+(133х12.5)- fps 25.38; time 2:04:57
6. Dual-Athlon XP 2x1600+(1400 MHz) - fps 33.06; time 1:35:14
Он же, кодирование
звука Lame:
Итак, результаты в порядке улучшения:
Система затраченное время
1. Dual AXP1600+ 28:44
2. AXP1700+ 27:16
3. Intel Pentium 4 2.0 25:31
4. AXP2000+ 24:03
На сайтах, где Pentium 4 выходит вперед, каждая
новая версия Pentium 4 показывает все более и более высокие результаты по
сравнению с Атлоном. Под это подводится теоретическая база. Смотрите, говорят
подобные тестеры, Интел увеличивает размер кэша и частоту шины, (скорость, на
которой работает в частности память) и продолжают маркировать свои процессоры
тактовой частотой. А AMD увеличивает кэш и шину и при этом увеличивает рейтинг.
Вот еще одни результаты от Dregor.
Кодирование одного и того же фильма в MPEG1 с
помощью программы TMPGenc.
Athlon XP 2400+ 1:46:25
Pentium 4 2,4 ГГц 1:58:54
Athlon XP 2600+ 1:32:14
Pentium 4 3,2 ГГц 1:37:04
Dual Athlon MP 1600+(1400 Mhz) - 1:35:14
Orma - другой фильм:
Athlon XP 1800+ 00:38:23
Pentium 4 2 ГГц 00:42:16
Pentium 4 2,66 ГГц 00:32:35
1800+ Атлон оказался быстрее 2000 P4, и уступил
только P4 2,66 с гораздо более высоким рейтингом. Обратите внимание: Athlon XP
2600+ кодирует видео с помощью TMPGenc быстрее, чем топовый Pentium 4 3,2 ГГц.
И еще обратите внимание. Удельная производительность Pentium 4 3,2 ГГц меньше
удельной производительности Pentium 4 2,4 ГГц на целых 9 %.
Так что AMD может со спокойной совестью увеличивать
рейтинг при увеличении шины и кэша. А сколько было разговоров, что первые
Pentium 4 были «менее удачные», чем нынешние. Если что-то и стало удачнее, то
это реклама Интел.
Результаты Dregor никто не смог опровергнуть в
ветке «AMD vs Intel - есть предложение завестись конкретно». Все тестирования,
проведенные там пользователями на настоящий момент, свидетельствуют об
отставании процессора Pentium 4 от Athlon XP в обработке аудио и видео информации.
Так что же, получается, большинство тестеров куплены
Интелом? Как так может быть - любимый вопрос обывателя. Какой-то всемирный
заговор. Автор, похоже, параноик. Во-первых, я этого не утверждаю. Видно
только, что данные большинства тестеров в приложениях мультимедиа расходятся с
данными независимых тестеров в форумах. Возможно, здесь имеет место игра с
настройками софта и железа. К тому же, видно, что многие тестеры подбирают
программы и интерпретируют данные так, чтобы Интел оказался в более выгодных
условиях.
Кроме того, вот еще одна цитата:
TeoAX:
То, что Вы называете "всемирным
заговором" более известно общественности, как Intel Inside Campaign.
Так вот одна из характерных особенностей стратегии в рамках этого договора
является то, что компания Intel оплачивает Вам вплоть до 75% расходов на
рекламу, при обязательном условии, что нигде и ни в какой форме не упоминается
AMD и ее торговые знаки. Также судя по некоторой информации, Dell -
единственный из крупных брендов, не занимающийся AMD, получает процессоры Intel
чуть ли не в два раза дешевле. Только за верность. Я уже не говорю о
банальных попытках подкупа фирм, с формулировкой "сколько будет стоить не
продавать AMD?" или писем от PR-отдела Intel с весьма настойчивыми
указаниями, как стоит писать статьи и обзоры о процессорах AMD на ixbt.
Волчина:
Интел, не сумев сделать быстрый процессор,
не нашел ничего лучшего, как повлиять на создателей тестов.
TeoAX:
Кстати, при всей категоричности заявления,
я, честно говоря, с ехидным злорадством наблюдаю, как Intel попалась в
собственный же капкан. Intel до домогался до авторов тестов до такой степени,
что сегодня выяснилось, что Pentium-M (Процессор для ноутбуков c архитектурой,
близкой к архитектуре Pentium III, Макс1) стал жутко отставать от Pentium-4 в
Bapco SysMark. Т.е. претензии AMD полуторагодичной давности все-таки были
оправданы. От всего этого гадко и противно, но с этим ничего не сделать. Увы.
Добавлю к этому от себя. Когда появились первые
Pentium 4 с 800 шиной, был обзор (жаль, потерял ссылку), где утверждалось, что
800 шина дает Pentium 4 очень малый прирост производительности. Затем появилось
большое количество обзоров, где 800 шина давала Pentium 4 большой прирост
производительности. Что это, пресловутые «указания» или просто случайность?
Как, например, можно ждать объективности от сайта ixbt, если там одно время
висела надпись: «Спонсор раздела «процессоры» - Интел». Хорошо, конечно, что на
этом сайте есть форум. Умный всегда найдет объективную информацию. Но
большинство народу на форумы не ходят, а читают тестирования. Вот и виден на
большинстве сайтов один и тот же набор программ - quake 3 и игры на его движке,
winrar с максимальной степенью сжатия, синтетические тесты, в которых странным
образом новая версия показывает все более и более высокие результаты для
Pentium 4 и результаты тестирования в мультимедиа, которые расходятся с данными
тестеров из форумов.
Под это подведена теоретическая база, что Pentium 4
имеет набор инструкций SSE2.При этом умалчивается, что Атлон имеет более
быстрый набор команд Enhanced 3DNow! Кто-то утверждает, что его не поддерживают
программисты? Это не соответствует действительности. Его поддерживают,
например, такие программы, как TMPGenc, Virtual Dub, DivX 5.
Сошлюсь на такой синтетический тест, как Сандра. Результаты для процессора
Athlon XP 1700+:
Integer SSE 8110 it/s
Floating point SSE 9308 it/s
int MMX 6048 it/s
int Enhanced MMX 8181 it/s
f. p. 3DNow! 6025 it/s
f. p. Enhanced 3DNow! 9955 it/s
В базе взял данные для Pentium 4 1,5 ГГц
int SSE2 5892 it/s
f. p. SSE2 7314 it/s
Видно, что Enhanced 3DNow! самый быстрый из
мультимедийных наборов команд. Тест Сандра далек от идеала. Он, например,
выдает одинаковые результаты на процессорах с разным объемом кэша. Но если он и
искажает результаты, то в пользу Интела.
Цитата из manual к Сандре:
Q: Why do Intel CPUs (e.g. Pentium III) score
higher than other CPUs (e.g. Athlon) with more advanced FPUs in Whetstone?
A: The Whetstone benchmark uses the slowest functions of the FPU (computing
transcendentals, e.g. sin/cos/tan) in a way that cannot be parallelised
Переводится это примерно так, «почему Pentium 3, у которого в других тестах
более слабый FPU, чем у Атлона, в Сандре показывает более высокие результаты
при использовании FPU, чем Атлон?»
Но вопросы все-таки остаются. Я решил запустить
Virtual Dub на Athlon XP с оптимизацией под различные наборы команд. В
принципе, при включении оптимизации под Enhanced 3DNow! скорость сжатия в MPEG4
при использовании DivX примерно на 1% выше, чем при оптимизации под SSE, но в
целом оптимизация под различные наборы команд, в том числе и под x87 (FPU) дает
примерно одинаковые результаты, укладывающиеся в ошибку измерения. Поэтому, в
отличие от Тома и Ананда, которые разницу в доли процента преподносят как
«победу» Pentium 4, я из разницы в 1 % не буду делать вывод о более высокой
скорости работы Virtual Dub при оптимизации под Enhanced 3DNow!. Хотя и Virtual
Dub с DivX и TMPGenc идут на Athlon XP быстрее, чем на Pentium 3, даже если
экстраполировать результаты P3 на частоту Athlon XP. Можно ли из этого сделать
вывод о более удачной реализации SSE на Athlon XP? Вопрос остается открытым.
Вот еще одна цитата:
На сайте speedycpu.dyndns.org появилась новая
версия библиотек для игры Quake 3, содержащих оптимизации для процессоров AMD
Athlon и дающих им существенную прибавку в производительности. Как известно,
движок Quake 3 очень "любит" процессоры Pentium 4 и показывает на них
весьма высокую, сравнительно с процессорами AMD, производительность. По
результатам замеров автора библиотек, их применение позволяет, например, Athlon
XP 2100+ на платформе nForce 2 демонстрировать производительность аналогичную
Pentium 4 2,53 ГГц на платформе i850E, а в разогнанный версиях Pentium 4 3,32
ГГц (FSB 175 МГц) проигрывает Athlon XP 2700+ на штатной частоте (2167 МГц, FSB
166 МГц). Объяснение неожиданному росту производительности дается следующее:
"Quake 3 для процессоров AMD форсирует использование инструкций 3DNow!
(вместо SSE на Athlon XP), хотя код для 3DNow реализован крайне неудачно и не
дает никакого выигрыша вообще. Для процессоров же Pentium 3 и 4 используется
набор инструкций SSE, что отражается в значительном росте FPS. Данные
библиотеки не включают SSE (хотя это дало бы еще больший прирост), а содержат
оптимизации, позволяющие выступить процессорам AMD более достойно."
Авторы немного напутали со скоростью SSE, который
они, следуя распространенному заблуждению, считают быстрее, чем Enhanced 3DNow!
Как раз потому, что quake 3 оптимизирован под более медленный, чем
Enhanced 3DNow! набор инструкций SSE, он идет на Атлоне сравнительно
медленно. Так что же, SSE в Интел реализован быстрее и именно поэтому
quake3 идет быстрее на процессоре Pentium 4? Нет, такого вывода сделать
нельзя, потому что quake 3 не включает SSE инструкции на Athlon XP. Он пытается
включить оптимизацию под 3DNow! (возможно даже, не под более быстрый
Enhanced, появившийся в K7, но под более медленный, чем SSE, «обычный»
3DNow!, появившийся в K6-2), причем делает это, как сказано, неудачно. По
причине оптимизации под SSE, quake 3 шел быстрее на Pentium III, впервые
получившим этот набор команд, чем на Атлоне «не XP», в котором этого
набора команд еще не было. С Quake 3, кажется, разобрались, почему он
относится к меньшинству приложений, идущих быстрее на процессорах Интел.
Кстати, на процессоре Athlon 64, по крайней мере, FX с
более быстрым двухканальным контроллером памяти, quake 3 идет быстрее, чем на
Pentium 4.
Цитата:
В Quake 3 Athlon 64 FX превзошел Pentium 4
3.2C
ГГц на 9%.
Так что здесь, похоже, процессоры Интел потеряют свое последнее
преимущество.
Эпилог
Кажется, кроме 3-го quake и winrar с максимальной
плотностью сжатия не осталось программ, для которых есть смысл покупать
Pentium 4, а после выхода Athlon 64 преимущество Интела и здесь утеряно.
В общем, моя точка зрения состоит в том, что процессоры
AMD быстрее и дешевле, чем процессоры Интел. Поэтому я выбираю Атлон.
Обсуждение этой статьи ведется в конференции.
Автор: Макс1.
Редактор: Андрианов Николай (Slayer).
|