PC3200 в двухканальной упряжке: экстремальный подход

Выбор оперативной памяти для построения производительной системы - задача не менее ответственная, чем, скажем, выбор процессора. И приведенные ниже результаты тестирования модулей памяти PC3200 DDR SDRAM обязательно помогут пользователю в выборе оптимального комплекта оперативной памяти для двухканальной конфигурации.

Одним из важнейших элементов вычислительной системы является память, "по-научному" называющаяся "оперативным запоминающим устройством". Определение это, хоть и вызывает определенную ностальгию по институтскому курсу микроэлектроники, тем не менее, очень точно и универсально. В нашу эпоху гигагерц и гигабайт развитие памяти достигло некоторой критической точки, когда необходим уже качественный, а не количественный скачок вперед (речь идет, конечно же, о "мэйнстримовом" рынке).

Память DDR сегодня является наиболее востребованной и популярной - и тому масса причин. Время SDRAM прошло, время RDRAM закончилось, так толком и не начавшись… Остается лишь DDR - "скорость и доступность в одном флаконе". Однако уже сейчас невооруженным глазом виден закат DDR в первой ее инкарнации. До массового внедрения памяти DDR II осталось совсем немного (вторжение на рынок памяти запланировано на 2004 год), поэтому сейчас производители всеми силами стараются продать как можно больше памяти первого DDR, попутно осваивая новые стандарты, такие как DDR 450 и DDR 500.

В этом сравнительном тестировании мы решили "столкнуть лбами" модули памяти DDR 400 от различных производителей. Почему именно DDR 400 (она же PC3200)? Все очень просто - именно эта память на сегодня наиболее популярна при проектировании и сборке высокопроизводительных систем. Более того, именно на работу с такой памятью в наиболее "пиковых" конфигурациях рассчитаны новейшие двухканальные наборы логики от Intel (875P) и nVidia (nForce2 Ultra 400). Мы не могли пройти мимо этого обстоятельства - и тестировали память именно в двухканальной конфигурации.

Кроме того, мы позволили себе некоторое отступление от канонов "приличного" тестирования и выясняли возможности модулей памяти от каждого бренда именно с точки зрения "экстрима" - то есть, грубо говоря, разгоняли память. Это никоим образом не относится к манипулированию тактовой частотой шины, а касается лишь изменения таймингов памяти.

Динамическая память

В течение вот уже нескольких десятилетий идеология построения массивов памяти не испытывает каких-то революционных изменений. "Косметически" изменяются лишь принципы транспортировки данных, само же ядро остается неизменным - плоская двумерная матрица ячеек памяти.

Элементарная единица памяти - это ячейка, представляющая собой КМОП-транзистор. Благодаря этому и достигается высокая плотность упаковки ячеек памяти при низкой цене производства. Запоминающим элементом является "конденсатор" (емкость затвора), и ячейка может помнить свое состояние очень недолго - всего десятки миллисекунд. Для длительного хранения требуется регенерация - регулярное "освежение" (refresh) памяти, за что эта память и получила название "динамической" - DRAM (Dynamic Random Access Memory).

За гораздо меньший исторический период только тактовая частота процессоров x86 выросла на два порядка - так что разрыв между потребностями процессоров и возможностями ячеек памяти постоянно увеличивается. Для преодоления этого разрыва, во-первых, увеличивают разрядность данных памяти, а во-вторых, строят вокруг массивов ячеек памяти разные хитрые оболочки, ускоряющие процесс доступа к данным. Об этом-то и пойдет речь дальше. Отметим, что все, даже "самые модные", типы памяти - SDRAM, DDR SDRAM и Rambus DRAM - имеют запоминающее ядро, которое обслуживается описанным выше способом.

Память Double Data Rate SDRAM

Оперативная память DDR, исходя из соотношения "цена/производительность", на сегодня является оптимальной. В самом деле, при очень неплохих своих характеристиках, модули памяти данного типа стоят достаточно недорого, что и обусловило невероятную популярность DDR SDRAM.

Немало уже было написано и сказано о принципах работы памяти DDR. Так вспомним об этом лишь для целостности повествования.

Итак, почему, собственно, Double Data Rate? Почему в два раза больше данных? Все очень просто, если обратиться к механизму работы памяти. Существуют такие понятия, как частота системной шины и частота шины памяти,- причем эти две величины могут как совпадать ("синхронный" режим работы), так и не совпадать ("асинхронный" режим работы). Частота шины, в свою очередь,- это число отсчетов генератора в единицу времени. Именно во время этих отсчетов, как под ритмичный бой барабана, и происходят какие-то действия внутри компьютера.

"Обычная" память SDRAM устроена таким образом, что данные передаются во время отсчета ("такта"), лишь когда уровень тактового сигнала изменяется с низкого на высокий. У памяти же DDR данные передаются как во время изменения тактового сигнала с низкого на высокий, так и во время изменения уровня с высокого на низкий. Как говорится, все гениальное - просто. Итого, при одинаковой частоте шины памяти имеем двукратное увеличение объема прокачанных данных в пользу DDR SDRAM.

CAS, RAS и Latency

Одна из наиболее важных скоростных характеристик памяти DDR - CAS Latency. Уверен, что многие сталкивались с этим параметром в BIOS системной платы и все знают: "чем оно меньше - тем быстрее" - но истинную природу вещей объяснить может далеко не каждый. Разберемся, что же на самом деле означают понятия CAS и CAS Latency и на что эти параметры влияют в первую очередь.

CAS - это сокращение от Column Address Strobe, что в литературном переводе выглядит как "строб доступа к адресу столбца". Как известно, память DRAM структурно может быть представлена в виде плоской двумерной матрицы - наподобие привычной таблицы Excel. Это означает, что каждая отдельно взятая ячейка памяти может быть однозначно адресована с помощью номера строки и номера столбца. Как вы уже догадались, RAS - Row Address Strobe ("строб доступа к адресу строки").

Latency, она же "латентность", она же "задержка",- одно из ключевых явлений микроэлектроники вообще. Грубо говоря, латентность - это время, которое нужно подождать, чтобы что-то получить. Применительно к технике - время между инициацией и ответом.

Теперь же сузим круг наших исследований, вплотную приблизившись к анализу понятия CAS Latency.

Стоит представить себе "на пальцах" механизм работы простейшего контроллера памяти. Изначально контроллер памяти, традиционно входящий в состав набора логики, инициирует доступ к строке матрицы памяти следующим образом: на адресные выводы посылается адрес строки, активизируется строб доступа к адресу строки (RAS, как уже говорилось выше). Затем происходит ожидание длиной в несколько циклов ("тиков" генератора) - оно называется RAS-to-CAS Latency (или RAS-to-CAS Delay). После этого на адресных выводах появляется адрес нужного контроллеру столбца матрицы памяти и активизируется строб доступа к адресу столбца (CAS).

Итак, наш виртуальный контроллер уже "прицелился" на нужную ячейку памяти, остался сущий пустяк: подождать еще несколько циклов, пока данные из ячейки памяти не появятся на выводах памяти. Именно вот этот последний отрезок ожидания и называется "задержка CAS", или же CAS Latency.

Естественно, если CAS Latency = 2, то ожидание появления данных на выводах памяти длится два машинных цикла; если CAS Latency = 3 - то, соответственно, три. Однако здесь имеется один тонкий и довольно неоднозначный момент: например, память с CAS-2 вовсе не быстрее памяти CAS-3 на 33%. Причины таковы:

иногда требуется переместиться к другой строке памяти. В этом случае имеем: активизация RAS, ожидание RAS-to-CAS Delay, затем CAS Latency;

в другом случае требуется выполнить "пакетное" чтение, когда читается большой блок ячеек памяти, расположенных подряд в одной строке. Здесь CAS активизируется лишь однажды, в самом начале пакетного чтения;

фактор, оказывающий наибольшее влияние на механизм RAS/CAS - современные процессоры обладают кэш-памятью значительных размеров! Процент "попадания в кэш" нужных процессору данных может достигать 95-ти - то есть совсем не обязательно постоянно "дергать" память на предмет извлечения данных.

Участники тестирования

Производитель

Corsair

Kingston

takeMS

A-Data

Apacer

Samsung

Модуль памяти

CMX256A-3200LL

KVR400 X64C3/256

MS64 D3200U-5

ADBGB 1808

256MB PC3200 CL3

M368 L3223ETM

Количество чипов памяти

8

8

8

8

8

8

Расположение чипов памяти

с двух сторон

с одной стороны

с одной стороны

с одной стороны

с одной стороны

с одной стороны

Объем каждого чипа, Мб

32 (8 Мб x 4 банка)

32 (8 Мб x 4 банка)

32 (8 Мб x 4 банка)

32 (8 Мб x 4 банка)

32 (8 Мб x 4 банка)

32 (8 Мб x 4 банка)

Напряжение питания, В

2,5

2,6 (+- 0,1)

2,5

2,5

2,5

2,6 (+- 0,1)

Время выборки, нс

информация недоступна

5

5

5

5

5

Достигнутая CAS Latency, тактов

2

2,5

2,5

2

2,5

2,5

Достигнутая RAS Precharge, тактов

3

3

3

3

3

3

Достигнутая RAS to CAS Delay, тактов

2

2

3

3

3

3

Достигнутая Precharge Delay, тактов

5

5

5

5

5

5

Corsair TWIN512-3200LL

Идеальный набор для построения высокопроизводительной системы. Использованное слово "набор" абсолютно точно описывает данное изделие, так как в этом случае имеет дело именно с комплектом из двух модулей-"близнецов" CMX256A-3200LL, находящихся в одной общей упаковке и, естественно, продающихся как единое целое. Что это означает? Лишь то, что именно TWIN512-3200LL будет гарантированно работать в двухканальной конфигурации - ведь, как известно, стабильная двухканальная работа гарантируется в том случае, когда используются модули памяти не только от одного производителя, но и из одной партии. В случае же с TWIN512-3200LL можно предположить, что оба входящих в комплект модуля не только отвечают названным условиям, но и на заводском конвейере находились на соседних "посадочных местах". Компания Corsair, мировой бренд в производстве оперативной памяти, со смекалкой подошла к вопросу - что явно говорит, что про "набитую руку", по крайней мере, на этом рынке.

Предлагаю немного отвлечься от нашей темы. Вы смотрите телевизор? Я, если честно, просто не успеваю. Однако этот ящик стоит тихонечко и пылится. Неделю назад к ребенку пришли друзья и принесли игровую приставку, которую надо подключать как раз к телевизору. А он не работает! Не люблю когда техника неисправна, поэтому в ближайшее время нужно его отремонтировать. Ремонт телевизоров в Москве – услуга довольно распространенная. Кроме того, острая конкуренция привела к тому, что телемастер приезжает на дом прямо в день заказа. Кстати, многие неисправности могут быть устранены в течение нескольких минут… Кажется я немного увлекся. Простите великодушно. Давайте вернемся к основной теме.

Модули CMX256A-3200LL, из которых и состоит комплект TWIN512-3200LL, представляют собой стандартные модули DDR DIMM с 184-мя выводами и содержат по восемь чипов памяти каждый (по четыре чипа с каждой стороны модуля). К сожалению, информация о времени доступа покрыта тайной, поскольку взглянуть на сами чипы памяти нет никакой возможности - они закрыты мощной металлической системой охлаждения (радиатором), снять которую нельзя. Другими словами, радиатор не только надет на модуль, но и надежно приклеен. В Сети даже присутствуют фото, на которых запечатлены результаты излишнего рвения пользователей, а именно: снятый с CMX256A-3200LL радиатор вместе с чипами памяти, которые оказались вырванными "с мясом".

Индекс LL, присутствующий как в маркировке каждого модуля, так и набора в целом, расшифровывается как Low Latency ("низкие задержки"). И действительно, при заявленных производителем таймингах 2-3-2-6 в нашем случае комплект TWIN512-3200LL без особых проблем "завелся" с таймингами 2-3-2-5, вынудив тестовый стенд показать высочайшую производительность. Более того, TWIN512-3200LL - один из немногих в нашем тестировании комплектов, позволивших достичь CAS Latency = 2 при частоте системной шины 800 МГц и шины памяти 200 МГц.

Kingston KVR400X64C3/256

Еще один "тяжеловес" на рынке производителей памяти, Kingston, тоже порядком порадовал нас предоставленными для тестирования модулями. Несмотря на полное отсутствие "шика" (как то: расписные радиаторы на чипах памяти и упаковки с орденами и восторженными отзывами прессы), DDR-память от Kingston скромно, но весьма уверенно вплотную приблизилась к изделию Corsair с точки зрения общей производительности системы. Разница в производительности "реальных" приложений крайне мала - и если бы она не наблюдалась в большинстве измерений, можно было бы говорить о погрешности результатов. Ну а в синтетических тестах "упряжка" из двух KVR400X64C3/256 достаточно заметно отстала от TWIN512-3200LL - однако на то она и "синтетика", чтоб выявить положение дел на самом приближенном к "железу" уровне. KVR400X64C3/256 практически полностью повторили формулу таймингов CMX256A-3200LL - за тем только исключением, что CAS Latency все-таки осталась на отметке 2,5. Хотя "перестраховщики" из Kingston все равно рекомендуют для пущей стабильности устанавливать CAS Latency = 3.

Итого, тайминги KVR400X64C3/256 в нашем случае выглядят как 2,5-3-2-5.

takeMS MS64D3200U-5

Модули памяти от takeMS появились на украинском рынке достаточно недавно - тем не менее, успели уже снискать популярность в народе, благодаря весьма лояльной ценовой политике компании и собственной неплохой производительности.

takeMS MS64D3200U-5 не хватает звезд с неба, по результатам тестов находясь примерно в средине плотной "толпы" модулей памяти от производителей недорогих решений. Величины задержек, которых удалось достичь, восторженного "ах!" не вызывают, однако они вполне неплохи, особенно если учесть невысокую цену этой памяти.

A-Data ADBGB1808

Продукт от A-Data произвел очень хорошее впечатление. С точки зрения производительности модули от A-Data являются практически лучшими из всех недорогих решений. Особенно радует, что лишь эта память могла составить конкуренцию Corsair по значению CAS Latency, которое удалось зафиксировать на отметке 2 такта.

ADBGB1808 состоит из восьми чипов производства Hynix c временем выборки 5 нс. Производительность на высоте - особенно если учесть, что имеем дело с "обычной" бюджетной памятью.

Apacer 256 MB PC3200 CL3

Единственный комплект модулей, которые не удалось однозначно идентифицировать. Как видим, у каждого из производителей предусмотрены собственные уникальные индексы для модулей памяти. Apacer же, не мудрствуя лукаво, назвала модули "256 MB PC3200 CL3". По крайней мере, никаких других обозначений на сайте производителя обнаружено не было. Однако в данном случае это скорее достоинство, чем недостаток - в таком "банальном" названии просматривается абсолютно вся необходимая информация для потенциального пользователя.

Модули памяти от Apacer построены на основе чипов Infineon, время выборки - 5 нс. Показатели производительности при "тайминговой" формуле 2,5-3-3-5 особо не впечатляют, однако производитель вообще рекомендует использовать значение CAS Latency = 3, поэтому 2,5 можно считать маленькой победой.

Samsung M368L3223ETM

Замыкает парад пара модулей M368L3223ETM от Samsung Electronics. Эта корейская компания всегда производила отличную память, поэтому к неплохим результатам мы были готовы заранее.

При заявленной CAS Latency = 3 эти модули удалось "завести" при CAS Latency = 2,5. Естественно, память от Samsung построена на базе чипов от самой же Samsung (время выборки - 5 нс).

Производительности этой пары модулей оказалась действительно на высоте, по нашему рейтингу - примерно третье место после "болидов" от Corsair и Kingston.

Стоит особо отметить тот факт, что на сайте компании представлена подробнейшая информация обо всех модулях памяти, чего, к сожалению, нельзя сказать о некоторых других производителях, чьи модули принимали участие в тестировании.

Методика тестирования

Аппаратная конфигурация

Центральный процессор

Intel Pentium 4 3,2 ГГц (частота системной шины 800 МГц)

Системная плата

ASUS P4C800 (набор логики Intel 875P)

Видеоадаптер

HIS Excalibur Radeon 9800 Pro Platinum IceQ (AGP 8X, 128 Мб DDR)

Жесткий диск

Western Digital WD800 80 Гб, UltraATA-100

Привод компакт-дисков

ASUS DVD-E608

Программное обеспечение

Операционная система

Microsoft Windows XP Professional Service Pack 1

DirectX

9.0b

Драйвер набора системной логики

Intel Chipset Software 5.00.1012

Драйвер видеоадаптера

ATi Catalyst 3.9

Для тестирования мы традиционно использовали программное обеспечение трех видов:

  • "синтетические" тестовые приложения (в данном случае - SiSoft Sandra, Cachemem и SPECViewPerf);
  • приложения, реально использующиеся в работе (Adobe Photoshop, WinACE и VirtualDub);
  • современные игры ("Unreal Tournament 2003" и "Serious Sam: The Second Encounter").

Начальные условия

Для определения производительности каждой пары модулей памяти мы использовали практически идеальный вариант аппаратной конфигурации: связку процессора Intel Pentium 4 с тактовой частотой 3,2 ГГц (частота шины 800 МГц) и чипсета i875P. "Идеальность" в данном случае заключается в полностью синхронной работе комплекса "процессор - набор логики - память".

Перед началом "забегов" мы привели BIOS системной платы в "спартанский" вид - были отключены практически все периферийные устройства (такие как последовательные и параллельный порты, интегрированные звуковой и сетевой адаптеры, интегрированный контроллер интерфейса SerialATA и т.д.). Можно сказать, что в наличии остались лишь клавиатура да мышь. Функция PAT, предусмотренная в чипсете i875P, принудительно установлена в "enabled" (значение поумолчанию - "auto").

Аналогичные операции проводились и в операционной системе Windows XP Professional - в данном случае они заключались в остановке и отключении всех служб, кроме жизненно необходимых для функционирования системы. И, конечно же, дефрагментация жесткого диска тестового стенда.

Для сбора информации о параметрах каждой отдельно взятой пары модулей памяти использовалась программа CPU-Z версии 1.20a.

SiSoft Sandra 2004

Известное универсальное тестовое приложение, включающее, помимо прочего, еще и неплохой тест пропускной способности памяти. Мы проводили три замера пропускной способности для каждой пары модулей с перезагрузкой между замерами, затем вычисляли среднее арифметическое полученных результатов. На выходе - пропускная способность памяти для целочисленных вычислений и для вычислений с плавающей точкой.

Cachemem 2.6

Достаточно "пожилая" программа, не подверженная, тем не менее, воздействию времени. Cachemem запускалась в операционной системе Windows 98 (а точнее, в "консольной" ее части, которая предшествует загрузке графической оболочки); методика измерений аналогичная методике, использовавшейся в случае с SiSoft Sandra 2004. Результаты трех измерений усреднялись и сводились в таблицу. Полученные величины - скорость чтения и скорость записи каждой пары модулей PC3200 DDR SDRAM.

SPECViewPerf 7.0

Один из наиболее популярных "синтетических" пакетов, имитирующий работу "тяжелых" приложений для профессиональной 3D-графики.

WinACE 2.2

Один из наиболее популярных программ сжатия данных, использующий, естественно, алгоритм ACE.

В нашем случае были применены следующие настройки:

  • размер словаря - 4096 Кб;
  • степень сжатия - максимальная;
  • размер исходного файла - 196 Мб.

При прочих равных условиях (один процессор, одна системная плата и, соответственно, один набор системной логики) именно скорость памяти существенным образом влияет на скорость архивирования исходного файла.

Adobe Photoshop 7.0

Знаменитый пакет для обработки растровых изображений предоставляет также и весьма неплохие возможности для количественной оценки временных интервалов, зависящих от скорости системы. Мы выполняли классическую операцию "поворот изображения" с довольно громоздким исходным графическим файлом.

  • Угол поворота изображения - 10°;
  • размер изображения - 10000 x7500 точек (с разрешением 150 точек на дюйм).

VirtualDub 1.5.9 + DivX Pro 5.1.1

Для преобразования видеофайла из формата MPEG-1 в формат DivX использовалось следующее программное обеспечение:

  • кодировщик VirtualDub 1.5.9;
  • видеокодек DivX Pro 5.1.1;
  • аудиокодек Radius MP3 Codec 1.23.

Параметры кодека DivX установлены в значения, соответствующие наивысшему качеству результирующего изображения; настройки Radius MP3 Codec - аудипоток с постоянным битрейтом 128 Кбит/с. Характеристики исходного видеофрагмента в формате MPEG-1 таковы:

  • разрешение - 352x 288 точек;
  • продолжительность фрагмента - 5 мин 1 с.

Для усложнения вычислительной задачи были применены такие встроенные фильтры VirtualDub, как deinterlace (режим blend) и resize (режим precise bicubic).

Unreal Tournament 2003

Этот сверхпопулярный шутер еще долго будет оставаться одним из основных инструментов для проведения различных тестов производительности.

Мы использовали средние значения числа кадров в секунду на карте dm-asbestos в разрешениях 640x 480, 800x 600, 1024x 768, 1280 x1024 и 1600x 1200 точек, режим - Direct3D, наивысшее качество.

Serious Sam: The Second Encounter

Все сказанное по поводу "Unreal Tournament 2003" может быть отнесено и к "Serious Sam: The Second Encounter" - за тем лишь исключением, что использовалась карта "Valley of the Jaguar" и режим OpenGL.

Выводы

Как и ожидалось, "экстремальный" набор от Corsair - впереди планеты всей. Конечно же, основная заслуга в этом достижении принадлежит крайне низким задержкам набора TWIN512-3200LL.

Практически на одном уровне производительности с Corsair TWIN512-3200LL находятся модули производства Kingston, а уж затем - "стремительным домкратом" - следует основная масса участников тестирования во главе с памятью от Samsung. Модули этой компании показали достаточно неплохие результаты, чего, в общем-то, и следовало ожидать.

Наиболее недорогие продукты от A-Data, takeMS и Apacer ведут себя довольно ровно, хотя в разных тестах разные модули могут демонстрировать незначительный отрыв.

Что хотелось бы подчеркнуть особо: как выяснилось, значение CAS Latency не очень сильно влияет на "скорострельность" памяти - в гораздо большей степени увеличению производительности способствует уменьшение параметров RAS-to-CAS Delay и RAS Precharge Delay.

  • Комплект Corsair TWIN512-3200LL предоставлен компанией Entry;
  • модули памяти Kingston KVR400X64C3/256 и takeMS MS64D3200U-5 предоставлены компанией BM.com;
  • модули памяти A-Data ADBGB1808 предоставлены компанией "Компасс";
  • модули памяти Apacer 256MB PC3200 CL3, а также видеоадаптер HIS Excalibur Radeon 9800 Pro Platinum IceQ предоставлены компанией MTI;
  • модули памяти Samsung M368L3223ETM предоставлены компанией K-Trade;
  • процессор Intel Pentium 4 3,2 ГГц FSB 800 МГц предоставлен компанией Intel Ukraine Microelectronics.
1 Звезда2 Звезды3 Звезды4 Звезды5 Звезд (Пока оценок нет)
Загрузка...

Дата публикации:
Автор публикации: