GeForce RTX 3070 Ti в 15 бенчмарках

Предыдущие решения архитектуры Turing были революционными из-за аппаратной поддержки трассировки лучей и аппаратного ускорения задач искусственного интеллекта.

Более низкий результат RTX 3080 объясним тем, что мы тестировали эту модель на старых драйверах, а более новая версия была оптимизирована. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне современным. В нем используется очень простой пиксельный шейдер, не ограничивающий производительность. Посмотрим, что с количеством и возможностями TMU сделают в архитектуре RDNA2, но Radeon всегда имели сравнительно большое количество блоков текстурирования и с такими задачами обычно справляются несколько лучше видеокарт конкурента того же ценового позиционирования.

  • А вот синтетические Feature-тесты из набора 3DMark Vantage мы все еще оставили в полном составе, так как заменить их попросту нечем, хотя и они уже изрядно устарели.
  • Благодаря оптимизации и производству по более тонкому техпроцессу, игровые решения архитектуры Ampere примерно в 1,5-1,7 раза быстрее аналогичных Turing в традиционных задачах растеризации и до 2 раз быстрее при трассировке лучей.
  • Cloud Gate – это устаревший бенчмарк, использующий DirectX 11 feature level 10, применявшийся для тестирования домашних ПК и недорогих ноутбуков.
  • Постараемся расширить и улучшить набор синтетических тестов, и если у вас есть четкие и обоснованные предложения — напишите их в комментариях к статье или отправьте авторам.
  • Что касается быстрейшей платы предыдущего поколения, то она также оказалась впереди — видимо, меньшая скорость текстурных выборок или ПСП сегодняшней новинки все же сильнее сказываются на результатах, по сравнению с остальными параметрами.

Сейчас нормальный 4К-монитор можно купить дешевле, чем любую видеокарту из линейки GeForce RTX 30. Даже с RT+DLSS новый ускоритель способен обеспечить приемлемый комфорт в играх в таком разрешении. Но это было справедливо для GeForce RTX 2080 Ti, а GeForce RTX 3070 поднимает и эту планку, выдавая приемлемую производительность в 4К с использованием RT без DLSS и весьма хорошую скорость при сочетании RT c DLSS. К тому же при использовании тензорных ядер для реализации DLSS падение производительности от включения RT может быть полностью (и даже с излишком) компенсировано по сравнению с тем, что мы имеем без RT+DLSS. Ранее мы уже говорили, что Nvidia GeForce RTX 3080 уже позволяет комфортно играть в 4К при максимальных настройках графики со включенной трассировкой лучей. Новый «середнячок» оказался на уровне недосягаемого флагмана предыдущего поколения — GeForce RTX 2080 Ti.

Производительность FPS в популярных играх

Но пока что игры даже в 4K-разрешении при максимальных настройках действительно не требуют большего объема памяти. У новинки в наличии 8 ГБ GDDR6-памяти, известной нам по предыдущим поколениям GPU, а не новой GDDR6X, которая была разработана совместно с Micron и применяется только в двух старших моделях. Но это мы говорили о полном чипе, а модель видеокарты GeForce RTX 3070 использует слегка урезанный по количеству блоков вариант GA104.

⇡#GeForce RTX 3070 Founders Edition: печатная плата

Благодарим компанию Nvidia Russiaи лично Ирину Шеховцовуза предоставленную на тестирование видеокарту Nvidia GeForce RTX 3070, по сути, повторяет результат прежнего лидера GeForce RTX 2080 Ti, который открыл разрешение 4К для геймеров, обеспечивая в нем очень хорошую производительность при условии, что игрок не будет включать трассировку лучей без одновременного включения DLSS. Разумеется, видеокарты Nvidia при этом придется сравнивать только с другими видеокартами Nvidia. Без включения технологии DLSS, рендеринг производится в полном 4K-разрешении, и 8 ГБ локальной видеопамяти у RTX 3070 для этого явно маловато, и она сильно отстала от RTX 3080 и RTX 3090. Бенчмарк на основе этого рендерера позволяет отключать RTX-ускорение и тестирует производительность сразу в нескольких тестовых сценах, отличающихся по нагрузке.

  • Так, видео 8К с кадровой частотой 30 FPS загружает восьмиядерный CPU тестового стенда на 50 %, когда файл воспроизводится с локального хранилища, и на 60 % через браузер.
  • Представленные видеокарты Nvidia и в этот раз необъяснимо медленны, и хотя лидером в нем является GeForce RTX 3090, но Radeon RX 5700 XT довольно близка к ней.
  • Radeon RX 5700 XT также чувствует себя не очень комфортно при разрешении 4К, и, как следствие, преимущество RTX 3070 здесь достигает максимальных 51 % FPS.

⇡#Графический процессор GA104

Каждый 32-битный контроллер связан с разделом кэш-памяти второго уровня объемом в 512 КБ, и общий объем L2-кэша получается равным 4 МБ. Подсистема памяти GA104 содержит восемь 32-битных контроллеров памяти, что дает 256-бит в общем. В итоге, полный GA104 содержит 6144 потоковых CUDA-ядра, как купить акции на лондонской бирже 48 RT-ядер второго поколения и 192 тензорных ядра третьего поколения. Скорее всего, эту видеокарту еще придется поискать в продаже, особенно по хорошей цене, но есть некоторые признаки того, что сделать это будет проще, чем с RTX 3080.

Энтузиаст использовал тепловые трубки процессорного кулера для жидкостного охлаждения GPU

Это еще один сильный результат в сложных вычислительных тестах для архитектуры Ampere, которой лучше подходят такие задачи, с кучей FP32-вычислений, требовательных к скорости и объему кэш-памяти. А остальные видеокарты остались позади — так, разница между RTX 3070 и RTX 2080 Ti выросла до полуторакратной! Этот тест также показывает программную трассировку лучей и новая GeForce RTX 3070 в нем оказалась медленнее лишь RTX 3080 и RTX 3090 той же архитектуры, имеющих более высокую цену. Тест производительности на базе рендерера V-Ray раскрывает возможности GPU в сложных вычислениях и также может показать преимущества новых видеокарт. Пока что в этом разделе остается довольно старый и не слишком хорошо оптимизированный тест трассировки лучей (не аппаратной) — LuxMark 3.1. И все же этот бенчмарк еще чуть более требователен, особенно к производительности трассировки лучей.

Производительность в играх

По сравнению со своим формальным предшественником RTX 2070, новинка обеспечивает на 43 % более высокую частоту смены кадров и на 39 % превосходит видеокарту AMD из той же категории быстродействия (Radeon RX 5700 XT). Вместе с тем налицо значительная экономия мощности по сравнению с GeForce RTX 2080 Ti — ускорителем прошлого поколения, который (как мы успеем убедиться, изучив результаты бенчмарков) действительно является аналогом RTX 3070 по игровому быстродействию. Под нагрузкой в играх видеокарта потребляет вплоть до 229 Вт и, судя по замерам в FurMark, уже не располагает неисчерпанным резервом. В скобках после названий видеокарт указаны базовая и boost-частота согласно спецификациям каждого устройства. Мощность видеокарт регистрируется отдельно от CPU и прочих компонентов ПК с помощью устройства NVIDIA PCAT. Для оценки минимальной кадровой частоты вычисляется количество кадров, сформированных в каждую секунду теста.

Все сравнения с GeForce RTX 3070 Ti

Также отметим, что хотя сцены 3DMark Port Royal требовательны к объему видеопамяти, но в этом разрешении рендеринга недостатка 8 ГБ у RTX 3070 не видно. Тест очень наглядно показывает разницу в поколениях видеокарт RTX на примере RTX 3070 и RTX 2080 Ti. Но для сравнения производительности разных GPU в этой конкретной задаче тест отлично подходит. Специализированных тестов трассировки лучей пока что выпущено не так уж много. Если рассматривать производительность новой модели GeForce RTX 3070 в этой задаче по сравнению с RTX 3080 и RTX 3090, то тут все понятно — новинка медленнее этих моделей ровно так, как должна.

Тестирование: синтетические тесты

Мы уже отмечали, что для семейства GeForce RTX 30 инженеры Nvidia разработали кардинально новый референс-дизайн, и в данном случае мы видим развитие эталонного дизайна для продуктов, имеющих более простую компоновку, всего 8 микросхем памяти и систему питания попроще. Микросхемы памяти Samsung (GDDR6, K4Z80325BC-HC14) рассчитаны на условную номинальную частоту работы в 3500 (14000) МГц. Карта имеет 8 ГБ памяти GDDR6 SDRAM, размещенной в 8 микросхемах по 8 Гбит на лицевой стороне PCB. Поддержка разъемов HDMI 2.1 всеми видеокартами семейства Ampere позволяет подключать 8K-телевизоры всего лишь по одному кабелю, а для 4K-разрешения доступна частота обновления 120 Гц, также поддерживаемая лучшими телевизорами LG.

Мы проверили несколько видеокарт Nvidia в разрешении 2560×1440 при различных настройках, когда отражения рассчитываются при помощи трассировки лучей и традиционным для растеризации методом. Одним из таких тестов производительности трассировки лучей стал бенчмарк Port Royal создателей известных тестов серии 3DMark. Если говорить о решениях AMD, то обе представленные в тестировании видеокарты Radeon отстают от всех GeForce, что неудивительно, так как одна из них очень старая, а другая — заметно более дешевая. В этом тесте видеокарты Nvidia доминировали всегда, так что сегодняшний расклад сил неудивителен. В этом математическом тесте производительность решений хоть и не совсем соответствует теории, но она обычно ближе к пиковой производительности видеочипов в предельных задачах. Тут важны и математическая и текстурная производительность, и в этой «синтетике» из 3DMark Vantage новая модель видеокарты GeForce RTX 3070 показала вполне ожидаемый результат по сравнению с RTX 3080 и RTX 3090, заметно уступив им.

В большинстве тестовых игр показатели средней и минимальной кадровых частот выводятся из массива времени рендеринга индивидуальных кадров, который записывает встроенный бенчмарк (или утилита OCAT, если его нет). В качестве ключей регулятора используются силовые каскады AOZ5311NQI от Alpha & Omega с номинальным током 50 А. Хотя RTX 3070 работает в одном диапазоне мощности с устройствами прошлого поколения на чипе TU104, по габаритам Founders Edition практически не отличается от фирменных модификаций RTX 2060 и RTX 2070, только больше в длину.

Первым на очереди будет тест под названием FluidCS11, в котором моделируется физика жидкостей, для чего рассчитывается поведение множества частиц в двухмерном пространстве. В тесте используются операции с плавающей запятой, и новая архитектура Ampere должна бы раскрыть свои уникальные возможности, показав результат заметно выше предыдущего поколения, но увы — видимо, тест слишком устарел и не показывает современные GPU с лучшей стороны. Представленные видеокарты Nvidia и в этот раз необъяснимо медленны, и хотя лидером в нем является GeForce RTX 3090, но Radeon RX 5700 XT довольно близка к ней.

Технологии и программная поддержка

Но, к чести новинки, нужно сказать, что хотя по сравнению с 70-й моделью прошлого поколения абсолютное значение мощности увеличилось, также возросла производительность на ватт, причем существенно — на 24 %. Но если взять за точку отсчета GeForce RTX 2070, представитель нового поколения предлагает уже на 59–62 % больше FPS (примечательно, что именно о таких числах сообщает презентация NVIDIA, посвященная RTX 3070) при рендеринге в нативном разрешении и на 53 % больше в 4К с DLSS. Без такой хитрости, как масштабирование кадров при помощи DLSS, GeForce RTX 3070 обеспечивает безоговорочно комфортный фреймрейт в любых играх с трассировкой лучей только при условно-низком разрешении 1080p. Вопреки ожиданиям, что здесь GeForce RTX 2080 Ti все-таки оторвется от RTX 3070 на значительную дистанцию благодаря широкой шине оперативной памяти, среднее преимущество топ-модели 20-й серии сводится к 3 % FPS. Только в четырех из десяти тестовых игр частота смены кадров на флагманской модели 20-й серии, как и на GeForce RTX 3070, достигла уровня 60 FPS или превышает его.

Оверклокинг VRAM устраняет бутылочное горлышко, что приводит к росту игрового быстродействия при разрешении 2160p на среднюю величину 10 % FPS. Как показали тесты в разгоне, ПСП, доступной графическому процессору GA104 по спецификациям RTX 3070, и вправду недостаточно, чтобы целиком раскрыть его потенциал. Radeon RX 5700 XT также чувствует себя не очень комфортно при разрешении 4К, и, как следствие, преимущество RTX 3070 здесь достигает максимальных 51 % FPS. RTX 3070 — прекрасная видеокарта для игры в демократичных режимах 1080p и 1440p, но этим ее возможности и ограничены, не говоря уже о вероятном отсутствии запаса прочности на будущее, который мог бы дать объем VRAM свыше 8 Гбайт. А вот дистанция между GeForce RTX 3070 и более слабыми видеокартами начинает расти вместе с разрешением экрана.

Как следствие, декодирование записей AV1 с высоким разрешением предъявляет беспрецедентные требования к производительности железа, когда оно выполняется исключительно софтверным методом. Оба потребительских GPU семейства Ampere комплектуются мультимедийным блоком NVDEC нового поколения, который обзавелся поддержкой нового формата AV1, отличающегося высокой степенью компрессии. А вот для аппаратно ускоренного декодирования исходников в формате RED R3D и дебайеринга на тензорных ядрах три новых ускорителя подходят одинаково хорошо и способны радикально ускорить обработку видео с разрешением 4К и 6К по сравнению с любыми GPU предыдущего поколения. Во всяком случае новинка обеспечивает громадный рост производительности по сравнению с «зелеными» ускорителями серии GeForce 10, а также топовыми на текущий момент игровыми и просьюмерскими предложениями AMD — Radeon VII и Radeon RX 5700 XT. Но аналогичный тест в движке Radeon ProRender уже ставит знак равенства между RTX 2080 Ti и RTX 3070.