Тестируем процессоры Intel Core i7 от 2700K до 10700K: закрывая страницу LGA115x
Примерно три года назад мы провели большое тестирование старших моделей Core i7 для разных массовых платформ Intel — от LGA1156 2009 года до самой новой на тот момент «второй версии» LGA1151. Сейчас методика тестирования обновлена, так что в момент некоторого затишья на процессорном рынке (недолгого) мы решили вернуться к теме. Выглядит картина, правда, совсем по-другому, нежели тогда.
Восемь с лишним лет Core i7 были топовыми процессорами для настольных систем. В ассортименте Intel — точно, но немалую часть того периода предложения AMD в данном сегменте можно было и не рассматривать. Уровнем выше жили HEDT-процессоры — тоже Core i7, вплоть до десятиядерного Core i7-6950K, ценой более полутора тысяч долларов. В общем, все было просто и понятно: эта марка однозначно сигнализирует о том, что перед нами «самый крутой» процессор (в своем сегменте, разумеется — так-то мобильные, настольные и серверные модели были разными, но из-за ограничений среды обитания и целевого назначения в основном). «Наступление» Ryzen первого поколения немного позиции Intel поколебало — но компания сумела его быстро парировать как раз обновлением LGA1151. И шестиядерными процессорами для нее — которые вследствие более эффективной архитектуры восстановили паритет с восьмиядерными Ryzen 7. В итоге AMD пришлось снижать цены, а в Intel занялись развитием успеха — выпустив четырехъядерные процессоры для ультрабуков и шестиядерные для полноразмерных ноутбуков, ранее, чем предназначенные для конкуренции с ними Ryzen. В общем, статус-кво на время был восстановлен.
Но сейчас ничего похожего на него нет. Хотя бы потому, что в самой Intel несколько девальвировали марку — теперь топовыми процессорами компании являются Core i9. Так что при прочих равных, естественно, Core i7 уже не самые самые. Да и с «равными» сложности возникли — Intel до сих пор использует ту же микроархитектуру и тот же техпроцесс, что дебютировали еще в конце 2015 года. По разным причинам — которые заслуживают отдельного рассмотрения. В итоге развитие всех процессоров долгое время было лишь экстенсивным. А у AMD — интенсивным: компания радикально обновила микроархитектуру и перешла на новый техпроцесс в прошлом году, превратив Intel в догоняющего. Если первым Ryzen в основном приходилось закидывать соперника ядрами даже для паритета, не говоря уже о преимуществе, то вторые на это способны и без подобной форы. А таковая формально только увеличилась, поскольку у AMD уже есть на десктопе и 16 ядер, против 10 Intel. Для конкуренции с такими моделями Intel пришлось сильно уценить HEDT-процессоры, но равновесие остается очень шатким — и рискует не выдержать очередного обновления Ryzen. А сверху над этим всем парят Ryzen Threadripper — конкурировать с которыми некому.
В этом мире Core i7 выглядят скромными решениями. Далеко не бюджетными — но и совсем не топовыми. Почему же мы опять решили протестировать линейку? Потому, что можем, во-первых. Во-вторых, многие модели раннего периода считаются своеобразными эталонами. Особенно теми, кто их когда-то купил — и считал ненужной замену четырех ядер на четыре же, пусть и немного других, или даже на шесть. или вот потом на восемь. Это ж Core i7 — зачем его менять? 🙂 Но как выглядят вчерашние топы в современных реалиях — проверить интересно. Именно в современных — не секрет, что оптимизации ПО всегда отстают от обновлений «железа». Поэтому первые обзоры каждой новой платформы часто приводят в уныние — мало добавили. Проходит несколько лет — оказывается, что «добавили» неплохо, но программистам нужно было время для освоения новых возможностей. А осадочек-то остался! Поэтому и есть смысл иногда оценивать степень прогресса не только в моментах, а за длинный период. Чем и займемся.
Участники тестирования
«Прикручивание» новой методики к процессорам для LGA1156 уже оказалось сопряжено с рядом сложностей (справедливости ради, в первую очередь не по вине процессоров), так что мы решили этим не заниматься. В конце концов «предыдущее поколение» Core (именно так в историю умудрились войти процессоры для LGA1156 и LGA1366 — официально первого поколения не было) особого следа в истории не оставило. Хорошие, быстрые процессоры — но не слишком массовые. От более ранних Core2 их в первую очередь отличало изменение компоновки, а не серьезные изменения микроархитектуры, так что стали они почвой, на которой выросло и расцвело «второе» поколение.
Intel Core i7-2700K | Intel Core i7-3770K | Intel Core i7-4790K | Intel Core i7-5775C | Intel Core i7-6700K | Intel Core i7-7700K | |
---|---|---|---|---|---|---|
Название ядра | Sandy Bridge | Ivy Bridge | Haswell Refresh | Broadwell | Skylake | Kaby Lake |
Технология производства | 32 нм | 22 нм | 22 нм | 14 нм | 14 нм | 14 нм |
Частота ядра, ГГц | 3,5/3,9 | 3,5/3,9 | 4,0/4,4 | 3,3/3,7 | 4,0/4,2 | 4,2/4,5 |
Количество ядер/потоков | 4/8 | 4/8 | 4/8 | 4/8 | 4/8 | 4/8 |
Кэш L1 (сумм.), I/D, КБ | 128/128 | 128/128 | 128/128 | 128/128 | 128/128 | 128/128 |
Кэш L2, КБ | 4×256 | 4×256 | 4×256 | 4×256 | 4×256 | 4×256 |
Кэш L3, МиБ | 8 | 8 | 8 | 6 (+128 L4) | 8 | 8 |
Оперативная память | 2×DDR3-1333 | 2×DDR3-1600 | 2×DDR3-1600 | 2×DDR3-1600 | 2×DDR4-2133 | 2×DDR4-2400 |
TDP, Вт | 95 | 77 | 88 | 65 | 91 | 91 |
Количество линий PCIe 3.0 | 16 (2.0) | 16 | 16 | 16 | 16 | 16 |
Интегрированный GPU | HD Graphics 3000 | HD Graphics 4000 | HD Graphics 4600 | Iris Pro 6200 | HD Graphics 530 | HD Graphics 630 |
Начиная с которого и началась своеобразная эпоха застоя лет на шесть. Нет, разумеется, менялись сами процессоры внутри — и их окружение в рамках платформ тоже, но на первый взгляд. На первый взгляд никаких существенных изменений в этой шестерке процессоров нет, хотя, по сути, это три с половиной разных платформы Intel. Почему с половиной? Потому, что настольные Broadwell (которых сегодня представляет Core i7-5775C) были не совсем совместимы с большинством плат LGA1150, требуя в обязательном порядке специальных чипсетов (те, впрочем, поддерживали всех). Да и сами по себе эти процессоры — интересный пример интенсивных новаций, благодаря наличию кэш-памяти четвертого уровня. Такие модели впервые появились в линейке Haswell, а позднее были и среди Skylake / Kaby Lake, но именно в «сокетном» настольном исполнении встречались только Broadwell. В первую очередь такое решение было предназначено для увеличения производительности интегрированной графики, с чем справлялось очень хорошо — но и все остальные приложения могли использовать L4 с большей или меньшей эффективностью, что мы позднее увидим в тестовой части.
Но, если не обращать внимания на этот интересный «взбрык», то характеристики всей шестерки выглядят очень похоже: четыре ядра, восемь потоков, одинаковые кэши, двухканальный контроллер памяти, 16 линий PCIe (+4 для связи с чипсетом). Подрастали количественные характеристики — в т. ч. и версии внешних интерфейсов, и немного тактовые частоты, но к качественным изменениям это привести не могло и не может. Почему для многих все эти Core i7 — просто Core i7. Особенно, как уже было сказано в начале, для владельцев самых первых моделей для LGA1155 — по их мнению менять их пять лет не на что было. Что на самом деле — покажут тесты.
Intel Core i7-8086K | Intel Core i7-9700K | Intel Core i7-10700K | |
---|---|---|---|
Название ядра | Coffee Lake | Coffee Lake Refresh | Comet Lake |
Технология производства | 14 нм | 14 нм | 14 нм |
Частота ядра, ГГц | 4,0/5,0 | 3,6/4,9 | 3,8/5,1 |
Количество ядер/потоков | 6/12 | 8/8 | 8/16 |
Кэш L1 (сумм.), I/D, КБ | 192/192 | 256/256 | 256/256 |
Кэш L2, КБ | 6×256 | 8×256 | 8×256 |
Кэш L3, МиБ | 12 | 12 | 16 |
Оперативная память | 2×DDR4-2666 | 2×DDR4-2666 | 2×DDR4-2933 |
TDP, Вт | 95 | 95 | 125 |
Количество линий PCIe 3.0 | 16 | 16 | 16 |
Интегрированный GPU | UHD Graphics 630 | UHD Graphics 630 | UHD Graphics 630 |
А вот это — большой скачок, произошедший всего за три года. Основное, что сразу заметно — количество ядер удвоилось. Но с точки зрения качественных характеристик, это еще больший застой — на предыдущем-то этапе менялись микроархитектуры и технологии производства, а тут все остается в первом приближении таким же, как было. Что весомей и в каких случаях — как раз и посмотрим.
Intel Core i3-8100 | Intel Core i5-7400 | Intel Core i5-9400F | Intel Core i5-10400 | |
---|---|---|---|---|
Название ядра | Coffee Lake | Kaby Lake | Coffee Lake | Comet Lake |
Технология производства | 14 нм | 14 нм | 14 нм | 14 нм |
Частота ядра, ГГц | 3,6 | 3,0/3,5 | 2,9/4,1 | 2,9/4,3 |
Количество ядер/потоков | 4/4 | 4/4 | 6/6 | 6/12 |
Кэш L1 (сумм.), I/D, КБ | 128/128 | 128/128 | 192/192 | 192/192 |
Кэш L2, КБ | 4×256 | 4×256 | 6×256 | 6×256 |
Кэш L3, МиБ | 6 | 6 | 9 | 12 |
Оперативная память | 2×DDR4-2400 | 2×DDR4-2400 | 2×DDR4-2666 | 2×DDR4-2666 |
TDP, Вт | 65 | 65 | 65 | 65 |
Количество линий PCIe 3.0 | 16 | 16 | 16 | 16 |
Интегрированный GPU | UHD Graphics 630 | UHD Graphics 630 | нет | UHD Graphics 630 |
Но процессоры разного времени интересно сравнивать не только друг с другом, но и с более дешевыми моделями последующих сериях: в одной-то ранжирование по семействам четкое всегда. В первую очередь нам будут нужны младшие Core i5 для трех последних платформ Intel. Поразмыслив, мы добавили сюда же и младший Core i3 для «второй версии» LGA1151 — тоже ведь четырехъядерный и вообще очень похож на Core i5 предыдущих семейств (например, i5-7400). А вот как современная (относительно) бюджетка будет выглядеть на фоне «героев вчерашних дней» — вопрос как раз очень интересный. И практический. Например, для человека, у которого есть старая платформа с одним из младших процессоров, которого уже стало радикально «не хватать». Варианта тут два — либо искать на вторичном рынке тот самый старый «топчик» под свою платформу, либо тотальный апгрейд — со сменой платы, памяти и процессора. Второе, разумеется, дороже. Но с гарантией, некоторой перспективой — да и, возможно, такое вложение средств будет более эффективным. Или не будет — оценивать это можно только с цифрами «на руках», так что их нужно получить.
AMD Ryzen 3 3100 | AMD Ryzen 5 1400 | AMD Ryzen 5 3400G | AMD Ryzen 5 3600XT | AMD Ryzen 7 3800XT | |
---|---|---|---|---|---|
Название ядра | Matisse | Summit Ridge | Picasso | Matisse | Matisse |
Технология производства | 7/12 нм | 14 нм | 12 нм | 7/12 нм | 7/12 нм |
Частота ядра, ГГц | 3,6/3,9 | 3,2/3,4 | 3,7/4,2 | 3,8/4,5 | 3,9/4,7 |
Количество ядер/потоков | 4/8 | 4/8 | 4/8 | 6/12 | 8/16 |
Кэш L1 (сумм.), I/D, КБ | 128/128 | 256/128 | 256/128 | 192/192 | 256/256 |
Кэш L2, КБ | 4×512 | 4×512 | 4×512 | 6×512 | 8×512 |
Кэш L3, МиБ | 16 | 8 | 4 | 32 | 32 |
Оперативная память | 2×DDR4-3200 | 2×DDR4-2666 | 2×DDR4-2933 | 2×DDR4-3200 | 2×DDR4-3200 |
TDP, Вт | 65 | 65 | 65 | 95 | 105 |
Количество линий PCIe 4.0 | 20 | 20 (3.0) | 12 (3.0) | 20 | 20 |
Интегрированный GPU | нет | нет | Radeon RX Vega 11 | нет | нет |
Что касается платформы AMD AM4, то сегодня важнейшими видами искусства для нас являются кино и цирк нам нужны в первую очередь четырехъядерные модели — такие, каким является большинство Core i7 из представленных в тестировании. Правда все они «свежее», но и дешевле, так что прямого сопоставления не выходит. И поэтому мы волюнтаристским образом взяли Ryzen 5 1400 (оригинальный Zen — очень дешевый, но уже 4C/8T), Ryzen 5 3400G (APU на базе Zen+) и свежий Ryzen 3 3100 (Zen2 — где формула 4С/8Т начала относиться к бюджетным семействам). Плюс пару «стероидных» моделей с шестью и восемью ядрами — чтобы сравнить ее с современными Core i7 и вообще оценить, как оно там на верхах бывает.
Прочее окружение традиционно: видеокарта AMD Radeon Vega 56, SATA SSD и 16 ГБ памяти DDR4. Тактовая частота памяти в большинстве случаев максимальная по спецификации процессоров. За исключением Core i7-2700K — ему мы все-таки «дали» DDR3-1600 для уравнивания с прочими старичками. В принципе «накинуть» больше можно и ему, и всем остальным — но не на всех платах, так что это разговор отдельный (тем более, что никакого существенного влияния на общую производительность разгон памяти не оказывает). Технологии Intel Multi-Core Enhance и AMD Precision Boost Overdrive отключены — для второй это свойственно по умолчанию, а вот первую многие платы норовят втихую включить (как выяснилось, даже старые — за которыми этого изначально не было замечено, нередко начинают вести себя так с последними прошивками). Вот они уже наряду с частотой памяти на производительность влияют, а их использование требования к плате и чипсету делают более конкретными, но в штатном режиме никаких проблем нет. Да и само по себе включение МСЕ без разгона увеличивает производительность Core i9-10900K лишь на 3% при росте энергопотребления на 5% — в чем мы уже убеждались. Поэтому практического смысла, на наш взгляд, не имеет — особенно для менее мощных процессоров, как правило и вовсе с запасом укладывающихся в штатный теплопакет. Другое дело — ручной разгон, но тут уж все индивидуально. И зависит как от техники, так и от личного везения. В любом случае, основным нашим героям уже много лет, так что как они ведут себя при разгоне — давно изученный и обсосанный со всех сторон вопрос.
Методика тестирования
Методика тестирования подробно описана в отдельной статье, а результаты всех тестов доступны в отдельной таблице в формате Microsoft Excel. Непосредственно в статьях же мы используем обработанные результаты: нормированные относительно референсной системы (Intel Core i5-9600K с 16 ГБ памяти, видеокартой AMD Radeon Vega 56 и SATA SSD — в сегодняшней статье таковая принимает и непосредственное участие) и сгруппированные по сферам применения компьютера. Соответственно, на всех диаграммах, относящихся к приложениям, безразмерные баллы — так что больше всегда лучше. А игровые тесты с этого года мы окончательно переводим в опциональный статус (причины чего разобраны подробно в описании тестовой методики), так что по ним будут только специализированные материалы. В основной линейке — только пара «процессорозависимых» игр в невысоком разрешении и среднем качестве — синтетично, конечно, но приближенные к реальности условия для тестирования процессоров не годятся, поскольку в таковых от них ничего не зависит.
iXBT Application Benchmark 2020
Казалось бы, относительно простая (алгоритмически) задача, отлично разбивающаяся на параллельные потоки, но требующая большое количество вычислительных ресурсов. Поэтому традиционно считается, что здесь «решает» количество ядер. Как видим, и качество тоже. И их окружение. Во всяком случае, «эпоха застоя» все равно сопровождалась увеличением производительности — в общей сложности более, чем в полтора раза, хотя тактовые частоты увеличились менее, чем на треть. Просто менялась архитектура — как это принято считать, в час по чайной ложке, но и этого хватило, чтобы, например Core i7-2700K и i7-7700K стали очень разными Core i7, а первый начал отставать уже и от младших «чистых» четырехъядерников. Дальше же изменения «внутри» ядра практически прекратились, так что основной эффект уже связан именно с их количеством. Практически линейно — шесть ядер лучше четырех примерно в полтора раза, а восемь — вдвое. Ну и резкость изменений начала приводить к ускоренной девальвации моделей. Например, на то, чтобы стать равным младшим Core i5, у Core i7-3770K ушло порядка четырех лет, а Core i7-8086K прошел этот путь за пару. Причина ускорения? А вон она — сверху нависает 🙂 Хорошо заметно (и не раз отмечено), что ядра первых Ryzen эквивалентны скорее Haswell, чем ровесникам от Intel, а вот «поколение 3000» уже лучше той архитектуры 2015 года, с которой Intel все никак не слезет даже в 2020. Или, как минимум, не хуже.
Благо не везде эти процессы столь просты и линейны — в 3D-рендеринге немного менее важно количество ядер, так что повышается важность качества. Но вот отмеченные закономерности «при равных» — сохранились в чистом виде. Что при разборках внутри ассортимента одной компании, но разного времени, что в межфирменной конкуренции.
И здесь мы наблюдаем аналогичную картину. Несколько разная оптимизация под разные архитектуры (на то они и разные), но аналогичный итог. Первые Ryzen догнали Haswell — а для конкуренции с более новыми процессорами Intel требовалась фора в количестве ядер (или, хотя бы, потоков вычисления). Zen2 же это не требуется — и в равных условиях выигрывают. Ну или где-то самую малость проигрывают по очкам — формально старший Core i7 этого года быстрее, чем аналогичный Ryzen 7, хотя фактически речь идет о паре процентов.
Задачи в первую очередь на архитектуру — количеством ядер тут слишком многого не добьешься. Зато можно усовершенствованием системы памяти — внезапно выстрелил Core i7-5775C. В вычислительных задачах он смотрелся средне из-за низких тактовых частот, а L4 при потоковой обработке данных помочь ничем не мог — а здесь может. Во всяком случае, может позволить не только заметно обогнать «соседа» по платформе, но и преемнику не уступить. Жаль вот только настольные Broadwell оказались в этом плане уникальными моделями. Но причины понятны — дорогое решение. В ноутбучных-то моделях Intel концепцию некоторое время сохраняла и даже улучшала, но с них и доходы повыше, и с дискретной графикой сложности есть, так что нужна мощная интегрированная (а в первую очередь L4 был придуман, чтобы подстегнуть GPU). В настольных моделях победили более дешевые решения. И, в конце концов, новые Ryzen 3 подвели окончательную черту под историей четырехъядерных процессоров Intel (да и младших шестиядерников — тоже).
Простой целочисленный код — так что в таких условиях «4/8» могут не только стабильно и безоговорочно превосходить «4/4», но и от «6/6» той же архитектуры минимум не отставать. А вот при прочих равных — опять видим преимущества интенсивного пути: он работает всегда. Kaby Lake стабильно быстрее Sandy/Ivy Bridge в полтора раза при одной и той же конфигурации. Такие дела. Хотя, казалось бы, застой. Впрочем, опять же, лучше б в компании раньше «зашевелились» во всех направлениях — поскольку как раз при таких нагрузках тактика «закидывания ядрами» в первой половине 2017 года оказалась наиболее эффективной: против четырех интеловских AMD выставляла до восьми подобных (пусть и чуть более слабых архитектурно), а тут уж результат понятен.
Один из немногих случаев, когда крайне важна работа системы памяти — не менее, чем ядра и их производительность. Самым заметным результатом оказывается бенефис Core i7-5775C — ни один из процессоров с сопоставимой «процессорной» частью не способен на такое и близко. Так что можно помечтать о прикручивании eDRAM к шести-восьмиядерным процессорам — но, к сожалению, сейчас это направление Intel заброшено. Возможно, что и временно заброшено — иногда, как видим, подход оказывается очень эффективным, пусть и крайне дорогим. Тот же Core i5-10400 — принципиально дешевле по себестоимости, а методом грубой силы и в таких условиях оказывается более быстрым. Однако если на каком-то этапе (например, на 5-7 нм) компании удастся встроить «четвертый кэш» непосредственно в кристаллы топовых процессоров — результат будет предсказуем.
Некоторая «полезность» L4 видна и здесь — i7-5775C процессор низкочастотный (на фоне соседей), но не так уж от них и отстает в среднем. Но больше в ходу ядра: интенсивные меры за пять-шесть лет увеличили производительность (четырех ядер) чуть более, чем в полтора раза, а простое удвоение их количества за три года — практически ее удвоило. Сказавшись, правда, и на других характеристиках процессоров — но об этом чуть позже.
В общем и целом — ничего принципиально нового. Четыре ядра бывают разными — и Core i7-7700K более чем в полтора раза быстрее, чем Core i7-2700K. А Zen первых поколений на практике нужна была фора в количестве ядер: уровень Ryzen 5 1400 это как раз топовые Core для LGA1155 или «ровесники» с четырьмя ядрами, но без SMT. Как только AMD хорошо «вложилась» в интенсификацию — так сразу «ее» четырехъядерники (уже бюджетные) стали работать быстрее, чем тот же Core i7-7700K. Но только после этого. Так что в целом — догнать и перегнать удалось. Во многом благодаря Intel, конечно — в ее продукции как раз интенсивный период к 2017 году полностью закончился (до последнего времени), так что с точки зрения НИОКР это не обгон бегущего, а объезд стоячего. А с потребительской точки зрения — важен результат.
Энергопотребление и энергоэффективность
«Интенсивный застой» позволял не только увеличивать производительность, но и снижать (или, хотя бы, удерживать на месте) энергопотребление. «Экстенсивный прогресс» мгновенно его увеличил — фактически в те же два раза, что и производительность. Впрочем, сложно было бы ожидать обратного — если ядра остались теми же, но их стало больше, значит и полное энергопотребление вырастет в той же пропорции.
Поэтому и в «энергоэффективности» Intel уже не лидер — компания топчется практически на том же уровне, которого достигла в Skylake (удивительно? на самом деле нет). У Core i3 и i5 результаты могут быть более высокими — но i7/i9 «заточены» под максимальную производительность, а растет она в одной линейке обычно медленнее, чем энергопотребление. AMD же начинала в 2017 году с уровня уже устаревших Haswell — но Zen2 позволил компании занять лидирующие позиции. Причем, практически, без ущерба для производительности.
Игры
Как уже было сказано в описании методики, сохранять «классический подход» к тестированию игровой производительности не имеет смысла — поскольку видеокарты давно уже определяют не только ее, но и существенным образом влияют на стоимость системы, «танцевать» нужно исключительно от них. И от самих игр — тоже: в современных условиях фиксация игрового набора на длительное время не имеет смысла, поскольку с очередным обновлением может измениться буквально все. Но краткую проверку в (пусть и) относительно синтетичных условиях мы проводить будем — воспользовавшись парой игр в «процессорозависимом» режиме.
Впрочем, если что тут и заслуживает внимания, так это относительно высокие результаты Core i7-5775C — старенького и низкочастотного, однако. Вот что L4 животворящий делает! Или делал — очевидно, что младшие «обрезанные» шестиядерные Core i5 в производстве намного дешевле — да и продавались они тоже намного дешевле. Правда, и намного позднее, т. е. в свое время эти модели действительно были интересным вариантом для игрового компьютера, как минимум позволившим своим владельцев спокойно пропустить мимо «первую версию» LGA1151. А если не сильно гоняться за рекордными результатами и топовыми видеокартами — то и вторую, и первые версии Ryzen точно. При этом неоднократно обруганный низкий уровень «игровой производительности» таковых на деле не хуже, чем у «легендарных» Core i7 для LGA1155. Но это, кстати, ниже, чем у Core i5 для «оригинальной» LGA1151 или любых настольных Core для второй версии этой платформы. Тут, конечно, можно затянуть старую песню о разгоне и что никто не использует эти модели в штатном режиме, только вот «исполнять» ее придется целиком — не выкидывая слова о том, что разгон некогда топовых процессоров на самом деле становится необходимым, что б спустя несколько лет хотя бы догнать (примерно) представителей заведомо младших линеек для новых платформ. Не более того. И, заметим, верно это даже при сравнении «ядро к ядру / поток к потоку»: Ryzen 3 или там Core i7-7700K в этом плане никакой форы не имеют, но работают быстрее. В общем, обращать внимание приходится не только на этот параметр. Особенно после того, как появились игры, которым, по-хорошему, шесть-восемь ядер уже могут понадобится, а не просто пригодиться. Но это отдельная тема — требующая отдельного серьезного разговора. Фактически же можно утверждать, что те же полтора раза между i7-2700K и i7-7700K можно «отыскать» и в играх. Разумеется, в тех случаях, когда производительность «не упирается» в видеокарту — но для минимальной частоты кадров, например, это верно всегда. Много это или мало? Каждый свои выводы должен сделать сам. С нашей же точки зрения, этого по крайней мере достаточно, чтобы не считать все четырехъядерные Core i7 одинаковыми в плане игрового применения. Да — последние модели (особенно при наличии не слишком мощной видеокарты) справятся с этой работой по крайней мере на уровне современных бюджетных Core i3 или Ryzen 3. Может быть и немного лучше. Не много — но не так уж и мало. Основная проблема же в том, что их предшественники и на это неспособны.
Поэтому (сейчас будет очень непопулярный вывод) попытки превратить старый компьютер в игровую систему путем установки топового для платформы процессора большого смысла не имеют. Пока это работает — пусть работает. Но если уж деньги вкладывать, не стоит перебарщивать с экономией — переход на современную платформу (без особой разницы — AMD или Intel) намного эффективнее. Пусть и дороже.
Итого
Главный вывод можно сформулировать одной фразой: полтора раза — за пять лет, и еще два раза — за три года. В общем, жизнь ускорилась — к удовольствию тех, кто испытывает страсть к перманентному апгрейду, и неудовольствию желающих собрать «правильный» компьютер и с комфортом «просидеть» на нем лет 10 🙂 Понятно, что загадывать далеко вперед не стоит — очень может быть, что ближайшие 10 лет окажутся столь же неравномерными, но с героями вчерашних дней уже все ясно. Они в два-три раза медленнее современных Core i7 и Ryzen 7 — хотя и последние-то уже топовыми решениями не являются. Лучшие модели пятилетней давности соответствуют современным бюджетным Core i3 / Ryzen 3, более старые могут достичь и такого-то уровня лишь при разгоне — вплоть до экстремального. Стоит ли овчинка выделки — решать самостоятельно. Мы же просто закрываем эту страницу — больше тестирований исторических платформ не будет. Разве что провести быструю оценку бюджетных линеек стоит — ведь современный Celeron куда меньше отличается от исторического, чем процессоры старших семейств. Но это уже будет исследование ради исследования, конечно. Практическая же ценность старых платформ «в лучшем виде», как нам кажется, понятна. Добавить к этому уже ничего не получится. А обновление ассортимента AMD и Intel в скором времени ситуацию только усугубит.
Пять поколений Core i7: от Sandy Bridge до Skylake. Сравнительное тестирование
Intel «Core i7-4790K» Socket1150 (арт. 124956)
Введение
Этим летом компания Intel совершила странное: она умудрилась сменить целых два поколения процессоров, ориентированных на общеупотребительные персональные компьютеры. Сначала на смену Haswell пришли процессоры с микроархитектурой Broadwell, но затем в течение буквально пары месяцев они утратили свой статус новинки и уступили место процессорам Skylake, которые будут оставаться наиболее прогрессивными CPU как минимум ещё года полтора. Такая чехарда со сменой поколений произошла главным образом в связи с проблемами Intel, возникшими при внедрении нового 14-нм техпроцесса, который применяется при производстве и Broadwell, и Skylake. Производительные носители микроархитектуры Broadwell по пути в настольные системы сильно задержались, а их последователи вышли по заранее намеченному графику, что привело к скомканности анонса процессоров Core пятого поколения и серьёзному сокращению их жизненного цикла. В результате всех этих пертурбаций, в десктопном сегменте Broadwell заняли совсем узкую нишу экономичных процессоров с мощным графическим ядром и довольствуются теперь лишь небольшим уровнем продаж, свойственным узкоспециализированным продуктам. Внимание же передовой части пользователей переключилось на последователей Broadwell – процессоры Skylake.
Надо заметить, что в последние несколько лет компания Intel совсем не радует своих поклонников ростом производительности предлагаемых продуктов. Каждое новое поколение процессоров прибавляет в удельном быстродействии лишь по несколько процентов, что в конечном итоге приводит к отсутствию у пользователей явных стимулов к модернизации старых систем. Но выход Skylake – поколения CPU, по пути к которому Intel, фактически, перепрыгнула через ступеньку – внушал определённые надежды на то, что мы получим действительно стоящее обновление самой распространённой вычислительной платформы. Однако, ничего подобного так и не случилось: Intel выступила в своём привычном репертуаре. Broadwell был представлен общественности в качестве некого ответвления от основной линии процессоров для настольных систем, а Skylake оказались быстрее Haswell в большинстве приложений совсем незначительно .
Поэтому несмотря на все ожидания, появление Skylake в продаже вызвало у многих скептическое отношение. Ознакомившись с результатами реальных тестов, многие покупатели попросту не увидели реального смысла в переходе на процессоры Core шестого поколения. И действительно, главным козырем свежих CPU выступает прежде всего новая платформа с ускоренными внутренними интерфейсами, но не новая процессорная микроархитектура. И это значит, что реальных стимулов к обновлению основанных систем прошлых поколений Skylake предлагает немного.
Впрочем, мы бы всё-таки не стали отговаривать от перехода Skylake всех без исключения пользователей. Дело в том, что пусть Intel и наращивает производительность своих процессоров очень сдержанными темпами, с момента появления Sandy Bridge, которые всё ещё трудятся во многих системах, сменилось уже четыре поколения микроархитектуры. Каждый шаг по пути прогресса вносил свой вклад в увеличение производительности, и к сегодняшнему дню Skylake способен предложить достаточно существенный прирост в производительности по сравнению со своими более ранними предшественниками. Только чтобы увидеть это, сравнивать его надо не с Haswell, а с более ранними представителями семейства Core, появившимися до него.
Собственно, именно таким сравнением мы сегодня и займёмся. Учитывая всё сказанное, мы решили посмотреть, насколько выросла производительность процессоров Core i7 с 2011 года, и собрали в едином тесте старшие Core i7, относящиеся к поколениям Sandy Bridge, Ivy Bridge, Haswell, Broadwell и Skylake. Получив же результаты такого тестирования, мы постараемся понять, обладателям каких процессоров целесообразно затевать модернизацию старых систем, а кто из них может повременить до появления последующих поколений CPU. Попутно мы посмотрим и на уровень производительности новых процессоров Core i7-5775C и Core i7-6700K поколений Broadwell и Skylake, которые до настоящего момента в нашей лаборатории ещё не тестировались.
Сравнительные характеристики протестированных CPU
От Sandy Bridge до Skylake: сравнение удельной производительности
Для того, чтобы вспомнить, как же менялась удельная производительность интеловских процессоров в течение последней пятилетки, мы решили начать с простого теста, в котором сопоставили скорость работы Sandy Bridge, Ivy Bridge, Haswell, Broadwell и Skylake, приведённых к одной и той же частоте 4,0 ГГц. В этом сравнении нами были использованы процессоры линейки Core i7, то есть, четырёхъядерники, обладающие технологией Hyper-Threading.
В качестве основного тестового инструмента был взят комплексный тест SYSmark 2014 1.5, который хорош тем, что воспроизводит типичную пользовательскую активность в общеупотребительных приложениях офисного характера, при создании и обработке мультимедийного контента и при решении вычислительных задач. На следующих графиках отображены полученные результаты. Для удобства восприятия они нормированы, за 100 процентов принята производительность Sandy Bridge.
Интегральный показатель SYSmark 2014 1.5 позволяет сделать следующие наблюдения. Переход от Sandy Bridge к Ivy Bridge увеличил удельную производительность совсем незначительно – примерно на 3-4 процента. Дальнейший шаг к Haswell оказался гораздо более результативным, он вылился в 12-процентное улучшение производительности. И это – максимальный прирост, который можно наблюдать на приведённом графике. Ведь дальше Broadwell обгоняет Haswell всего лишь на 7 процентов, а переход от Broadwell к Skylake и вовсе наращивает удельную производительность лишь на 1-2 процента. Весь же прогресс от Sandy Bridge до Skylake выливается в 26-процентное увеличение производительности при постоянстве тактовых частот.
Более подробную расшифровку полученных показателей SYSmark 2014 1.5 можно посмотреть на трёх следующих графиках, где интегральный индекс производительности разложен по составляющим по типу приложений.
Обратите внимание, наиболее заметно с вводом новых версий микроархитектур прибавляют в скорости исполнения мультимедийные приложения. В них микроархитектура Skylake превосходит Sandy Bridge на целых 33 процента. А вот в счётных задачах, напротив, прогресс проявляется меньше всего. И более того, при такой нагрузке шаг от Broadwell к Skylake даже оборачивается небольшим снижением удельной производительности.
Теперь, когда мы представляем себе, что же происходило с удельной производительностью процессоров Intel в течение последних нескольких лет, давайте попробуем разобраться, чем наблюдаемые изменения были обусловлены.
От Sandy Bridge до Skylake: что изменилось в процессорах Intel
Сделать точкой отсчёта в сравнении разных Core i7 представителя поколения Sandy Bridge мы решили не просто так. Именно данный дизайн подвёл крепкий фундамент под всё дальнейшее совершенствование производительных интеловских процессоров вплоть до сегодняшних Skylake. Так, представители семейства Sandy Bridge стали первыми высокоинтегрированными CPU, в которых в одном полупроводниковом кристалле были собраны и вычислительные, и графическое ядра, а также северный мост с L3-кешем и контроллером памяти. Кроме того, в них впервые стала использоваться внутренняя кольцевая шина, посредством которой была решена задача высокоэффективного взаимодействия всех структурных единиц, составляющих столь сложный процессор. Этим заложенным в микроархитектуре Sandy Bridge универсальным принципам построения продолжают следовать все последующие поколения CPU без каких бы то ни было серьёзных корректив.
Немалые изменения в Sandy Bridge претерпела внутренняя микроархитектура вычислительных ядер. В ней не только была реализована поддержка новых наборов команд AES-NI и AVX, но и нашли применение многочисленные крупные улучшения в недрах исполнительного конвейера. Именно в Sandy Bridge был добавлен отдельный кеш нулевого уровня для декодированных инструкций; появился абсолютно новый блок переупорядочивания команд, основанный на использовании физического регистрового файла; были заметно улучшены алгоритмы предсказания ветвлений; а кроме того, два из трёх исполнительных порта для работы с данными стали унифицированными. Такие разнородные реформы, проведённые сразу на всех этапах конвейера, позволили серьёзно увеличить удельную производительность Sandy Bridge, которая по сравнению с процессорами предыдущего поколения Nehalem сразу выросла почти на 15 процентов. К этому добавился 15-процентный рост номинальных тактовых частот и отличный разгонный потенциал, в результате чего в сумме получилось семейство процессоров, которое до сих пор ставится в пример Intel, как образцовое воплощение фазы «так» в принятой в компании маятниковой концепции разработки.
И правда, подобных по массовости и действенности улучшений в микроархитектуре после Sandy Bridge мы уже не видели. Все последующие поколения процессорных дизайнов проводят куда менее масштабные усовершенствования в вычислительных ядрах. Возможно, это является отражением отсутствия реальной конкуренции на процессорном рынке, возможно причина замедления прогресса кроется в желании Intel сосредоточить усилия на совершенствовании графических ядер, а может быть Sandy Bridge просто оказался настолько удачным проектом, что его дальнейшее развитие требует слишком больших трудозатрат.
Отлично иллюстрирует произошедший спад интенсивности инноваций переход от Sandy Bridge к Ivy Bridge. Несмотря на то, что следующее за Sandy Bridge поколение процессоров и было переведено на новую производственную технологию с 22-нм нормами, его тактовые частоты совсем не выросли. Сделанные же улучшения в дизайне в основном коснулись ставшего более гибким контроллера памяти и контроллера шины PCI Express, который получил совместимость с третьей версией данного стандарта. Что же касается непосредственно микроархитектуры вычислительных ядер, то отдельные косметические переделки позволили добиться ускорения выполнения операций деления и небольшого увеличения эффективности технологии Hyper-Threading, да и только. В результате, рост удельной производительности составил не более 5 процентов.
Вместе с тем, внедрение Ivy Bridge принесло и то, о чём теперь горько жалеет миллионная армия оверклокеров. Начиная с процессоров этого поколения, Intel отказалась от сопряжения полупроводникового кристалла CPU и закрывающей его крышки посредством бесфлюсовой пайки и перешла на заполнение пространства между ними полимерным термоинтерфейсным материалом с очень сомнительными теплопроводящими свойствами. Это искусственно ухудшило частотный потенциал и сделало процессоры Ivy Bridge, как и всех их последователей, заметно менее разгоняемыми по сравнению с очень бодрыми в этом плане «старичками» Sandy Bridge.
Впрочем, Ivy Bridge – это всего лишь «тик», а потому особых прорывов в этих процессорах никто и не обещал. Однако никакого воодушевляющего роста производительности не принесло и следующее поколение, Haswell, которое, в отличие от Ivy Bridge, относится уже к фазе «так». И это на самом деле немного странно, поскольку различных улучшений в микроархитектуре Haswell сделано немало, причём они рассредоточены по разным частям исполнительного конвейера, что в сумме вполне могло бы увеличить общий темп исполнения команд.
Например, во входной части конвейера была улучшена результативность предсказания переходов, а очередь декодированных инструкций стала делиться между параллельными потоками, сосуществующими в рамках технологии Hyper-Threading, динамически. Попутно произошло увеличение окна внеочередного исполнения команд, что в сумме должно было поднять долю параллельно выполняемого процессором кода. Непосредственно в исполнительном блоке были добавлены два дополнительных функциональных порта, нацеленных на обработку целочисленных команд, обслуживание ветвлений и сохранение данных. Благодаря этому Haswell стал способен обрабатывать до восьми микроопераций за такт – на треть больше предшественников. Более того, новая микроархитектура удвоила и пропускную способность кеш-памяти первого и второго уровней.
Таким образом, улучшения в микроархитектуре Haswell не затронули лишь скорость работы декодера, который, похоже, на данный момент стал самым узким местом в современных процессорах Core. Ведь несмотря на внушительный список улучшений, прирост удельной производительности у Haswell по сравнению с Ivy Bridge составил лишь около 5-10 процентов. Но справедливости ради нужно оговориться, что на векторных операциях ускорение заметно гораздо сильнее. А наибольший выигрыш можно увидеть в приложениях, использующих новые AVX2 и FMA-команды, поддержка которых также появилась в этой микроархитектуре.
Процессоры Haswell, как и Ivy Bridge, сперва тоже не особенно понравились энтузиастам. Особенно если учесть тот факт, что в первоначальной версии никакого увеличения тактовых частот они не предложили. Однако спустя год после своего дебюта Haswell стали казаться заметно привлекательнее. Во-первых, увеличилось количество приложений, обращающихся к наиболее сильным сторонам этой архитектуры и использующих векторные инструкции. Во-вторых, Intel смогла исправить ситуацию с частотами. Более поздние модификации Haswell, получившие собственное кодовое наименование Devil’s Canyon, смогли нарастить преимущество над предшественниками благодаря увеличению тактовой частоты, которая, наконец, пробила 4-гигагерцовый потолок. Кроме того, идя на поводу у оверклокеров, Intel улучшила полимерный термоинтерфейс под процессорной крышкой, что сделало Devil’s Canyon более подходящими объектами для разгона. Конечно, не такими податливыми, как Sandy Bridge, но тем не менее.
И вот с таким багажом Intel подошла к Broadwell. Поскольку основной ключевой особенностью этих процессоров должна была стать новая технология производства с 14-нм нормами, никаких значительных нововведений в их микроархитектуре не планировалось – это должен был быть почти самый банальный «тик». Всё необходимое для успеха новинок вполне мог бы обеспечить один только тонкий техпроцесс с FinFET-транзисторами второго поколения, в теории позволяющий уменьшить энергопотребление и поднять частоты. Однако практическое внедрение новой технологии обернулось чередой неудач, в результате которых Broadwell досталась лишь экономичность, но не высокие частоты. В итоге те процессоры этого поколения, которые Intel представила для настольных систем, вышли больше похожими на мобильные CPU, чем на продолжателей дела Devil’s Canyon. Тем более, что кроме урезанных тепловых пакетов и откатившихся частот они отличаются от предшественников и уменьшившимся в объёме L3-кешем, что, правда, несколько компенсируется появлением расположенного на отдельном кристалле кэша четвёртого уровня.
На одинаковой с Haswell частоте процессоры Broadwell демонстрируют примерно 7-процентное преимущество, обеспечиваемое как добавлением дополнительного уровня кеширования данных, так и очередным улучшением алгоритма предсказания ветвлений вместе с увеличением основных внутренних буферов. Кроме того, в Broadwell реализованы новые и более быстрые схемы выполнения инструкций умножения и деления. Однако все эти небольшие улучшения перечёркиваются фиаско с тактовыми частотами, относящими нас в эпоху до Sandy Bridge. Так, например, старший оверклокерский Core i7-5775C поколения Broadwell уступает по частоте Core i7-4790K целых 700 МГц. Понятно, что ожидать какого-то роста производительности на этом фоне бессмысленно, лишь бы обошлось без её серьёзного падения.
Во многом именно из-за этого Broadwell и оказался непривлекательным для основной массы пользователей. Да, процессоры этого семейства отличаются высокой экономичностью и даже вписываются в тепловой пакет с 65-ваттными рамками, но кого это, по большому счёту, волнует? Разгонный же потенциал первого поколения 14-нм CPU оказался достаточно сдержанным. Ни о какой работе на частотах, приближающихся к 5-гигагерцовой планке речь не идёт. Максимум, которого можно добиться от Broadwell при использовании воздушного охлаждения пролегает в окрестности величины 4,2 ГГц. Иными словами, пятое поколение Core вышло у Intel, как минимум, странноватым. О чём, кстати, микропроцессорный гигант в итоге и пожалел: представители Intel отмечают, что поздний выход Broadwell для настольных компьютеров, его сокращённый жизненный цикл и нетипичные характеристики отрицательно сказались на уровне продаж, и больше компания на подобные эксперименты пускаться не планирует.
Новейший же Skylake на этом фоне представляется не столько как дальнейшее развитие интеловской микроархитектуры, сколько своего рода работа над ошибками. Несмотря на то, что при производстве этого поколения CPU используется тот же 14-нм техпроцесс, что и в случае Broadwell, никаких проблем с работой на высоких частотах у Skylake нет. Номинальные частоты процессоров Core шестого поколения вернулись к тем показателям, которые были свойственны их 22-нм предшественникам, а разгонный потенциал даже немного увеличился. На руку оверклокерам здесь сыграл тот факт, что в Skylake конвертер питания процессора вновь перекочевал на материнскую плату и снизил тем самым суммарное тепловыделение CPU при разгоне. Жаль только, что Intel так и не вернулась к использованию эффективного термоинтерфейса между кристаллом и процессорной крышкой.
Но вот что касается базовой микроархитектуры вычислительных ядер, то несмотря на то, что Skylake, как и Haswell, представляет собой воплощение фазы «так», нововведений в ней совсем немного. Причём большинство из них направлено на расширение входной части исполнительного конвейера, остальные же части конвейера остались без каких-либо существенных изменений. Перемены касаются улучшения результативности предсказания ветвлений и повышения эффективности блока предварительной выборки, да и только. При этом часть оптимизаций служит не столько для улучшения производительности, сколько направлена на очередное повышение энергоэффективности. Поэтому удивляться тому, что Skylake по своей удельной производительности почти не отличается от Broadwell, не следует.
Впрочем, существуют и исключения: в отдельных случаях Skylake могут превосходить предшественников в производительности и более заметно. Дело в том, что в этой микроархитектуре была усовершенствована подсистема памяти. Внутрипроцессорная кольцевая шина стала быстрее, и это в конечном итоге расширило полосу пропускания L3-кэша. Плюс к этому контроллер памяти получил поддержку работающей на высоких частотах памяти стандарта DDR4 SDRAM.
Но в итоге тем не менее получается, что бы там не говорила Intel о прогрессивности Skylake, с точки зрения обычных пользователей это – достаточно слабое обновление. Основные улучшения в Skylake сделаны в графическом ядре и в энергоэффективности, что открывает перед такими CPU путь в безвентиляторные системы планшетного форм-фактора. Десктопные же представители этого поколения отличаются от тех же Haswell не слишком заметно. Даже если закрыть глаза на существование промежуточного поколения Broadwell, и сопоставлять Skylake напрямую с Haswell, то наблюдаемый рост удельной производительности составит порядка 7-8 процентов, что вряд ли можно назвать впечатляющим проявлением технического прогресса.
Попутно стоит отметить, что не оправдывает ожиданий и совершенствование технологических производственных процессов. На пути от Sandy Bridge дo Skylake компания Intel сменила две полупроводниковых технологии и уменьшила толщину транзисторных затворов более чем вдвое. Однако современный 14-нм техпроцесс по сравнению с 32-нм технологией пятилетней давности так и не позволил нарастить рабочие частоты процессоров. Все процессоры Core последних пяти поколений имеют очень похожие тактовые частоты, которые если и превышают 4-гигагерцовую отметку, то совсем незначительно.
Для наглядной иллюстрации этого факта можно посмотреть на следующий график, на котором отображена тактовая частота старших оверклокерских процессоров Core i7 разных поколений.
Более того, пик тактовой частоты приходится даже не на Skylake. Максимальной частотой могут похвастать процессоры Haswell, относящиеся к подгруппе Devil’s Canyon. Их номинальная частота составляет 4,0 ГГц, но благодаря турбо-режиму в реальных условиях они способны разгоняться до 4,4 ГГц. Для современных же Skylake максимум частоты – всего лишь 4,2 ГГц.
Всё это, естественно, сказывается на итоговой производительности реальных представителей различных семейств CPU. И далее мы предлагаем посмотреть, как всё это отражается на быстродействии платформ, построенных на базе флагманских процессоров каждого из семейств Sandy Bridge, Ivy Bridge, Haswell, Broadwell и Skylake.
Как мы тестировали
В сравнении приняли участие пять процессоров Core i7 разных поколений: Core i7-2700K, Core i7-3770K, Core i7-4790K, Core i7-5775C и Core i7-6700K. Поэтому список комплектующих, задействованных в тестировании, получился достаточно обширным:
Процессоры:
Intel Core i7-2600K (Sandy Bridge, 4 ядра + HT, 3,4-3,8 ГГц, 8 Мбайт L3);
Intel Core i7-3770K (Ivy Bridge, 4 ядра + HT, 3,5-3,9 ГГц, 8 Мбайт L3);
Intel Core i7-4790K (Haswell Refresh, 4 ядра + HT, 4,0-4,4 ГГц, 8 Мбайт L3);
Intel Core i7-5775C (Broadwell, 4 ядра, 3,3-3,7 ГГц, 6 Мбайт L3, 128 Мбайт L4).
Intel Core i7-6700K (Skylake, 4 ядра, 4,0-4,2 ГГц, 8 Мбайт L3).
Процессорный кулер: Noctua NH-U14S.
Материнские платы:
ASUS Z170 Pro Gaming (LGA 1151, Intel Z170);
ASUS Z97-Pro (LGA 1150, Intel Z97);
ASUS P8Z77-V Deluxe (LGA1155, Intel Z77).
2×8 Гбайт DDR3-2133 SDRAM, 9-11-11-31 (G.Skill [TridentX] F3-2133C9D-16GTX);
2×8 Гбайт DDR4-2666 SDRAM, 15-15-15-35 (Corsair Vengeance LPX CMK16GX4M2A2666C16R).
Видеокарта: NVIDIA GeForce GTX 980 Ti (6 Гбайт/384-бит GDDR5, 1000-1076/7010 МГц).
Дисковая подсистема: Kingston HyperX Savage 480 GB (SHSS37A/480G).
Блок питания: Corsair RM850i (80 Plus Gold, 850 Вт).
Тестирование выполнялось в операционной системе Microsoft Windows 10 Enterprise Build 10240 с использованием следующего комплекта драйверов:
Intel Chipset Driver 10.1.1.8;
Intel Management Engine Interface Driver 11.0.0.1157;
NVIDIA GeForce 358.50 Driver.
Производительность
Общая производительность
Для оценки производительности процессоров в общеупотребительных задачах мы традиционно используем тестовый пакет Bapco SYSmark, моделирующий работу пользователя в реальных распространённых современных офисных программах и приложениях для создания и обработки цифрового контента. Идея теста очень проста: он выдаёт единственную метрику, характеризующую средневзвешенную скорость компьютера при повседневном использовании. После выхода операционной системы Windows 10 этот бенчмарк в очередной раз обновился, и теперь мы задействуем самую последнюю версию – SYSmark 2014 1.5.
При сравнении Core i7 разных поколений, когда они работают в своих номинальных режимах, результаты получаются совсем не такие, как при сопоставлении на единой тактовой частоте. Всё-таки реальная частота и особенности работы турбо-режима оказывает достаточно существенное влияние на производительность. Например, согласно полученным данным, Core i7-6700K быстрее Core i7-5775C на целых 11 процентов, но при этом его преимущество над Core i7-4790K совсем незначительно – оно составляет всего лишь порядка 3 процентов. При этом нельзя обойти вниманием и то, что новейший Skylake оказывается существенно быстрее процессоров поколений Sandy Bridge и Ivy Bridge. Его преимущество над Core i7-2700K и Core i7-3770K достигает 33 и 28 процентов соответственно.
Более глубокое понимание результатов SYSmark 2014 1.5 способно дать знакомство с оценками производительности, получаемое в различных сценариях использования системы. Сценарий Office Productivity моделирует типичную офисную работу: подготовку текстов, обработку электронных таблиц, работу с электронной почтой и посещение Интернет-сайтов. Сценарий задействует следующий набор приложений: Adobe Acrobat XI Pro, Google Chrome 32, Microsoft Excel 2013, Microsoft OneNote 2013, Microsoft Outlook 2013, Microsoft PowerPoint 2013, Microsoft Word 2013, WinZip Pro 17.5 Pro.
В сценарии Media Creation моделируется создание рекламного ролика с использованием предварительно отснятых цифровых изображений и видео. Для этой цели применяются популярные пакеты Adobe Photoshop CS6 Extended, Adobe Premiere Pro CS6 и Trimble SketchUp Pro 2013.
Сценарий Data/Financial Analysis посвящён статистическому анализу и прогнозированию инвестиций на основе некой финансовой модели. В сценарии используются большие объёмы численных данных и два приложения Microsoft Excel 2013 и WinZip Pro 17.5 Pro.
Результаты, полученные нами при различных сценариях нагрузки, качественно повторяют общие показатели SYSmark 2014 1.5. Обращает на себя внимание лишь тот факт, что процессор Core i7-4790K совсем не выглядит устаревшим. Он заметно проигрывает новейшему Core i7-6700K только в расчётном сценарии Data/Financial Analysis, а в остальных случаях либо уступает своему последователю на совсем малозаметную величину, либо вообще оказывается быстрее. Например, представитель семейства Haswell опережает новый Skylake в офисных приложениях. Но процессоры более старых годов выпуска, Core i7-2700K и Core i7-3770K, выглядят уже несколько устаревшими предложениями. Они проигрывают новинке в разных типах задач от 25 до 40 процентов, и это, пожалуй, является вполне достаточным основанием, чтобы Core i7-6700K можно было рассматривать в качестве достойной им замены.
Игровая производительность
Как известно, производительность платформ, оснащенных высокопроизводительными процессорами, в подавляющем большинстве современных игр определяется мощностью графической подсистемы. Именно поэтому при тестировании процессоров мы выбираем наиболее процессорозависимые игры, а измерение количества кадров выполняем дважды. Первым проходом тесты проводятся без включения сглаживания и с установкой далеко не самых высоких разрешений. Такие настройки позволяют оценить, насколько хорошо проявляют себя процессоры с игровой нагрузкой в принципе, а значит, позволяют строить догадки о том, как будут вести себя тестируемые вычислительные платформы в будущем, когда на рынке появятся более быстрые варианты графических ускорителей. Второй проход выполняется с реалистичными установками – при выборе FullHD-разрешения и максимального уровня полноэкранного сглаживания. На наш взгляд такие результаты не менее интересны, так как они отвечают на часто задаваемый вопрос о том, какой уровень игровой производительности могут обеспечить процессоры прямо сейчас – в современных условиях.
Впрочем, в этом тестировании мы собрали мощную графическую подсистему, основанную на флагманской видеокарте NVIDIA GeForce GTX 980 Ti. И в результате в части игр частота кадров продемонстрировала зависимость от процессорной производительности даже в FullHD-разрешении.
Результаты в FullHD-разрешении с максимальными настройками качества
Обычно влияние процессоров на игровую производительность, особенно если речь идёт о мощных представителях серии Core i7, оказывается незначительным. Однако при сопоставлении пяти Core i7 разных поколений результаты получаются совсем не однородными. Даже при установке максимальных настроек качества графики Core i7-6700K и Core i7-5775C демонстрируют наивысшую игровую производительность, в то время как более старые Core i7 от них отстают. Так, частота кадров, которая получена в системе с Core i7-6700K превышает производительность системы на базе Core i7-4770K на малозаметный один процент, но процессоры Core i7-2700K и Core i7-3770K представляются уже ощутимо худшей основой геймерской системы. Переход с Core i7-2700K или Core i7-3770K на новейший Core i7-6700K даёт прибавку в числе fps величиной в 5-7 процентов, что способно оказать вполне заметное влияние на качество игрового процесса.
Увидеть всё это гораздо нагляднее можно в том случае, если на игровую производительность процессоров посмотреть при сниженном качестве изображения, когда частота кадров не упирается в мощность графической подсистемы.
Результаты при сниженном разрешении
Новейшему процессору Core i7-6700K вновь удаётся показать наивысшую производительность среди всех Core i7 последних поколений. Его превосходство над Core i7-5775C составляет порядка 5 процентов, а над Core i7-4690K – около 10 процентов. В этом нет ничего странного: игры достаточно чутко реагируют на скорость подсистемы памяти, а именно по этому направлению в Skylake были сделаны серьёзные улучшения. Но гораздо заметнее превосходство Core i7-6700K над Core i7-2700K и Core i7-3770K. Старший Sandy Bridge отстаёт от новинки на 30-35 процентов, а Ivy Bridge проигрывает ей в районе 20-30 процентов. Иными словами, как бы ни ругали Intel за слишком медленное совершенствование собственных процессоров, компания смогла за прошедшие пять лет на треть повысить скорость работы своих CPU, а это – очень даже ощутимый результат.
Тестирование в реальных играх завершают результаты популярного синтетического бенчмарка Futuremark 3DMark.
Вторят игровым показателям и те результаты, которые выдаёт Futuremark 3DMark. При переводе микроархитектуры процессоров Core i7 c Sandy Bridge на Ivy Bridge показатели 3DMark выросли на величину от 2 до 7 процентов. Внедрение дизайна Haswell и выпуск процессоров Devil’s Canyon добавил к производительности старших Core i7 дополнительные 7-14 процентов. Однако потом появление Core i7-5775C, обладающего сравнительно невысокой тактовой частотой, несколько откатило быстродействие назад. И новейшему Core i7-6700K, фактически, пришлось отдуваться сразу за два поколения микроархитектуры. Прирост в итоговом рейтинге 3DMark у нового процессора семейства Skylake по сравнению с Core i7-4790K составил до 7 процентов. И на самом деле это не так много: всё-таки самое заметное улучшение производительности за последние пять лет смогли привнести процессоры Haswell. Последние же поколения десктопных процессоров, действительно, несколько разочаровывают.
Тесты в приложениях
В Autodesk 3ds max 2016 мы тестируем скорость финального рендеринга. Измеряется время, затрачиваемое на рендеринг в разрешении 1920×1080 с применением рендерера mental ray одного кадра стандартной сцены Hummer.
Ещё один тест финального рендеринга проводится нами с использованием популярного свободного пакета построения трёхмерной графики Blender 2.75a. В нём мы измеряем продолжительность построения финальной модели из Blender Cycles Benchmark rev4.
Для измерения скорости фотореалистичного трёхмерного рендеринга мы воспользовались тестом Cinebench R15. Maxon недавно обновила свой бенчмарк, и теперь он вновь позволяет оценить скорость работы различных платформ при рендеринге в актуальных версиях анимационного пакета Cinema 4D.
Производительность при работе веб-сайтов и интернет-приложений, построенных с использованием современных технологий, измеряется нами в новом браузере Microsoft Edge 20.10240.16384.0. Для этого применяется специализированный тест WebXPRT 2015, реализующий на HTML5 и JavaScript реально использующиеся в интернет-приложениях алгоритмы.
Тестирование производительности при обработке графических изображений происходит в Adobe Photoshop CC 2015. Измеряется среднее время выполнения тестового скрипта, представляющего собой творчески переработанный Retouch Artists Photoshop Speed Test, который включает типичную обработку четырёх 24-мегапиксельных изображений, сделанных цифровой камерой.
По многочисленным просьбам фотолюбителей мы провели тестирование производительности в графической программе Adobe Photoshop Lightroom 6.1. Тестовый сценарий включает пост-обработку и экспорт в JPEG с разрешением 1920×1080 и максимальным качеством двухсот 12-мегапиксельных изображений в RAW-формате, сделанных цифровой камерой Nikon D300.
В Adobe Premiere Pro CC 2015 тестируется производительность при нелинейном видеомонтаже. Измеряется время рендеринга в формат H.264 Blu-Ray проекта, содержащего HDV 1080p25 видеоряд с наложением различных эффектов.
Для измерения быстродействия процессоров при компрессии информации мы пользуемся архиватором WinRAR 5.3, при помощи которого с максимальной степенью сжатия архивируем папку с различными файлами общим объёмом 1,7 Гбайт.
Для оценки скорости перекодирования видео в формат H.264 используется тест x264 FHD Benchmark 1.0.1 (64bit), основанный на измерении времени кодирования кодером x264 исходного видео в формат MPEG-4/AVC с разрешением 1920×1080@50fps и настройками по умолчанию. Следует отметить, что результаты этого бенчмарка имеют огромное практическое значение, так как кодер x264 лежит в основе многочисленных популярных утилит для перекодирования, например, HandBrake, MeGUI, VirtualDub и проч. Мы периодически обновляем кодер, используемый для измерений производительности, и в данном тестировании приняла участие версия r2538, в которой реализована поддержка всех современных наборов инструкций, включая и AVX2.
Кроме того, мы добавили в список тестовых приложений и новый кодер x265, предназначенный для транскодирования видео в перспективный формат H.265/HEVC, который является логическим продолжением H.264 и характеризуется более эффективными алгоритмами сжатия. Для оценки производительности используется исходный 1080p@50FPS Y4M-видеофайл, который перекодируется в формат H.265 с профилем medium. В этом тестировании принял участие релиз кодера версии 1.7.
Преимущество Core i7-6700K над ранними предшественниками в различных приложениях не подлежит сомнению. Однако больше всего выиграли от произошедшей эволюции два типа задач. Во-первых, связанные с обработкой мультимедийного контента, будь то видео или изображения. Во-вторых, финальный рендеринг в пакетах трёхмерного моделирования и проектирования. В целом, в таких случаях Core i7-6700K превосходит Core i7-2700K не менее, чем на 40-50 процентов. А иногда можно наблюдать и гораздо более впечатляющее улучшение скорости. Так, при перекодировании видео кодеком x265 новейший Core i7-6700K выдаёт ровно вдвое более высокую производительность, чем старичок Core i7-2700K.
Если же говорить о том приросте в скорости выполнения ресурсоёмких задач, которую может обеспечить Core i7-6700K по сравнению с Core i7-4790K, то тут уже столь впечатляющих иллюстраций к результатам работы интеловских инженеров привести нельзя. Максимальное преимущество новинки наблюдается в Lightroom, здесь Skylake оказался лучше в полтора раза. Но это скорее – исключение из правила. В большинстве же мультимедийных задач Core i7-6700K по сравнению с Core i7-4790K предлагает лишь 10-процентное улучшение производительности. А при нагрузке иного характера разница в быстродействии и того меньше или же вообще отсутствует.
Отдельно нужно сказать пару слов и о результате, показанном Core i7-5775C. Из-за небольшой тактовой частоты этот процессор медленнее, чем Core i7-4790K и Core i7-6700K. Но не стоит забывать о том, что его ключевой характеристикой является экономичность. И он вполне способен стать одним из лучших вариантов с точки зрения удельной производительности на каждый ватт затраченной электроэнергии. В этом мы легко убедимся в следующем разделе.
Энергопотребление
Процессоры Skylake производятся по современному 14-нм технологическому процессу с трёхмерными транзисторами второго поколения, однако, несмотря на это, их тепловой пакет вырос до 91 Вт. Иными словами, новые CPU не только «горячее» 65-ваттных Broadwell, но и превосходят по расчётному тепловыделению Haswell, выпускаемые по 22-нм технологии и уживающиеся в рамках 88-ваттного теплового пакета. Причина, очевидно, состоит в том, что изначально архитектура Skylake оптимизировалась с прицелом не на высокие частоты, а на энергоэффективность и возможность использования в мобильных устройствах. Поэтому для того, чтобы десктопные Skylake получили приемлемые тактовые частоты, лежащие в окрестности 4-гигагерцевой отметки, пришлось задирать напряжение питания, что неминуемо отразилось на энергопотреблении и тепловыделении.
Впрочем, процессоры Broadwell низкими рабочими напряжениями тоже не отличались, поэтому существует надежда на то, что 91-ваттный тепловой пакет Skylake получили по каким-то формальным обстоятельствам и, на самом деле, они окажутся не прожорливее предшественников. Проверим!
Используемый нами в тестовой системе новый цифровой блок питания Corsair RM850i позволяет осуществлять мониторинг потребляемой и выдаваемой электрической мощности, чем мы и пользуемся для измерений. На следующем ниже графике приводится полное потребление систем (без монитора), измеренное «после» блока питания и представляющее собой сумму энергопотребления всех задействованных в системе компонентов. КПД самого блока питания в данном случае не учитывается. Для правильной оценки энергопотребления мы активировали турборежим и все имеющиеся энергосберегающие технологии.
В состоянии простоя качественный скачок в экономичности настольных платформ произошёл с выходом Broadwell. Core i7-5775C и Core i7-6700K отличаются заметно более низким потреблением в простое.
Зато под нагрузкой в виде перекодирования видео самыми экономичными вариантами CPU оказываются Core i7-5775C и Core i7-3770K. Новейший же Core i7-6700K потребляет больше. Его энергетические аппетиты находятся на уровне старшего Sandy Bridge. Правда, в новинке, в отличие от Sandy Bridge, есть поддержка инструкций AVX2, которые требуют достаточно серьёзных энергетических затрат.
На следующей диаграмме приводится максимальное потребление при нагрузке, создаваемой 64-битной версией утилиты LinX 0.6.5 с поддержкой набора инструкций AVX2, которая базируется на пакете Linpack, отличающемся непомерными энергетическими аппетитами.
И вновь процессор поколения Broadwell показывает чудеса энергетической эффективности. Однако если смотреть на то, сколько электроэнергии потребляет Core i7-6700K, то становится понятно, что прогресс в микроархитектурах обошёл стороной энергетическую эффективность настольных CPU. Да, в мобильном сегменте с выходом Skylake появились новые предложения с чрезвычайно соблазнительным соотношением производительности и энергопотребления, однако новейшие процессоры для десктопов продолжают потреблять примерно столько же, сколько потребляли их предшественники за пять лет до сегодняшнего дня.
Выводы
Проведя тестирование новейшего Core i7-6700K и сравнив его с несколькими поколениями предшествующих CPU, мы вновь приходим к неутешительному выводу о том, что компания Intel продолжает следовать своим негласным принципам и не слишком стремится наращивать быстродействие десктопных процессоров, ориентированных на высокопроизводительные системы. И если по сравнению со старшим Broadwell новинка предлагает примерно 15-процентное улучшение производительности, обусловленное существенно лучшими тактовыми частотами, то в сравнении с более старым, но более быстрым Haswell она уже не кажется столь же прогрессивной. Разница в производительности Core i7-6700K и Core i7-4790K, несмотря на то, что эти процессоры разделяет два поколения микроархитектуры, не превышает 5-10 процентов. И это очень мало для того, чтобы старший десктопный Skylake можно было бы однозначно рекомендовать для обновления имеющихся LGA 1150-систем.
Впрочем, к столь незначительным шагам Intel в деле повышения скорости работы процессоров для настольных систем стоило бы давно привыкнуть. Прирост быстродействия новых решений, лежащий примерно в таких пределах, – давно сложившаяся традиция. Никаких революционных изменений в вычислительной производительности интеловских CPU, ориентированных на настольные ПК, не происходит уже очень давно. И причины этого вполне понятны: инженеры компании заняты оптимизацией разрабатываемых микроархитектур для мобильных применений и в первую очередь думают об энергоэффективности. Успехи Intel в адаптации собственных архитектур для использования в тонких и лёгких устройствах несомненны, но адептам классических десктопов при этом только и остаётся, что довольствоваться небольшими прибавками быстродействия, которые, к счастью, пока ещё не совсем сошли на нет.
Однако это совсем не значит, что Core i7-6700K можно рекомендовать лишь для новых систем. Задуматься о модернизации своих компьютеров вполне могут обладатели конфигураций, в основе которых лежит платформа LGA 1155 с процессорами поколений Sandy Bridge и Ivy Bridge. В сравнении с Core i7-2700K и Core i7-3770K новый Core i7-6700K выглядит очень неплохо – его средневзвешенное превосходство над такими предшественниками оценивается в 30-40 процентов. Кроме того, процессоры с микроархитектурой Skylake могут похвастать поддержкой набора инструкций AVX2, который к настоящему моменту нашел достаточно широкое применение в мультимедийных приложениях, и благодаря этому в некоторых случаях Core i7-6700K оказывается быстрее гораздо сильнее. Так, при перекодировании видео мы даже видели случаи, когда Core i7-6700K превосходил Core i7-2700K в скорости работы более чем в два раза!
Есть у процессоров Skylake и целый ряд других преимуществ, связанных с внедрением сопутствующей им новой платформы LGA 1151. И дело даже не столько в появившейся в ней поддержке DDR4-памяти, сколько в том, что новые наборы логики сотой серии наконец-то получили действительно скоростное соединение с процессором и поддержку большого количества линий PCI Express 3.0. В результате, передовые LGA 1151-системы могут похвастать наличием многочисленных быстрых интерфейсов для подключения накопителей и внешних устройств, которые лишены каких-либо искусственных ограничений по пропускной способности.
Плюс к тому, оценивая перспективы платформы LGA 1151 и процессоров Skylake, в виду нужно иметь и ещё один момент. Intel не будет спешить с выводом на рынок процессоров следующего поколения, известных как Kaby Lake. Если верить имеющейся информации, представители этой серии процессоров в вариантах для настольных компьютеров появятся на рынке только в 2017 году. Так что Skylake будет с нами ещё долго, и система, построенная на нём, сможет оставаться актуальной в течение очень продолжительного промежутка времени.
От Sandy Bridge до Coffee Lake: сравниваем семь поколений Intel Core i7
Эта статья будет полезна тем, кто давно не обновлял свой ПК и верит в то, что прогресс интеловских CPU описывается формулой «5% в год». Мы покажем, насколько процессоры Coffee Lake превосходят предшественников в действительности. Причём сопоставим их не только с Kaby Lake и Skylake, но и с более старыми чипами серий Broadwell, Haswell, Ivy Bridge и Sandy Bridge
⇣ Содержание
- Страница 1 — Технические характеристики
- § Что поменялось в процессорах Intel c 2011 года по настоящее время
- § Процессоры и платформы: спецификации
- § Описание тестовых систем и методики тестирования
- § Производительность в комплексных бенчмарках
- § Производительность в ресурсоёмких приложениях
- § Производительность в играх
- § Энергопотребление
- § Дополнение: производительность на одинаковой тактовой частоте
- § Заключение
Практически всегда под любой публикацией, в которой так или иначе затрагивается тема производительности современных интеловских процессоров, рано или поздно появляется несколько сердитых читательских комментариев о том, что прогресс в развитии чипов у Intel давно забуксовал и нет смысла переходить со «старого доброго Core i7-2600K» на что-то новое. В таких репликах, скорее всего, будет раздражённо упоминаться про прирост производительности на неосязаемом уровне «не более пяти процентов в год»; про низкокачественный внутренний термоинтерфейс, который непоправимо испортил современные процессоры Intel; либо про то, что покупать в современных условиях процессоры с таким же, как и несколько лет назад, количеством вычислительных ядер вообще – удел недальновидных дилетантов, так как в них нет необходимого задела на будущее.
В том, что все такие реплики не лишены оснований, сомнений нет. Однако очень похоже, что они многократно преувеличивают имеющиеся проблемы. Лаборатория 3DNews подробно тестирует интеловские процессоры с 2000 года, и мы не можем согласиться с тезисом, что какому бы то ни было их развитию пришёл конец, а происходящее с микропроцессорным гигантом в течение последних лет иначе как стагнацией уже и не назовёшь. Да, какие-то кардинальные перемены с процессорами Intel происходят редко, но тем не менее они продолжают планомерно совершенствоваться. Поэтому те чипы серии Core i7, которые можно купить сегодня, заведомо лучше моделей, предлагавшихся несколько лет тому назад.
Поколение Core Кодовое имя Техпроцесс Этап разработки Время выхода 2 Sandy Bridge 32 нм Так (Архитектура) I кв. 2011 3 Ivy Bridge 22 нм Тик (Процесс) II кв. 2012 4 Haswell 22 нм Так (Архитектура) II кв. 2013 5 Broadwell 14 нм Тик (Процесс) II кв. 2015 6 Skylake 14 нм Так
(Архитектура)III кв. 2015 7 Kaby Lake 14+ нм Оптимизация I кв. 2017 8 Coffee Lake 14++ нм Оптимизация IV кв. 2017 Собственно, этот материал как раз и является контраргументом для рассуждений о никчёмности выбранной Intel стратегии постепенного развития потребительских CPU. Мы решили собрать в одном тесте старшие интеловские процессоры для массовых платформ за последние семь лет и посмотреть на практике, насколько представители серий Kaby Lake и Coffee Lake ушли вперёд относительно «эталонных» Sandy Bridge, которые за годы гипотетических сравнений и мысленных противопоставлений в представлении обывателей стали настоящей иконой процессоростроения.
⇡#Что поменялось в процессорах Intel c 2011 года по настоящее время
Отправной точкой в новейшей истории развития процессоров Intel принято считать микроархитектуру Sandy Bridge. И это неспроста. Несмотря на то, что первое поколение процессоров под маркой Core было выпущено в 2008 году на базе микроархитектуры Nehalem, почти все основные черты, которые присущи современным массовым CPU микропроцессорного гиганта, вошли в обиход не тогда, а парой лет позднее, когда распространение получило следующее поколение процессорного дизайна, Sandy Bridge.
Сейчас компания Intel приучила нас к откровенно неторопливому прогрессу в разработке микроархитектуры, когда нововведений стало очень мало и они почти не приводят к росту удельной производительности процессорных ядер. Но всего лишь семь лет назад ситуация была кардинально иной. В частности, переход от Nehalem к Sandy Bridge был ознаменован 15-20-процентным ростом показателя IPC (числа исполняемых за такт инструкций), что обуславливалось глубокой переделкой логической конструкции ядер с прицелом на повышение их эффективности.
В Sandy Bridge были заложены многие принципы, которые с тех пор не менялись и стали стандартными для большинства процессоров сегодняшнего дня. Например, именно там появился отдельный кеш нулевого уровня для декодированных микроопераций, а также стал применяться физический регистровый файл, снижающий энергозатраты при работе алгоритмов внеочередного выполнения инструкций.
Но, пожалуй, самым главным нововведением стало то, что Sandy Bridge был спроектирован как унифицированная система-на-чипе, рассчитанная одновременно на все классы применений: на серверные, десктопные и мобильные. Скорее всего, в прадедушки современных Coffee Lake общественное мнение поставило именно его, а не какой-нибудь Nehalem и уж тем более не Penryn, именно из-за этой особенности. Впрочем, и итоговая сумма всех переделок в глубинах микроархитектуры Sandy Bridge тоже оказалась весьма значительной. В конечном итоге этот дизайн утратил все старые родственные связи с P6 (Pentium Pro), которые то здесь, то там проявлялись во всех предшествующих процессорах Intel.
Говоря об общей структуре, нельзя также не вспомнить и о том, что в процессорный кристалл Sandy Bridge впервые в истории интеловских CPU было встроено полноценное графическое ядро. Этот блок отправился внутрь процессора вслед за контроллером DDR3-памяти, разделяемым L3-кешем и контроллером шины PCI Express. Для соединения вычислительных ядер и всех остальных «внеядерных» частей инженеры Intel внедрили в Sandy Bridge новую на тот момент масштабируемую кольцевую шину, применяемую для организации взаимодействия между структурными единицами в последующих массовых CPU и по сей день.
Если же опуститься на уровень микроархитектуры Sandy Bridge, то одной из ключевых её особенностей стала поддержка семейства SIMD-инструкций, AVX, предназначенных для работы с 256-битными векторами. К настоящему моменту такие инструкции прочно вошли в обиход и не кажутся чем-то необычным, но их реализация в Sandy Bridge потребовала расширения части вычислительных исполнительных устройств. Инженеры Intel стремились сделать работу с 256-битными данными такой же быстрой, как и с векторами меньшей разрядности. Поэтому вместе с реализацией полноценных 256-битных исполнительных устройств потребовалось и увеличение скорости работы процессора с памятью. Логические исполнительные устройства, предназначенные для загрузки и сохранения данных, в Sandy Bridge получили удвоенную производительность, кроме того, симметрично была увеличена пропускная способность кеш-памяти первого уровня при чтении.
Микроархитектура Sandy Bridge
Нельзя не упомянуть и о сделанных в Sandy Bridge кардинальных изменениях в работе блока предсказания ветвлений. Благодаря оптимизациям в применяемых алгоритмах и увеличению размеров буферов, архитектура Sandy Bridge позволила сократить процент неверных предсказаний переходов почти вдвое, что не только заметно сказалось на производительности, но и позволило дополнительно снизить энергопотребление этого дизайна.
В конечном итоге с сегодняшних позиций процессоры Sandy Bridge можно было бы назвать образцово-показательным воплощением фазы «так» в интеловском принципе «тик-так». Как и предшественники, данные процессоры продолжили базироваться на техпроцессе с 32-нм нормами, но предложенный ими рост производительности оказался более чем убедителен. И подпитывала его не только обновлённая микроархитектура, но и увеличенные на 10-15 процентов тактовые частоты, а также внедрение более агрессивной версии технологии Turbo Boost 2.0. Если учесть всё это, хорошо понятно, почему многие энтузиасты до сих пор вспоминают Sandy Bridge самыми тёплыми словами.
Старшим предложением в семействе Core i7 на момент выхода микроархитектуры Sandy Bridge стал Core i7-2600K. Этот процессор получил тактовую частоту на уровне 3,3 ГГц с возможностью авторазгона при неполной нагрузке до 3,8 ГГц. Впрочем, отличали 32-нм представителей Sandy Bridge не только сравнительно высокие для того времени тактовые частоты, но и хороший разгонный потенциал. Среди Core i7-2600K нередко можно было встретить экземпляры, способные работать на частотах 4,8-5,0 ГГц, что во многом обуславливалось применением в них качественного внутреннего термоинтерфейса – бесфлюсового припоя.
Через девять месяцев после выпуска Core i7-2600K, в октябре 2011 года, компания Intel обновила старшее предложение в модельном ряду и предложила немного ускоренную модель Core i7-2700K, номинальная частота которой была доведена до 3,5 ГГц, а максимальная частота в турборежиме – до 3,9 ГГц.
Впрочем, жизненный цикл Core i7-2700K оказался коротким – уже в апреле 2012 года на смену Sandy Bridge пришёл обновлённый дизайн Ivy Bridge. Ничего особенного: Ivy Bridge относился к фазе «тик», то есть представлял собой перевод старой микроархитектуры на новые полупроводниковые рельсы. И в этом отношении прогресс действительно был серьёзным – кристаллы Ivy Bridge производились по 22-нм технологическому процессу, основанному на трёхмерных FinFET-транзисторах, которые в то время только входили в употребление.
При этом старая микроархитектура Sandy Bridge на низком уровне осталась практически нетронута. Были выполнены лишь отдельные косметические переделки, которые ускорили выполнение в Ivy Bridge операций деления и немного повысили эффективность технологии Hyper-Threading. Правда, попутно были несколько улучшены «внеядерные» компоненты. Контроллер PCI Express получил совместимость с третьей версией протокола, а контроллер памяти увеличил свои возможности и стал поддерживать скоростную оверклокерскую DDR3-память. Но в итоге рост удельной производительности при переходе от Sandy Bridge к Ivy Bridge составил не более 3-5 процентов.
Не дал серьёзных причин для радости и новый технологический процесс. К сожалению, внедрение 22-нм норм не позволило как-то принципиально нарастить тактовые частоты Ivy Bridge. Старшая версия Core i7-3770K получила номинальную частоту 3,5 ГГц с возможностью разгона в турборежиме до 3,9 ГГц, то есть с точки зрения частотной формулы она оказалась ничуть не быстрее Core i7-2700K. Улучшилась лишь энергоэффективность, однако пользователей настольных компьютеров этот аспект традиционно волнует слабо.
Всё это, конечно, вполне можно списать на то, что на этапе «тик» никаких прорывов происходить и не должно, но кое в чём Ivy Bridge оказались даже хуже предшественников. Речь – о разгоне. При выводе на рынок носителей этого дизайна Intel приняла решение отказаться от использования при финальной сборке процессоров бесфлюсовой пайки галлиевым припоем теплораспределительной крышки к полупроводниковому кристаллу. Начиная с Ivy Bridge для организации внутреннего термоинтерфейса стала использоваться банальная термопаста, и это сразу же ударило по максимально достижимым частотам. По разгонному потенциалу Ivy Bridge определённо стали хуже, и в результате переход от Sandy Bridge к Ivy Bridge стал одним из самых спорных моментов в новейшей истории потребительских процессоров Intel.
Поэтому на следующий этап эволюции, Haswell, возлагались особенные надежды. В этом поколении, относящемся к фазе «так», должны были появиться серьёзные микроархитектурные улучшения, от которых ожидалась способность как минимум продвинуть вперёд забуксовавший было прогресс. И в какой-то степени это произошло. Появившиеся летом 2013 года процессоры Core четвёртого поколения действительно приобрели заметные улучшения во внутренней структуре.
Основное: теоретическая мощность исполнительных устройств Haswell, выражающаяся в количестве исполняемых за такт микроопераций, по сравнению с прошлыми CPU выросла на треть. В новой микроархитектуре не только был проведён ребаланс имеющихся исполнительных устройств, но и появилось два дополнительных исполнительных порта для целочисленных операций, обслуживания ветвлений и генерации адресов. Кроме того, микроархитектура получила совместимость с расширенным набором векторных 256-битных инструкций AVX2, которые благодаря трёхоперандным FMA-командам увеличили пиковую пропускную способность архитектуры вдвое.
В дополнение к этому инженеры Intel пересмотрели ёмкость внутренних буферов и, где это было необходимо, увеличили их. Выросло в размере окно планировщика. Кроме того, были увеличены целочисленный и вещественночисленный физические регистровые файлы, что улучшило возможности процессора по переупорядочиванию порядка исполнения инструкций. В дополнение ко всему этому, существенно изменилась и подсистема кеш-памяти. L1- и L2-кеши в Haswell получили вдвое более широкую шину.
Казалось бы, перечисленных улучшений должно быть достаточно для того, чтобы заметно поднять удельную производительность новой микроархитектуры. Но как бы не так. Проблема дизайна Haswell состояла в том, что он оставил без изменений входную часть исполнительного конвейера и декодер x86-команд сохранил ту же производительность, что и раньше. То есть максимальный темп декодирования x86-кода в микроинструкции остался на уровне 4-5 команд за такт. И в результате при сопоставлении Haswell и Ivy Bridge на одинаковой частоте и при нагрузке, не использующей новые AVX2-инструкции, выигрыш в производительности оказался всего лишь на уровне 5-10 процентов.
Имидж микроархитектуры Haswell подпортила и первая волна процессоров, выпущенная на её основе. Опираясь на всё тот же 22-нм техпроцесс, что и Ivy Bridge, новинки не смогли предложить высокие частоты. Например, старший Core i7-4770K вновь получил базовую частоту 3,5 ГГц и максимальную частоту в турборежиме на уровне 3,9 ГГц, то есть по сравнению с прошлыми поколениями Core никакого продвижения не наметилось.
В то же время с внедрением следующего технологического процесса с 14-нм нормами у Intel стали возникать разного рода трудности, поэтому через год, летом 2014 года, на рынок было выведено не следующее поколение процессоров Core, а вторая очередь Haswell, которая получила кодовые имена Haswell Refresh, или, если говорить о флагманских модификациях, то Devil’s Canyon. В рамках этого обновления Intel смогла заметно увеличить тактовые частоты 22-нм CPU, что действительно вдохнуло в них новую жизнь. В качестве примера можно привести новый старший процессор Core i7-4790K, который по номинальной частоте взял отметку в 4,0 ГГц и получил максимальную частоту с учётом турборежима на уровне 4,4 ГГц. Удивительно, что подобное полугигагерцевое ускорение было достигнуто без каких-либо реформ техпроцесса, а лишь за счёт простых косметических изменений в схеме питания процессоров и благодаря улучшению теплопроводящих свойств термопасты, используемой под крышкой CPU.
Впрочем, даже представители семейства Devil’s Canyon особенно жалуемыми в среде энтузиастов предложениями стать не смогли. На фоне результатов Sandy Bridge их разгон нельзя было назвать выдающимся, к тому же достижение высоких частот требовало сложного «скальпирования» – демонтажа процессорной крышки с последующей заменой штатного термоинтерфейса каким-либо материалом с лучшей теплопроводностью.
Из-за сложностей, которые преследовали Intel при переводе массового производства на 14-нм нормы, выступление следующего, пятого по счёту поколения процессоров Core, Broadwell, получилось сильно скомканным. Компания долго не могла решить, стоит ли вообще выпускать на рынок десктопные процессоры с этим дизайном, поскольку при попытках изготовления крупных полупроводниковых кристаллов уровень брака превышал приемлемые значения. В конечном итоге предназначенные для настольных компьютеров четырёхъядерники Broadwell всё-таки появились, но, во-первых, произошло это лишь летом 2015 года – с девятимесячным опозданием относительно изначально запланированного срока, а во-вторых, уже через два месяца после их анонса Intel представила дизайн следующего поколения, Skylake.
Тем не менее с точки зрения развития микроархитектуры Broadwell трудно назвать вторичной разработкой. И даже более того, в настольных процессорах этого поколения применялись такие решения, к которым ни до того, ни после того Intel никогда не прибегала. Уникальность десктопных Broadwell определялась тем, что в них проникло производительное интегрированное графическое ядро Iris Pro уровня GT3e. И это значит не только то, что процессоры этого семейства обладали самым мощным на тот момент встроенным видеоядром, но и также то, что они комплектовались дополнительным 22-нм кристаллом Crystall Well, представляющим собой основанную на eDRAM кеш-память четвёртого уровня.
Смысл добавления в процессор отдельного чипа быстрой встроенной памяти вполне очевиден и обусловлен потребностями производительного встроенного графического ядра в фрейм-буфере с низкой латентностью и высокой пропускной способностью. Однако установленная в Broadwell память eDRAM архитектурно была выполнена именно как виктимный кеш, и ей могли пользоваться и вычислительные ядра CPU. В результате десктопные Broadwell стали единственными в своём роде массовыми процессорами с 128 Мбайт L4-кеша. Правда, при этом несколько пострадал объём расположенного в процессорном кристалле L3-кеша, который был сокращён с 8 до 6 Мбайт.
Некоторые улучшения были заложены и в базовой микроархитектуре. Несмотря на то, что Broadwell относился к фазе «тик», переделки коснулись входной части исполнительного конвейера. Было увеличено окно планировщика внеочередного исполнения команд, в полтора раза вырос объём таблицы ассоциативной трансляции адресов второго уровня, а, кроме того, вся схема трансляции приобрела второй обработчик промахов, что позволило обрабатывать по две операции преобразования адресов параллельно. В сумме все нововведения повысили эффективность внеочередного исполнения команд и предсказания сложных ветвлений кода. Попутно были усовершенствованы механизмы выполнения операций умножения, которые в Broadwell стали обрабатываться в существенно более быстром темпе. По итогам всего этого Intel даже смогла утверждать, что улучшения микроархитектуры повысили удельную производительность Broadwell по сравнению с Haswell на величину порядка пяти процентов.
Но несмотря на всё это, ни о каком существенном преимуществе первых десктопных 14-нм процессоров вести речь было невозможно. И кеш четвёртого уровня, и микроархитектурные изменения лишь пытались скомпенсировать главный изъян Broadwell – низкие тактовые частоты. Из-за проблем с технологическим процессом базовая частота старшего представителя семейства, Core i7-5775C, была установлена лишь на уровне 3,3 ГГц, а частота в турборежиме не превышала 3,7 ГГц, что оказалось хуже характеристик Devil’s Canyon на целых 700 МГц.
Подобная же история произошла и с разгоном. Предельные частоты, до которых удавалось раскочегаривать десктопные Broadwell без использования продвинутых методов охлаждения, находились в районе 4,1-4,2 ГГц. Поэтому нет ничего удивительного, что потребители восприняли выпуск Broadwell скептически, и процессоры этого семейства так и остались странным нишевым решением для тех, кто был заинтересован в производительном встроенном графическом ядре. Первым же полноценным 14-нм чипом для настольных компьютеров, который смог привлечь к себе внимание широких слоёв пользователей, стал только следующий проект микропроцессорного гиганта – Skylake.
Производство Skylake, как и процессоров предыдущего поколения, выполнялось по 14-нм техпроцессу. Однако здесь Intel уже смогла добиться нормальных тактовых частот и разгона: старшая десктопная версия Skylake, Core i7-6700K, получила номинальную частоту 4,0 ГГц и авторазгон в рамках турборежима до 4,2 ГГц. Это чуть более низкие значения, если сравнивать с Devil’s Canyon, однако более новые процессоры оказались определённо быстрее предшественников. Дело в том, что Skylake – это «так» в интеловской номенклатуре, что означает существенные изменения в микроархитектуре.
И они действительно есть. Улучшений в дизайне Skylake на первый взгляд было сделано не так много, но все они носили прицельный характер и позволили устранить имевшиеся слабые места в микроархитектуре. Если коротко, то Skylake получили увеличенные внутренние буфера для более глубокого внеочередного исполнения инструкций и более высокую пропускную способность кеш-памяти. Усовершенствования затронули блок предсказания переходов и входную часть исполнительного конвейера. Также был увеличен темп исполнения инструкций деления, и перебалансированы механизмы исполнения операций сложения, умножения и FMA-инструкций. В довершение разработчики потрудились над повышением эффективности технологии Hyper-Threading. В сумме это позволило добиться примерно 10-процентного улучшения производительности на такт в сравнении с процессорами прошлых поколений.
В целом Skylake можно охарактеризовать как достаточно глубокую оптимизацию исходной архитектуры Core, с таким расчётом, чтобы в дизайне процессора не оставалось никаких узких мест. С одной стороны, за счёт увеличения мощности декодера (с 4 до 5 микроопераций за такт) и скорости работы кеша микроопераций (с 4 до 6 микроопераций за такт) существенно увеличился темп декодирования инструкций. А с другой – выросла эффективность обработки получающихся микроопераций, чему поспособствовало углубление алгоритмов внеочередного исполнения и перераспределение возможностей исполнительных портов вместе с серьёзной ревизией темпа исполнения целого ряда обычных, SSE и AVX-команд.
Например, Haswell и Broadwell имели по два порта для исполнения умножений и FMA-операций над вещественными числами, но только один порт предназначался для сложений, что плохо соответствовало реальному программному коду. В Skylake этот дисбаланс был устранён и сложения стали выполняться уже на двух портах. Кроме того, количество портов, способных работать с целочисленными векторными инструкциями, выросло с двух до трёх. В конечном итоге всё это привело к тому, что практически для любого типа операций в Skylake всегда есть несколько альтернативных портов. А это значит, что в микроархитектуре наконец были успешно устранены практически все возможные причины простоя конвейера.
Заметные изменения затронули и подсистему кеширования: пропускная способность кеш-памяти второго и третьего уровня была увеличена. Кроме того, сократилась ассоциативность кеша второго уровня, что в конечном счёте позволило улучшить его КПД и уменьшить штраф при обработке промахов.
Существенные перемены произошли и на более высоком уровне. Так, в Skylake вдвое выросла пропускная способность кольцевой шины, которая соединяет все процессорные блоки. Кроме того, в CPU этого поколения обосновался новый контроллер памяти, который получил совместимость с DDR4 SDRAM. А в дополнение к этому для соединения процессора с чипсетом стала применяться новая шина DMI 3.0 с увеличенной вдвое пропускной способностью, что дало возможность реализовать скоростные линии PCI Express 3.0 в том числе и через чипсет.
Впрочем, как и все предшествующие версии архитектуры Core, Skylake представлял собой ещё одну вариацию на тему изначального дизайна. А это значит, что и в шестом поколении микроархитектуры Core разработчики Intel продолжили придерживаться тактики поэтапного внедрения улучшений на каждом цикле разработки. В целом это – не слишком впечатляющий подход, который не позволяет увидеть какие-то значимые изменения в производительности сразу – при сравнении CPU из соседних поколений. Но зато при модернизации старых систем ощутимый прирост производительности заметить совсем несложно. Например, сама Intel охотно сравнивала Skylake с Ivy Bridge, демонстрируя при этом, что за три года быстродействие процессоров выросло более чем на 30 процентов.
И в действительности это был достаточно серьёзный прогресс, потому что потом всё стало значительно хуже. После Skylake какое бы то ни было улучшение удельной производительности процессорных ядер прекратилось совсем. Те процессоры, которые представлены на рынке в настоящее время, всё ещё продолжают использовать микроархитектурный дизайн Skylake, несмотря на то, что с момента его появления в десктопных процессорах прошло уже почти три года. Неожиданный простой случился из-за того, что Intel не смогла справиться со внедрением следующей версии полупроводникового процесса с 10-нм нормами. В результате весь принцип «тик-так» рассыпался, вынудив микропроцессорного гиганта как-то выкручиваться и заниматься многократным перевыпуском старых продуктов под новыми именами.
Процессоры поколения Kaby Lake, которые появились на рынке в самом начале 2017 года, стали первым и очень ярким примером попыток Intel продать клиентам тот же Skylake во второй раз. Близкие родственные связи между двумя поколениями процессоров особо и не скрывались. Intel честно говорила, что Kaby Lake – это уже не «тик» и не «так», а простая оптимизация предыдущего дизайна. При этом под словом «оптимизация» понимались некие улучшения в структуре 14-нм транзисторов, которые открывали возможность увеличения тактовых частот без изменения рамок теплового пакета. Для видоизменённого техпроцесса был даже придуман специальный термин «14+ нм». Благодаря этой производственной технологии старший массовый десктопный процессор Kaby Lake, получивший наименование Core i7-7700K, смог предложить пользователям номинальную частоту 4,2 ГГц и частоту турборежима 4,5 ГГц.
Таким образом, рост частот Kaby Lake по сравнению с оригинальным Skylake составил примерно 5 процентов, и этим всё и ограничивалось, что, честно говоря, ставило под сомнение правомерность отнесения Kaby Lake к следующему поколению Core. До этого момента каждое последующее поколение процессоров, не важно, относилось оно к фазе «тик» или «так», обеспечивало хоть какой-то прирост показателя IPC. Между тем в Kaby Lake никаких микроархитектурных улучшений не было вообще, поэтому эти процессоры логичнее было бы считать просто вторым степпингом Skylake.
Однако новая версия 14-нм техпроцесса всё же смогла кое в чём положительно проявить себя: разгонный потенциал Kaby Lake по сравнению с Skylake подрос примерно на 200-300 МГц, благодаря чему процессоры данной серии оказались достаточно тепло встречены энтузиастами. Правда, Intel продолжила использовать под процессорной крышкой вместо припоя термопасту, поэтому для полноценного разгона Kaby Lake необходимо было проводить скальпирование.
Не справилась Intel и с вводом в строй 10-нм технологии и к началу текущего года. Поэтому в конце прошлого года на рынок была выведена ещё одна разновидность процессоров, построенных на всё той же микроархитектуре Skylake, – Coffee Lake. Но говорить о Coffee Lake как о третьем обличье Skylake не совсем правильно. Прошлый год стал периодом кардинальной смены парадигмы на процессорном рынке. В «большую игру» вернулась AMD, которая смогла переломить устоявшиеся традиции и создать спрос на массовые процессоры с числом ядер более четырёх. Внезапно Intel оказалась в роли догоняющей, и выход Coffee Lake стал не столько попыткой заполнить паузу до долгожданного появления 10-нм процессоров Core, сколько реакцией на выход шести- и восьмиядерных процессоров AMD Ryzen.
В результате процессоры Coffee Lake получили важное структурное отличие от своих предшественников: число ядер в них было увеличено до шести штук, что с массовой платформой Intel произошло впервые. Однако при этом никаких изменений на уровне микроархитектуры вновь введено не было: Coffee Lake по сути – шестиядерный Skylake, собранный на основе точно таких же по внутреннему устройству вычислительных ядер, которые снабжены увеличенным до 12 Мбайт L3-кешем (по стандартному принципу 2 Мбайт на ядро) и объединены привычной кольцевой шиной.
Впрочем, несмотря на то, что мы так запросто позволяем себе говорить о Coffee Lake «ничего нового», утверждать о полном отсутствии каких-то перемен не совсем справедливо. Хотя в микроархитектуре вновь ничего не поменялось, специалистам Intel пришлось потратить немало усилий для того, чтобы шестиядерные процессоры смогли вписаться в стандартную десктопную платформу. И результат вышел достаточно убедительным: шестиядерные процессоры остались верны привычному тепловому пакету и, более того, совсем не замедлились по тактовым частотам.
В частности, старший представитель поколения Coffee Lake, Core i7-8700K, получил базовую частоту 3,7 ГГц, а в турборежиме он может разгоняться до 4,7 ГГц. При этом оверклокерский потенциал Coffee Lake, несмотря на его более массивный полупроводниковый кристалл, оказался даже лучше, чем у всех предшественников. Core i7-8700K нередко выводятся их рядовыми владельцами на пятигигагерцевый рубеж, причём такой разгон бывает реален даже без скальпирования и замены внутреннего термоинтерфейса. И это значит, что Coffee Lake хоть и экстенсивный, но существенный шаг вперёд.
Всё это стало возможным исключительно благодаря очередному усовершенствованию 14-нм технологического процесса. На четвёртый год его использования для массового производства десктопных чипов Intel удалось добиться действительно впечатляющих результатов. Внедрённая третья версия 14-нм норм («14++ нм» в обозначениях производителя) и перекомпоновка полупроводникового кристалла позволили существенно улучшить производительность в пересчёте на каждый затраченный ватт и поднять суммарную вычислительную мощность. Внедрением шестиядерности Intel, пожалуй, смогла совершить даже более значительный шаг вперёд, чем любым из предшествующих тому улучшений микроархитектуры. И сегодня Coffee Lake смотрится весьма соблазнительным вариантом для модернизации старых систем, основанных на предыдущих носителях микроархитектуры Core.
Кодовое имя Техпроцесс Число ядер GPU L3-кеш, Мбайт Число транзисторов, млрд Площадь кристалла, мм 2 Sandy Bridge 32 нм 4 GT2 8 1,16 216 Ivy Bridge 22 нм 4 GT2 8 1,2 160 Haswell 22 нм 4 GT2 8 1,4 177 Broadwell 14 нм 4 GT3e 6 Н/д ~145 + 77 (eDRAM) Skylake 14 нм 4 GT2 8 Н/д 122 Kaby Lake 14+ нм 4 GT2 8 Н/д 126 Coffee Lake 14++ нм 6 GT2 12 Н/д 150 ⇡#Процессоры и платформы: спецификации
Для проведения сравнения семи последних поколений Core i7 мы взяли старших представителей в соответствующих сериях – по одному от каждого дизайна. Основные характеристики этих процессоров приведены в следующей таблице.
Core i7-2700K Core i7-3770K Core i7-4790K Core i7-5775C Core i7-6700K Core i7-7700K Core i7-8700K Кодовое имя Sandy Bridge Ivy Bridge Haswell (Devil’s Canyon) Broadwell Skylake Kaby Lake Coffee Lake Технология производства, нм 32 22 22 14 14 14+ 14++ Дата выхода 23.10.2011 29.04.2012 2.06.2014 2.06.2015 5.08.2015 3.01.2017 5.10.2017 Ядра/потоки 4/8 4/8 4/8 4/8 4/8 4/8 6/12 Базовая частота, ГГц 3,5 3,5 4,0 3,3 4,0 4,2 3,7 Частота Turbo Boost, ГГц 3,9 3,9 4,4 3,7 4,2 4,5 4,7 L3-кеш, Мбайт 8 8 8 6 (+128 Мбайт eDRAM) 8 8 12 Поддержка памяти DDR3-1333 DDR3-1600 DDR3-1600 DDR3L-1600 DDR4-2133 DDR4-2400 DDR4-2666 Расширения набора инструкций AVX AVX AVX2 AVX2 AVX2 AVX2 AVX2 Интегрированная графика HD 3000 (12 EU) HD 4000 (16 EU) HD 4600 (20 EU) Iris Pro 6200 (48 EU) HD 530 (24 EU) HD 630 (24 EU) UHD 630 (24 EU) Макс. частота графического ядра, ГГц 1,35 1,15 1,25 1,15 1,15 1,15 1,2 Версия PCI Express 2.0 3.0 3.0 3.0 3.0 3.0 3.0 Линии PCI Express 16 16 16 16 16 16 16 TDP, Вт 95 77 88 65 91 91 95 Сокет LGA1155 LGA1155 LGA1150 LGA1150 LGA1151 LGA1151 LGA1151v2 Официальная цена $332 $332 $339 $366 $339 $339 $359 Любопытно, что за прошедшие с момента выпуска Sandy Bridge семь лет Intel так и не смогла заметно нарастить тактовые частоты. Несмотря на то, что дважды менялся технологический производственный процесс и дважды серьезно оптимизировалась микроархитектура, сегодняшние Core i7 почти не продвинулись вперёд по своей рабочей частоте. Новейший Core i7-8700K имеет номинальную частоту 3,7 ГГц, что всего лишь на 6 процентов выше частоты вышедшего в 2011 году Core i7-2700K.
Впрочем, такое сравнение не совсем корректно, ведь Coffee Lake имеет в полтора раза больше вычислительных ядер. Если же ориентироваться на четырёхъядерный Core i7-7700K, то рост частоты выглядит всё-таки убедительнее: этот процессор ускорился относительно 32-нм Core i7-2700K на достаточно весомые 20 процентов в мегагерцевом выражении. Хотя всё равно вряд ли это можно назвать впечатляющим приростом: в абсолютных величинах это конвертируется в прибавку по 100 МГц в год.
Нет никаких прорывов и в других формальных характеристиках. Intel продолжает снабжать все свои процессоры индивидуальной кеш-памятью второго уровня объёмом 256 Кбайт на ядро, а также общим на все ядра L3-кешем, размер которого определяется из расчёта 2 Мбайт на ядро. Иными словами, главный фактор, по которому произошёл самый большой прогресс, – это число вычислительных ядер. Развитие Core начиналось с четырёхъядерных CPU, а пришло к шестиядерным. Причём очевидно, что это ещё не конец и в ближайшей перспективе мы увидим и восьмиядерные варианты Coffee Lake (либо Whiskey Lake).
Впрочем, как нетрудно заметить, за семь лет у Intel почти не менялась и ценовая политика. Даже шестиядерный Coffee Lake по сравнению с предшествующими четырёхъядерными флагманами подорожал всего лишь на шесть процентов. Все же остальные старшие процессоры класса Core i7 для массовой платформы всегда обходились потребителям в сумму порядка $330-340.
Любопытно, что самые крупные перемены произошли даже не с самими процессорами, а с поддержкой ими оперативной памяти. Пропускная способность двухканальной SDRAM с момента выхода Sandy Bridge и до сегодняшнего дня выросла вдвое: с 21,3 до 41,6 Гбайт/с. И это – ещё одно немаловажное обстоятельство, определяющее преимущество современных систем, совместимых со скоростной DDR4-памятью.
Да и вообще, все эти годы вместе с процессорами эволюционировала и вся остальная платформа. Если вести речь о главных вехах в развитии платформы, то, помимо роста скорости совместимой памяти, отметить хочется и появление поддержки графического интерфейса PCI Express 3.0. Кажется, что скоростная память и быстрая графическая шина наряду с прогрессом в частотах и архитектурах процессоров выступают весомыми причинами того, что современные системы стали лучше и быстрее прошлых. Поддержка DDR4 SDRAM появилась в Skylake, а перевод процессорной шины PCI Express на третью версию протокола произошёл ещё в Ivy Bridge.
Кроме того, заметное развитие получили и сопутствующие процессорам наборы системной логики. Действительно, сегодняшние интеловские чипсеты трёхсотой серии могут предложить гораздо более интересные возможности в сравнении с Intel Z68 и Z77, которые использовались в LGA1155-материнских платах под процессоры поколения Sandy Bridge. В этом нетрудно убедиться по следующей таблице, в которой мы свели воедино характеристики флагманских интеловских чиспсетов для массовой платформы.
P67/Z68 Z77 Z87 Z97 Z170 Z270 Z370 Совместимость с CPU Sandy Bridge
Ivy BridgeHaswell Haswell
BroadwellSkylake
Kaby LakeCoffee Lake Интерфейс DMI 2.0 (2 Гбайт/с) DMI 3.0 (3,93 Гбайт/с) Стандарт PCI Express 2.0 3.0 Линии PCI Express 8 20 24 Поддержка PCIe M.2 Нет Есть Есть, до 3 устройств Поддержка PCI Есть Нет SATA 6 Гбит/с 2 6 SATA 3 Гбит/с 4 0 USB 3.1 Gen2 0 USB 3.0 0 4 6 10 USB 2.0 14 10 8 4 В современных наборах логики существенно развились возможности для подключения высокоскоростных носителей информации. Самое главное: благодаря переходу чипсетов на шину PCI Express 3.0 сегодня в производительных сборках можно использовать быстродействующие NVMe-накопители, которые даже по сравнению с SATA SSD могут предложить заметно лучшую отзывчивость и более высокую скорость чтения и записи. И одно только это может стать веским аргументом в пользу модернизации.
Кроме того, современные наборы системной логики предоставляют гораздо более богатые возможности для подключения дополнительных устройств. И речь не только о существенном увеличении числа линий PCI Express, что обеспечивает наличие на платах нескольких дополнительных слотов PCIe, заменяющих обычные PCI. Попутно в сегодняшних чипсетах имеется также и врождённая поддержка портов USB 3.0, а многие современные материнские платы снабжаются и портами USB 3.1 Gen2.
⇡#Описание тестовых систем и методики тестирования
Для того чтобы протестировать семь принципиально разных процессоров Intel Core i7, выпущенных за последние семь лет, нам потребовалось собрать четыре платформы с процессорными разъёмами LGA1155, LGA1150, LGA1151 и LGA1151v2. Набор комплектующих, который оказался необходим для этого, описывается следующим перечнем:
- Процессоры:
- Intel Core i7-8700K (Coffee Lake, 6 ядер + HT, 3,7-4,7 ГГц, 12 Мбайт L3);
- Intel Core i7-7700K (Kaby Lake, 4 ядра + HT, 4,2-4,5 ГГц, 8 Мбайт L3);
- Intel Core i7-6700K (Skylake, 4 ядра, 4,0-4,2 ГГц, 8 Мбайт L3);
- Intel Core i7-5775C (Broadwell, 4 ядра, 3,3-3,7 ГГц, 6 Мбайт L3, 128 Мбайт L4);
- Intel Core i7-4790K (Haswell Refresh, 4 ядра + HT, 4,0-4,4 ГГц, 8 Мбайт L3);
- Intel Core i7-3770K (Ivy Bridge, 4 ядра + HT, 3,5-3,9 ГГц, 8 Мбайт L3);
- Intel Core i7-2700K (Sandy Bridge, 4 ядра + HT, 3,5-3,9 ГГц, 8 Мбайт L3).
- Процессорный кулер: Noctua NH-U14S.
- ASUS ROG Maximus X Hero (LGA1151v2, Intel Z370);
- ASUS ROG Maximus IX Hero (LGA1151, Intel Z270);
- ASUS Z97-Pro (LGA1150, Intel Z97);
- ASUS P8Z77-V Deluxe (LGA1155, Intel Z77).
- 2 × 8 Гбайт DDR3-2133 SDRAM, 9-11-11-31 (G.Skill TridentX F3-2133C9D-16GTX);
- 2 × 8 Гбайт DDR4-3200 SDRAM, 16-16-16-36 (G.Skill Trident Z RGB F4-3200C16D-16GTZR).
- Видеокарта: NVIDIA Titan X (GP102, 12 Гбайт/384-бит GDDR5X, 1417-1531/10000 МГц).
- Дисковая подсистема: Samsung 860 PRO 1TB (MZ-76P1T0BW).
- Блок питания: Corsair RM850i (80 Plus Gold, 850 Вт).
Тестирование выполнялось в операционной системе Microsoft Windows 10 Enterprise (v1709) Build 16299 с использованием следующего комплекта драйверов:
- Intel Chipset Driver 10.1.1.45;
- Intel Management Engine Interface Driver 11.7.0.1017;
- NVIDIA GeForce 391.35 Driver.
Описание использовавшихся для измерения вычислительной производительности инструментов:
Комплексные бенчмарки:
- Futuremark PCMark 10 Professional Edition 1.0.1275 – тестирование в сценариях Essentials (обычная работа среднестатистического пользователя: запуск приложений, сёрфинг в интернете, видеоконференции), Productivity (офисная работа с текстовым редактором и электронными таблицами), Digital Content Creation (создание цифрового контента: редактирование фотографий, нелинейный видеомонтаж, рендеринг и визуализация 3D-моделей). Аппаратное ускорение OpenCL в тестировании было отключено.
- Futuremark 3DMark Professional Edition 2.4.4264 — тестирование в сцене Time Spy Extreme 1.0.
Приложения:
- Adobe Photoshop CC 2018 — тестирование производительности при обработке графических изображений. Измеряется среднее время выполнения тестового скрипта, представляющего собой творчески переработанный Retouch Artists Photoshop Speed Test, который включает типичную обработку четырёх 24-мегапиксельных изображений, сделанных цифровой камерой.
- Adobe Photoshop Lightroom Classic СС 7.1 – тестирование производительности при пакетной обработке серии изображений в RAW-формате. Тестовый сценарий включает постобработку и экспорт в JPEG с разрешением 1920 × 1080 и максимальным качеством двухсот 16-мегапиксельных изображений в RAW-формате, сделанных цифровой камерой Fujifilm X-T1.
- Adobe Premiere Pro CC 2018 — тестирование производительности при нелинейном видеомонтаже. Измеряется время рендеринга в формат H.264 Blu-Ray проекта, содержащего HDV 1080p25 видеоряд с наложением различных эффектов.
- Blender 2.79b – тестирование скорости финального рендеринга в одном из популярных свободных пакетов для создания трёхмерной графики. Измеряется продолжительность построения финальной модели из Blender Cycles Benchmark rev4.
- Corona 1.3 – тестирование скорости рендеринга при помощи одноимённого рендерера. Измеряется скорость построения стандартной сцены BTR, используемой для измерения производительности.
- Google Chrome 65.0.3325.181 (64-bit) – тестирование производительности при работе интернет-приложений, построенных с использованием современных технологий. Применяется специализированный тест WebXPRT 3, реализующий на HTML5 и JavaScript реально использующиеся в интернет-приложениях алгоритмы.
- Microsoft Visual Studio 2017 (15.1) – измерение времени компиляции крупного MSVC-проекта – профессионального пакета для создания трёхмерной графики Blender версии 2.79b.
- Stockfish 9 – тестирование скорости работы популярного шахматного движка. Измеряется скорость перебора вариантов в позиции «1q6/1r2k1p1/4pp1p/1P1b1P2/3Q4/7P/4B1P1/2R3K1 w»;
- V-Ray 3.57.01 – тестирование производительности работы популярной системы рендеринга при помощи стандартного приложения V-Ray Benchmark;
- VeraCrypt 1.22.9 – тестирование криптографической производительности. Используется встроенный в программу бенчмарк, задействующий тройное шифрование Kuznyechik-Serpent-Camellia.
- WinRAR 5.50 — тестирование скорости архивации. Измеряется время, затрачиваемое архиватором на сжатие директории с различными файлами общим объёмом 1,7 Гбайт. Используется максимальная степень компрессии.
- x264 r2851 — тестирование скорости транскодирования видео в формат H.264/AVC. Для оценки производительности используется исходный 1080p@50FPS AVC-видеофайл, имеющий битрейт около 30 Мбит/с.
- x265 2.4+14 8bpp — тестирование скорости транскодирования видео в перспективный формат H.265/HEVC. Для оценки производительности используется тот же видеофайл, что и в тесте скорости транскодирования кодером x264.
Игры:
- Ashes of Singularity. Разрешение 1920 × 1080: DirectX 11, Quality Profile = High, MSAA=2x. Разрешение 3840 × 2160: DirectX 11, Quality Profile = Extreme, MSAA=Off.
- Assassin’s Creed: Origins. Разрешение 1920 × 1080: Graphics Quality = Very High. Разрешение 3840 × 2160: Graphics Quality = Very High.
- Battlefield 1. Разрешение 1920 × 1080: DirectX 11, Graphics Quality = Ultra. Разрешение 3840 × 2160: DirectX 11, Graphics Quality = Ultra.
- Civilization VI. Разрешение 1920 × 1080: DirectX 11, MSAA = 4x, Performance Impact = Ultra, Memory Impact = Ultra. Разрешение 3840 × 2160: DirectX 11, MSAA = 4x, Performance Impact = Ultra, Memory Impact = Ultra.
- Far Cry 5. Разрешение 1920 × 1080: Graphics Quality = Ultra, Anti-Aliasing = TAA, Motion Blur = On. Разрешение 3840 × 2160: Graphics Quality = Ultra, Anti-Aliasing = TAA, Motion Blur = On.
- Grand Theft Auto V. Разрешение 1920 × 1080: DirectX Version = DirectX 11, FXAA = Off, MSAA = x4, NVIDIA TXAA = Off, Population Density = Maximum, Population Variety = Maximum, Distance Scaling = Maximum, Texture Quality = Very High, Shader Quality = Very High, Shadow Quality = Very High, Reflection Quality = Ultra, Reflection MSAA = x4, Water Quality = Very High, Particles Quality = Very High, Grass Quality = Ultra, Soft Shadow = Softest, Post FX = Ultra, In-Game Depth Of Field Effects = On, Anisotropic Filtering = x16, Ambient Occlusion = High, Tessellation = Very High, Long Shadows = On, High Resolution Shadows = On, High Detail Streaming While Flying = On, Extended Distance Scaling = Maximum, Extended Shadows Distance = Maximum. Разрешение 3840 × 2160: DirectX Version = DirectX 11, FXAA = Off, MSAA = Off, NVIDIA TXAA = Off, Population Density = Maximum, Population Variety = Maximum, Distance Scaling = Maximum, Texture Quality = Very High, Shader Quality = Very High, Shadow Quality = Very High, Reflection Quality = Ultra, Reflection MSAA = x4, Water Quality = Very High, Particles Quality = Very High, Grass Quality = Ultra, Soft Shadow = Softest, Post FX = Ultra, In-Game Depth Of Field Effects = On, Anisotropic Filtering = x16, Ambient Occlusion = High, Tessellation = Very High, Long Shadows = On, High Resolution Shadows = On, High Detail Streaming While Flying = On, Extended Distance Scaling = Maximum, Extended Shadows Distance = Maximum.
- The Witcher 3: Wild Hunt. Разрешение 1920 × 1080, Graphics Preset = Ultra, Postprocessing Preset = High. Разрешение 3840 × 2160, Graphics Preset = Ultra, Postprocessing Preset = High.
- Total War: Warhammer II. Разрешение 1920 × 1080: DirectX 12, Quality = Ultra. Разрешение 3840 × 2160: DirectX 12, Quality = Ultra.
- Watch Dogs 2. Разрешение 1920 × 1080: Field of View = 70°, Pixel Density = 1.00, Graphics Quality = Ultra, Extra Details = 100%. Разрешение 3840 × 2160: Field of View = 70°, Pixel Density = 1.00, Graphics Quality = Ultra, Extra Details = 100%.
Во всех игровых тестах в качестве результатов приводится среднее количество кадров в секунду, а также 0,01-квантиль (первая перцентиль) для значений fps. Использование 0,01-квантиля вместо показателей минимального fps обусловлено стремлением очистить результаты от случайных всплесков производительности, которые были спровоцированы не связанными напрямую с работой основных компонентов платформы причинами.
⇡#Производительность в комплексных бенчмарках
Комплексный тест PCMark 8 показывает средневзвешенную производительность систем при работе в типичных общеупотребительных приложениях разного рода. И он хорошо иллюстрирует тот прогресс, который претерпевали интеловские процессоры на каждом этапе смены дизайна. Если говорить о базовом сценарии Essentials, то тут действительно средний прирост скорости на каждом поколении не превышает пресловутых 5 процентов. Однако выделяется на общем фоне Core i7-4790K, который благодаря усовершенствованиям в микроархитектуре и росту тактовых частот смог обеспечить неплохой рывок в производительности, выходящий за среднестатистический уровень. Этот рывок виден и в сценарии Productivity, по результатам которого быстродействие Core i7-4790K сравнимо с производительностью старших процессоров в семействах Skylake, Kaby Lake и Coffee Lake.
Третий же сценарий, Digital Content Creation, объединяющий ресурсоёмкие творческие задачи, выдаёт совсем иную картину. Тут свежий Core i7-8700K может похвастать 80-процентным преимуществом перед Core i7-2700K, что можно расценить как более чем достойный результат семилетней эволюции микроархитектуры. Конечно, существенная часть этого преимущества объясняется увеличением числа вычислительных ядер, но даже если сравнивать между собой показатели четырёхъядерных Core i7-2700K и Core i7-7700K, то и в этом случае прирост скорости достигает солидной величины в 53 процента.
Ещё сильнее выпячивает преимущества новых процессоров синтетический игровой тест 3DMark. Мы пользуемся сценарием Time Spy Extreme, который имеет усиленные оптимизации под многоядерные архитектуры, и в нём итоговый рейтинг Core i7-8700K оказывается почти втрое выше, чем у Core i7-2700K. Но двукратное преимущество перед Sandy Bridge показывает и представитель поколения Kaby Lake, который, как и все предшественники, располагает четырьмя вычислительными ядрами.
Любопытно, что самым успешным усовершенствованием изначальной микроархитектуры, если судить по результатам, следует считать переход от Ivy Bridge к Haswell – на этом этапе, по данным 3D Mark, производительность выросла на 34 процента. Впрочем, Coffee Lake, безусловно, тоже есть чем похвастать, однако интеловские процессоры образца 2017-2018 года имеют точно такую же микроархитектуру, как и Skylake, а выделяются исключительно за счёт экстенсивного усиления – роста числа ядер.
⇡#Производительность в ресурсоёмких приложениях
В целом производительность в приложениях за последние семь лет эволюции процессоров Intel выросла заметно. И речь тут идёт совсем не о пяти процентах в год, о которых принято шутить в рядах интелоненавистников. Сегодняшние Core i7 превосходят своих предшественников из 2011 года более чем в два раза. Конечно, большую роль тут сыграл переход на шестиядерность, однако немалый вклад внесли и микроархитектурные улучшения, и рост тактовой частоты. Самым результативным дизайном в этом плане оказался Haswell. В нём существенно поднялась частота, а также появилась поддержка AVX2-инструкций, которая постепенно укрепились в приложениях для работы с мультимедийным контентом и в задачах рендеринга.
Стоит отметить, что в ряде случаев модернизация процессоров в системах, на которых решаются профессиональные задачи, может дать поистине прорывное улучшение скорости работы. В частности, троекратное увеличение быстродействия при переходе от Sandy Bridge к Coffee Lake можно получить при перекодировании видео современными кодерами, а также при финальном рендеринге посредством V-Ray. Неплохой прирост отмечается и при нелинейном видеомонтаже в Adobe Premiere Pro. Впрочем, даже если ваша сфера деятельности не связана напрямую с решением таких задач, в любом из проверенных нами приложений прирост составил как минимум 50 процентов.
Источник https://www.ixbt.com/platform/intel-core-i7-lga1155-lga1200-mass-test.html
Источник https://fcenter.ru/online/hardarticles/processors/38708-Pyat_pokolenij_Core_i7_ot_Sandy_Bridge_do_Skylake_Sravnitel_noe_testirovanie
Источник https://3dnews.ru/969891/ot-sandy-bridge-do-coffee-lake-sravnivaem-sem-pokoleniy-intel-core-i7