Intel Columbiaville: 800-я серия сетевых карт с поддержкой 100G, ADQ и DDP

Компания Intel решила сократить своё технологическое отставание в сетевом сегменте перед основным конкурентом, израильской Mellanox, представив 100-гигабитные сетевые адаптеры 800-й серии с кодовым названием Columbiaville.

В предыдущем, 700-м поколении сетевых чипов, Intel делала ставку на простоту и доступность, поэтому 40-гигабитные процессоры семейства Fortville не имели большинства механизмов аппаратной разгрузки и позиционировались как решения начального уровня. В новой серии Intel поняла, что к сетевым контроллерам в современном мире требований предъявляется больше, чем раньше, поэтому 800-я серия прежде всего, обрадует тех, кто ждал поддержку RDMA (iWARP & RoCE V2). Эта функция, значительно ускоряющая скорость обмена между СХД и клиентом, была одним из основных козырей компании Mellanox начиная с 3-го поколения их плат ConnectX (к слову, сейчас израильтяне продают уже 6-е поколение ConnectX).

С учётом того, что в современных ЦОД-ах всё больше трафика генерируется приложениями, обменивающимися данными друг с другом до выхода во front-end, Intel посчитала, что на сетевой контроллер можно возложить и механизмы приоритезации и контроля очередности при трансляции данных, например, к кеширующим серверам в NoSQL базах. То есть, на уровне драйвера сетевая карта понимает, с каким приложением она общается и как выстраивать приоритеты на установку новых соединений и обслуживание существующих. Эти две технологии получили название Application Device Queues (ADQ) и Dynamic Device Personalization.

Application Device Queues (ADQ)

Поддержка ADQ появилась в Linux начиная с ядра 4.19, и вы можете использовать её с существующей инфраструктурой без каких-либо изменений в коде.

Что такое ADQ?

  • Выстраивание и разруливание очередей трафика в зависимости от приложения

Как работает ADQ?

  • Фильтрует трафик приложения в соответствии с набором запросов
  • Исполняемые ветви в приложении взаимодействуют с очередью запросов внутри механизма ADQ
  • Сетевая карта может ограничивать исходящий трафик в зависимости от приложения

Что означают эти громкие слова на практике? Фактически, у нас обычный QoS-механизм, регулирующийся не в зависимости от MAC-адреса или сетевого порта, а в зависимости от используемого приложения. Что это даёт?

Предсказуемость приложения, с которым происходит обмен данными, снижение задержек при работе с приложениями и увеличение пропускной способности сервера приложения. 

Конечно, первое, что приходит на ум - это вопрос, о каком таком приложении идёт речь, которое чувствительно к работе 100-гигабитной сети? Intel в рекламных проспектах приводит в пример NoSQL базу Redis, использующую ОЗУ для хранения данных. Redis используется там, где требуются быстрые выборки значения, соответствующего заданному ключу, будь то строка, текстовое поле или даже файл. При хранении миллионов файлов, например, найти нужный в Redis быстрее, чем в любой файловой системе. Поскольку Redis является однопоточным приложением, в типичной инсталляции могут быть использованы десятки инстанций Redis-а, каждая из которых даёт около миллиона транзакций в секунду.

С ростом числа соединений, механизм ADQ позволяет снизить задержки на стороне клиента в два-три раза, и примерно в два раза поднять число транзакций в секунду.

Dynamic Device Personalization (DDP)

Вы хотели аппаратную разгрузку пакетов, которой вам так не хватало в 700-й и 500-й версиях чипов? Вот вам полностью программируемый режим Offload-а: сетевая карта анализирует сетевые пакеты и обрабатывает не только внешний заголовок пакета, но и внутренний. Самый простой пример - iSCSI, здесь сетевая карта разгружает не только заголовки TCP пакетов, но и iSCSI протокола, и так - с любой нагрузкой. То есть, если у вас в системе появляется какой-то новый сетевой протокол, вы можете доверить его разгрузку сетевой карте. Без аппаратного Offload-а, достичь 100-гигабитной скорости на современных процессорах нельзя.

Профайлы DDP могут конфигурироваться при загрузке операционной системы, определяться прошивкой к чипу или даже меняться во время работы сервера.

Вообще, аппаратный Offload - это один из основных критериев выбора сетевых карт со стороны сервисных провайдеров. Такие компании как Amazon AWS и Microsoft Azure, возлагают большую нагрузку на сетевые контроллеры, экономя таким образом ресурсы центральных процессоров.

Заключение

Мир движется в сторону 5G, и эти сети станут одним из основных драйверов растущего спроса на быстрые 100-гигабитные сетевые адаптеры. Продукция Intel это прежде всего, низкая стоимость по сравнению с теми же сетевыми чипами Mellanox, имеющими куда более широкий список поддерживаемых функций. Конечно, DDP можно рассматривать как универсальный оффлоад любого протокола, но как он покажет себя в реальных условиях, можно будет увидеть только по тестам. Жаль, что 800-я серия сетевых чипов Intel не поддерживает технологии PCI Express over Fabric и GPU over Fabric, которые наиболее востребованы в системах с искусственным интеллектом, но видимо полноценной конкуренции Mellanox-у Intel пока что создавать не спешит.

Михаил Дегтярёв (aka LIKE OFF)
08/04.2019


Похожие статьи:

Неттоп Intel NUC на базе Core i7 Frost Canyon, как платформа для современного офиса

Умение компании Intel вместить в компактный 15-сантиметровый корпус мощные 6-ядерные процессоры Core i7 создало этим малюткам поистине великолепную славу. Их используют не только для обычных офисных задач, но и для работы в каче...

Обзор сетевых карт Zyxel XGN100C и XGN100F: или AQuantia AQC100/AQC107 против Intel' 2021

С развитием Wi-Fi 6 сетевая инфраструктура плавно осваивает мультигигабитные подключения на скоростях 2.5G и 5G. Среди сетевых контроллеров, поддерживающих промежуточные скорости, безоговорочным лидером считаются контроллеры AQu...

Обзор 4-процессорного сервера Lenovo SR860 V2 на базе Intel Xeon Cooper Lake

Очень интересный сервер ценой под 1M$, созданный для SAP HANA и приложений с большим потреблением ОЗУ. Здесь процессоры расположены один над другим, имеется 3 Тб памяти, 4 блока питания, мониторинг с предиктивным анализом поломо...

На чём работает Cloudflare: intel not inside!

Самые тяжелые нагрузки в сети CloudFlare - это Firewall и бессерверные сервисы, из-за чего CPU - это самая затратная статья в бюджете сервера Cloudflare. Подход компании к проектированию серверов сильно отличается от традиционных сетей доставки...


Copyrights © 1998-2026