Переход на 400GE: революция, а не эволюция.
Решение трех основных проблем модернизации трансиверов

№ 1’2019
PDF версия

Проблема 1. Увеличение пропускной способности канала

Основным звеном любой сети является трансивер, ключевой параметр которого — пропускная способность канала. Обычно операторы ЦОДа модернизируют свои сети каждые два года. Однако уже сейчас многие ЦОДы действуют с максимальной пропускной способностью, и потому их операторам нужно найти эффективный способ ее увеличения, чтобы достичь 400-гигабитных скоростей. Также важно уменьшить мощность, затрачиваемую на передачу каждого бита. Поэтому производители должны обеспечить операторов ЦОДов трансиверами, способными функционировать в этом новом классе скоростей.

Для того чтобы достичь 400-гигабитных скоростей, оптические трансиверы должны использовать более совершенные способы модуляции и кодирования сигнала. Но для производителей трансиверов новые технологии создают и новые проблемы тестирования.

Согласно теореме Шеннона — Хартли, пропускная способность канала — это максимальное количество безошибочных цифровых данных, которое может быть передано по каналу с заданной полосой пропускания в присутствии шума. Для увеличения пропускной способности канала нужно или расширить его полосу пропускания, или увеличить количество уровней сигнала. 400GE можно реализовать с помощью модуляции без возврата к нулю (NRZ) и четырехуровневой амплитудно-импульсной модуляции (PAM4).

Модуляция NRZ наиболее широко распространена в современных сетях 100GE. Это двухуровневый код (часто называемый двухуровневой амплитудно-импульсной модуляцией, или PAM2), где положительное напряжение представляет собой логическую единицу, а такое же, но отрицательное — логический нуль. Для того чтобы реализовать 100GE, требуются четыре линии передачи NRZ по 25 Гбитс/с каждая.

 Сравнение сигналов NRZ и RAM4

Рис. 1. Сравнение сигналов NRZ и RAM4

Технология NRZ развивается уже 50 лет. За это время скорости передачи увеличились со 110 бит/с до 100 Гбит/с, были внедрены новые концепции и решены многие проблемы. Например, если использовать восемь линий по 56 Гбит/с с модуляцией NRZ, то переход к 400GE становится просто следующим логическим шагом. Однако на скоростях свыше 28 Гбит/с сдерживающим фактором для NRZ становятся потери в канале.

Сигналы PAM4 имеют четыре уровня амплитуды, соответствующие комбинациям битов 00, 01, 10 и 11, составляющим передаваемый символ. Количество символов, передаваемых в секунду (скорость в бодах), вдвое меньше передаваемого в секунду количества битов. Например, для PAM4 скорость 28 Гбод означает передачу данных со скоростью 56 Гбит/с. Таким образом, пропускная способность удваивается по сравнению с 28-гигабодной линией NRZ, скорость передачи данных по которой составляет 28 Гбит/с, поскольку для NRZ один бит представляет один символ.

 

Решение: более совершенные виды модуляции и кодирования

Для реализации 400GE оптическим трансиверам следующего поколения понадобятся более совершенные виды модуляции и кодирования. Чтобы перейти к 400-гигабитным скоростям в ЦОДе, рекомендуется использовать PAM4. Однако сигналы PAM4 еще более восприимчивы к помехам, поскольку в них предусмотрено не два, а четыре уровня амплитуды. Это приводит к меньшему отношению сигнал/шум (С/Ш), что заставляет уделять особое внимание измерению собственных шумов трансивера. Для повышения помехоустойчивости в PAM4 применяется прямая коррекция ошибок (FEC) (рис. 2).

Исследование сигнала с FEC и без FEC

Рис. 2. Исследование сигнала с FEC и без FEC

Технология кодирования FEC подразумевает передачу вместе с полезными данными избыточной служебной информации, позволяющей исправлять ошибки. С ее помощью декодер может исправлять поврежденные данные, не запрашивая их повторную передачу. На приемном и передающем концах линии должны быть соответствующие схемы кодирования/декодирования. FEC поддерживает множество алгоритмов кодирования. Наиболее часто в сетях ЦОД используются различные варианты кодирования Рида — Соломона, разработанного в 1960-х гг. Ирвингом Ридом и Густавом Соломоном изначально для космических линий передачи данных. Применение FEC вызывает новые проблемы тестирования сигналов PAM4 на физическом уровне. Но FEC позволяет устранить практически все сбои передачи в сетях 400GE, поскольку при превышении определенного уровня ошибок обнаруженные сбои при приеме сразу же исправляются с помощью FEC. Далее рассмотрим три главные проблемы исследования сигналов с кодированием FEC.

Эффективность кодирования

В процессе кодирования полезные данные преобразуются в декодируемый формат и дополняются служебной информацией для исправления ошибок. В результате кодирования данных появляются кодовые слова. После декодирования на приемном конце из них получают исходные данные. Эффективность кодирования представляет собой число, характеризующее способность кода исправлять ошибки. Чем оно выше, тем больше ошибок может быть исправлено. Но здесь приходится идти на компромиссы.

Кодирование Рида — Соломона отличается большой эффективностью за счет того, что в его кодовых словах передается больше служебной информации, облегчающей декодирование на приемном конце. Но повышение эффективности кодирования требует больше вычислительных ресурсов для кодирования и декодирования, а также увеличивает время обработки и задержки данных. FEC с более эффективным кодированием необходима для высокоскоростных линий, в которых используется модуляция PAM4, поскольку она отличается большей собственной частотой появления ошибок, чем NRZ.

Пакетные ошибки

При работе FEC предполагается, что распределение ошибок в канале происходит случайным образом. Большое число ошибок за короткий промежуток времени, превышающие количество ошибок, которые можно исправить внутри фрейма, приведет к потерям фреймов, даже если средняя частота появления ошибок в канале меньше, чем его собственный коэффициент битовых ошибок (BER). Обратите внимание на то, что в этом контексте «пакет» не обязательно состоит из последовательно расположенных битов.

Сбойные биты могут быть перемешаны с правильными битами данных, вследствие чего фрейм будет потерян, если их окажется больше максимального числа битов, исправляемых с помощью FEC. Появление пакетных ошибок неизбежно и непредсказуемо. Они могут возникать как на приемном конце, так и на любом другом участке канала. Для минимизации их воздействия можно использовать чередование данных.

Чередование данных

Перемежение данных часто применяется для снижения потерь фреймов в каналах, состоящих из нескольких линий со скоростью передачи меньше общей скорости передачи канала. Перемежение заключается в циклическом распределении потока данных по доступным линиям в канале. При этом пакетные ошибки, возникающие при прохождении данных по каналу, рассеиваются во времени, то есть их длина делится на число линий. В результате в каждое кодовое слово попадет количество ошибок, не превышающее корректирующей способности кода. Возьмем, к примеру, канал 100GE, имеющий четыре линии 25,78 Гбит/с для передачи данных NRZ. При использовании чередования 100-битный пакет с ошибками, возникший, например, в оптическом модуле одной линии, приведет к появлению только 25 ошибок в каждой линии. Чередование не увеличивает эффективность кодирования, рассчитанную на случайное распределение сбоев, но значительно увеличивает ее при коррекции пакетных ошибок.

 

Проблема 2. Обеспечение качества и совместимости

Операторы ЦОДов хотят сделать переход на 400GE как можно менее затратным за счет обеспечения совместимости оборудования различных поставщиков. Концепция использования сменных модулей требует, чтобы перед включением в состав сети трансиверы были тщательно протестированы на соответствие спецификациям для поддержания полной совместимости с другим оборудованием. Поэтому производители оптических трансиверов обязаны подвергать их строгим испытаниям на соответствие нормативам и совместимость с другими сетевыми компонентами от разных поставщиков. Отказы сети из-за неисправности трансиверов недопустимы для операторов ЦОДов, связанных с пользователями соглашениями
о гарантированном уровне обслуживания.

В общем случае система оптической связи состоит из передатчика, оптоволоконного канала и приемника. Электрические высокоскоростные линии передачи данных соединяются с оптическими модулями через коммутаторы и другие сетевые устройства. Передатчик одного трансивера отправляет данные по оптоволокну на приемник трансивера в другой части сети.

Рассмотрим три ключевые проблемы операторов ЦОДов.

Цена

Интерфейсы 400GE должны обладать ценовым преимуществом над 100GE. Достичь 400-гигабитных скоростей операторы ЦОДов могут разными путями. Например, они могут увеличить число серверов при существующей плотности хранения данных и с помощью аналогичных трансиверов 100GE. Множество ЦОДов расположено в удаленных местах, где достаточно недорогой и незанятой земли. Поэтому для увеличения пропускной способности и емкости хранилищ данных вполне допустимым вариантом является расширение площадей, занимаемых ЦОДом.

На рис. 3 показан ЦОД Google в Нидерландах, вокруг которого достаточно места для расширения. Но расширение здания ЦОДа связано с другими затратами, включая время на развертывание и долгосрочную амортизацию капитала, что делает этот вариант модернизации не столь привлекательным. В результате операторы ЦОДа надеются на производителей трансиверов, которые смогут предоставить им экономичные решения, обеспечивающие скорость 400 Гбит/с.

Вид с высоты птичьего полета на ЦОД Google неподалеку от г. Делфзейл, провинция Гронинген, Нидерланды

Рис. 3. Вид с высоты птичьего полета на ЦОД Google неподалеку от г. Делфзейл, провинция Гронинген, Нидерланды

Занимаемая площадь

В прошлом добиться повышения пропускной способности можно было только за счет расширения площадей ЦОДов, поскольку еще не существовало сетевых технологий, обеспечивающих скорость передачи свыше 100 Гбит/с. Сегодня появилась более привлекательная альтернатива — 400GE. В настоящее время многие ЦОДы достигли максимальной пропускной способности и не имеют пространства для расширения.

Вот почему производители трансиверов должны стремиться удовлетворить растущую потребность в более производительных интерфейсах. Ими являются трансиверы 400GE, обеспечивающие четырехкратный выигрыш в скорости по сравнению с 100GE при практически такой же занимаемой площади. Для увеличения полосы канала будут использоваться более совершенные виды кодирования и модуляции, например PAM4.

Но достижение трансиверами 400-гигабитных скоростей без увеличения занимаемой площади требует более сложной схемотехники, что значительно увеличивает продолжительность и сложность тестирования.

Мощность

Согласно недавним расчетам исследователя Андреа Андерс из компании Huawei Technologies, к 2025 году общее энергопотребление информационно-коммуникационной отрасли может достичь 5860 ТВт·ч в год! Из них на долю ЦОДов будет приходиться более 30%. Иными словами, при нынешних темпах роста к 2025 году центры обработки данных будут потреблять 8% вырабатываемой в мире электроэнергии. И поскольку для операторов ЦОДов крайне важно снизить энергопотребление, производители трансиверов обязаны обеспечить максимальную энергоэффективность своей продукции.

 

Решение: измерения характеристик и испытания на соответствие стандартам

Несколько организаций по стандартизации, таких как Институт инженеров электротехники и электроники (IEEE), Международный комитет по стандартам в области информационных технологий (INCITS) и Форум по взаимодействию оптических сетей (OIF), определяют спецификации оптических трансиверов и устанавливают процедуры испытаний для обеспечения их соответствия стандартам и функциональной совместимости с продукцией разных поставщиков. Но при работе над своими стандартами эти организации не рассматривают влияние корпусов и разъемов. Стандарты Multi-source agreements (MSA) устанавливаются производителями оборудования. Они определяют форм-факторы и электрические характеристики коммуникационных интерфейсов. Стандарты MSA гарантируют корректную работу, совместимость и взаимозаменяемость компонентов от различных поставщиков.

Для передатчиков и приемников необходимы разнообразные наборы оптических и электрических тестов, включая тесты с ухудшением качества канала. По мере того как системы становятся более быстродействующими и сложными, приемники необходимо тестировать с помощью сигналов с различными типами искажений. Обычно их называют неидеальными сигналами. Поскольку от поколения к поколению уровни характеристик значительно меняются, то стандарты часто эволюционируют вместе с оборудованием.

Испытания передатчика и приемника

Разработка, проверка и испытания устройств значительно усложняются по мере увеличения скоростей передачи. Ошибки возникают при прохождении сигнала через передатчик, канал и приемник. От оптических и электрических линий не ожидают «чистой» безошибочной работы. Из-за небольшого отношения сигнал/шум в линиях PAM4 могут появляться ошибки, вызванные шумом, в силу чего необходимо использовать прямую коррекцию ошибок (FEC). Организации по стандартизации активно обсуждают применение FEC при тестировании оборудования 400GE. В дополнение к восприимчивости к шумам, еще одной не менее важной проблемой являются помехи, вносимые пробником или тестовой оснасткой. Тестовые оснастки и измерительные кабели традиционно не рассматривались как существенные источники помех. Однако на больших скоростях передачи сигнал деградирует даже в высококачественных кабелях, а шумы и помехи становятся очень важными факторами. А потому при тестировании помехи могут быть вызваны просто подключением измерительных приборов. В этом случае крайне важно исключить из сигнала помехи, вносимые испытательным оборудованием. В процессе устранения воздействия помех шумовые характеристики тестовых оснасток математически удаляются из общих результатов измерений. Применение испытательного оборудования со встроенной функцией устранения вносимых помех значительно упрощает измерение характеристик трансиверов.

 

Проблема 3. Ускорение и удешевление испытаний

Резкое возрастание трафика требует значительного увеличения пропускной способности ЦОДов. Для перехода со 100GE на 400GE операторам ЦОДов нужны экономически эффективные оптические трансиверы следующего поколения. Внутри гигантских ЦОДов может находиться свыше 50 000 оптоволоконных линий. Таким образом, количество трансиверов, установленных на обоих концах линий, превысит 100 000. Поэтому для операторов ЦОДов крайне важно, чтобы их цена была не очень высокой. Для поддержания конкурентоспособности изготовители трансиверов должны найти способ снизить производственные затраты.

Как это бывает со многими новинками, цены на новые оптические трансиверы резко снизятся после их массового появления на рынке. Со временем расходы на разработку окупаются по мере нарастания объема выпуска. Цены на трансиверы следующего поколения, такие как 400GE, скорее всего, стабилизируются через год после их выхода на рынок. Причем цена трансивера будет прямо пропорциональна сложности его конструкции и числу оптических компонентов.

 

Решение: более эффективные испытания трансиверов

Рынок трансиверов для ЦОДов является конкурентным и поэтому очень чувствительным к цене. Значительное влияние на общую цену трансивера оказывает продолжительность испытаний. Вот почему более эффективное тестирование трансиверов в широком диапазоне скоростей передачи ускоряет внедрение инноваций и снижает затраты. Для этого на каждом этапе разработки и производства следует использовать измерительные решения, максимально повышающие эффективность тестирования. Такие инструменты сокращают время проектирования, значительно увеличивают производительность, обеспечивают качество и существенно снижают расходы. Процесс начинается на этапе исследований и разработок с проектирования компонентов трансивера, продолжается как проверочные испытания спроектированных трансиверов и завершается производственным тестированием. Далее рассмотрим три этапа жизненного цикла продукта, требующие максимально эффективного тестирования.

Проектирование и моделирование

Этап исследований и разработок начинается с моделирования будущего продукта с помощью мощного ПО, что позволяет повысить эффективность предстоящего тестирования и снизить его стоимость. Современные программные средства автоматизированного проектирования и моделирования помогают разработчикам трансиверов оптимизировать свои проекты, достичь требуемых характеристик изделия, повысить надежность и избежать дорогостоящей повторной переработки.

Они могут выявить наиболее чувствительные компоненты на ранней стадии проекта и решить, с помощью каких мер можно увеличить выход готовой продукции. После такой оптимизации разработчики могут оценить эффективность проектирования путем последующей обработки данных, не прибегая к повторному моделированию.

Проверочные испытания

Когда проект нового трансивера 400GE воплощается из модели в опытный образец, перед конструкторами встает задача разработки тщательного и эффективного плана тестирования. По сравнению с предыдущими поколениями рабочие допуски в оптических линиях 400GE являются наиболее строгими. Испытания оборудования 400GE сопряжены с дополнительными трудностями, поскольку даже малая погрешность измерений способна быстро перекрыть рабочий допуск. К счастью, методы измерений характеристик спроектированных устройств 400GE становятся более устоявшимися, поэтому при разработке планов тестирования трансиверов инженеры могут руководствоваться указаниями соответствующих стандартов.

А программное обеспечение автоматизированного тестирования способствует сокращению продолжительности испытаний с нескольких часов до считанных минут. Таким образом, для испытаний на соответствие требуется выбирать ПО автоматизированного тестирования, позволяющее точно измерять характеристики согласно требованиям каждого технического стандарта. Это ПО управляет настройкой, калибровкой и выполнением измерений, позволяя вам быстро реализовывать сценарии тестирования, не будучи экспертом в методиках испытаний, экономя часы работы. Используя приложения для тестирования на соответствие стандарту, производители трансиверов могут быть уверены в том, что тесты, выполненные в их лабораториях, будут воспроизведены в лабораториях их заказчиков. Еще важнее то, что соответствие трансиверов стандартам минимизирует риск несовместимости с сетевыми коммутаторами и маршрутизаторами, миллионы которых установлены в ЦОДах по всему миру.

Производственные испытания

Исследования и разработки трансиверов 400GE уже ведутся. Инженеры по-прежнему решают вопросы испытаний модулей PAM4, а стандарты 400GE продолжают развиваться. Но когда трансиверы 400GE достигнут этапа серийного производства, любые обнаруженные проблемы станут вызывать дорогостоящие переделки. В идеальном случае проект должен полностью отвечать производственным требованиям. Для достижения этого идеала производители могут воспользоваться несколькими инструментами. Например, общая программная платформа со встроенными возможностями анализа данных, начиная с проектирования и заканчивая производством и вводом в эксплуатацию, позволяет ускорить процесс разработки и минимизировать ошибки при изготовлении. Чем позже обнаруживаются скрытые проблемы, тем больше расходы на их устранение. Поэтому в идеале их лучше выявлять на этапе проектирования.

 

Заключение

Сегодня 100GE широко используется в ЦОДах по всему миру, но внедрение 400GE станет шагом для перехода к ЦОДу с поддержкой сетей 5G. Операторы центров обработки данных могут обеспечить плавный переход от 100GE к 400GE путем внедрения трансиверов следующего поколения, что увеличит пропускную способность каналов, гарантирует качество и совместимость, а также уменьшит время и стоимость тестирования. Решение этих проблем позволит воплотить в реальность планы перехода на 400GE.

Располагая подобной перспективой, операторы ЦОДов ищут новые способы проектирования и эксплуатации сетей, способных выдержать трафик, генерируемый миллиардами устройств. Многие из них переходят на виртуализованные сети, используя программно-определяемую сеть (SDN) и виртуализацию сетевых функций (NFV). SDN — это сетевая архитектура, обеспечивающая программируемое управление виртуализированной сетевой инфраструктурой. Виртуализация сетевых функций — это концепция автоматизации, объединяющая целые классы функций сетевых узлов в блоки, из которых можно создавать коммуникационные сервисы. После перехода к виртуальной сети операторам ЦОДов нужно убедиться в том, что потоки данных протекают так, как ожидалось. Поэтому очередной проблемой, требующей решения, станет тестирование со 2-го по 7-й уровень, включая валидацию SDN/NFV и оценку нагрузки в виде трафика. Подготовьтесь к встрече с 400GE!Key

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *