Сегодня мы используем для связи мобильные терминалы с исключительно мощными вычислительными способностями. Сеть мобильной связи существенно эволюционировала от предоставления базовых услуг передачи речи и SMS до разнообразия услуг передачи данных, обогащая впечатления конечных пользователей за счет интегрированных услуг, включающих текст, графику, видео и т.д.
Архитектура мобильных сетей изменилась с ориентированной на голос на ориентированную на данные, кроме того изменились принципы планирования и строительства сети. Быстрое развертывание сетей LTE позволило операторам начать предоставлять услуги мобильных видеосервисов HD-качества.
На этом фоне мы считаем, что в течение следующих нескольких лет:
1. Услуги видео станут базовыми услугами мобильной сети.
Мобильное видео станет ключевой услугой для роста доходов. Большая часть нового мобильного трафика будет приходиться именно на видео.
Видео стимулирует переход к таким высокоскоростным технологиям как LTE, LTE-A, LTE-A Pro.
2. HD-видео станет повсеместным в мобильной сети: от 720p к 2k,4k и далее.
Сеть мобильного широкополосного доступа сможет обеспечить повсеместность услуг потокового видео с разрешением 720p и гарантией высокого качества. Покрытие для услуг видео приблизится или даже сравнится с покрытием для голосовых услуг.
3. MOS для мобильного видео станет основным критерием оценки качества видео.
Следовательно, нам нужно определить множество индикаторов, которые смогут реально отражать впечатления абонентов от видеоуслуг. Это создаст новые возможности в представлении качества услуг и планировании сети.
Разберем эти тренды подробнее.
1. Видео становится базовой услугой мобильной сети
Связь с помощью изображений — это самый эффективный и информативный способ передачи информации. От наскальной живописи, настенной росписи в Египте, к анимированным изображениям и видео — передача информации с помощью изображений является самым исключительным по пониманию средством связи. В то же время мобильный широкополосный доступ делает возможным передачу видео везде.
Видео стало новой базовой услугой мобильных сетей после голоса. Анализ глобального мобильного трафика показал, что большая часть вновь добавляемого мобильного трафика создается услугами видео. Видео, в частности, видео высокого разрешения, стимулирует радикальный рост потребления мобильного трафика.
Рисунок 1. Глобальное распределение трафика по услугам в типичных сетях
Рисунок 2. Тенденция изменения долей трафика услуг в одной из корейских мобильных сетей
Рисунок 3. Распределение трафика по услугам в мобильной сети EE 4G
Тем не менее, вместе с быстрым ростом мобильного трафика данных, тарифы на данные существенно снизились.
Рисунок 4. Снижение среднегодового темпа роста доходов операторов за единицу трафика
Для достижения роста доходов, темпы роста потребления данных должны быть выше, чем темпы снижения тарифов на данные. Например, операторы должны поддерживать рост трафика на 57% чтобы добиться 10% роста доходов.
Услуги видео будут играть жизненно-важную роль в обеспечении роста доходов за счёт стимуляции потребления данных. Следовательно, услуги видео становятся базовыми услугами мобильной сети.
2. HD-видео станет повсеместным в мобильной сети: от 720p к 2k,4k и далее
Телевидение высокой четкости — это новый тип телевизионных услуг. МСЭ определяет его как: "Телевидение высокой четкости должно быть прозрачной системой, зритель с нормальным зрением должен получать такое же впечатление, как и при просмотре исходных декораций и представления, через систему HD TV с расстояния, превышающего трехкратную высоту экрана". 720p — это один из стандартов HD-телевидения.
В настоящее время, все программы HD TV передаются с 720p. Разрешение 720p — это 1280х720, что приближается к миллиону пикселей. 720p удовлетворяет базовые потребности пользователей в качестве видео.
С развитием технологий и уменьшением размера экранов для HD, почти все смартфоны выпускаются с поддержкой как минимум разрешения 720p. Экран 720p стал основной конфигурацией смартфона. А ведущие модели смартфонов обладают разрешением экрана 1080p. Таким образом, аппаратные возможности дисплеев мобильных устройств уже поддерживают популярный формат видео 720p.
Кодирование потока видео 720p отличается для разных технологий, но проходит примерно с одинаковой скоростью около 1,5 Мбит/с. С учетом времени первичного ожидания услуги VOD, хэндовера сигнала, факторов быстрых замираний, можно получить хорошие впечатления от видео 720p при скорости сети 3~5 Мбит/с. С развитием технологий HSPA и LTE, мобильные сети способны предоставить скорость 3 Мбит/с и выше в любое время и в любом месте. Проще говоря, на раннем этапе HD TV обычным будет потребление видео 720p в мобильных сетях. Будущие мобильные сети должны быть способны предоставить повсеместные услуги HDTV, чтобы сделать HD-видео основной услугой.
Рисунок 5. Экосистема видео 720p
В верхнем сегменте рынка разрешение 2K стало типичным для лучших моделей. А также стало предметом пристального внимания лидеров отраслевой цепи. Разрешение 2K обозначает разрешение экрана более чем 2000 горизонтальных пикселей. 2K также стало основным форматом разрешения цифровых кинопроекторов. Разрешение 2K включает несколько категорий, самое обычное 2K в кинотеатрах — 2048 × 1080. Разрешение iPhone6 Plus — 1920х1080, очень близко к разрешению 2K. А сейчас разрешение 2K в телефонных стандартах обозначает разрешение в четыре раза выше 720p, достигающее разрешения 2560х1440. Существуют 42 модели смартфонов, которые могут поддерживать 2K, а в следующем году ожидается, что более 10% проданных мобильных телефонов будут поддерживать 2K. Это приведет к жесткой конкуренции на рынке высококачественного видео.
Скорость кодирования потока видео 2K — около 6 Мбит/с. В современной мобильной среде скорость передачи 10-15 Мбит/с вполне достижима, что может в основном удовлетворять требованиям плавного воспроизведения видео 2K. Лидирующие в мире операторы сетей LTE могут в основном соответствовать этому уровню или даже превосходят его. Большинство сетей LTE весьма вероятно смогут достичь этой скорости за счет оптимизации сети, что обеспечит надежную передачу видео 2K.
Рисунок 6. Экосистема видео 2K и требования к сети
Популярные услуги AR/VR, использующие экран смартфона, реализованы с помощью системы линз для существенного расширения эмулированных углов обзора, что стимулирует переход разрешения экранов мобильных телефонов на более высокий уровень.
В соответствии с разрешением формулы Retina:
Мы можем рассчитать плотность пикселей, распознаваемую человеческим глазом. Как показано на следующем рисунке, сверхширокий угол обзора приведет к требованиям сверхвысокой плотности пискелей. Для обычных людей минимальный угол обзора может распознаваться от 1 угловой минуты. Независимо от расстояния, если между любыми соседними точками можно обеспечить угол обзора равный или меньший 1 угловой минуте, то экран может достичь пределов распознавания человеческого глаза.
Рисунок 7. Сверхширокий угол обзора
Рисунок 8. Требования к разрешению основных услуг VR
Основные современные концепты VR разработаны со спецификациями эмуляции впечатлений людей, которые сидят в 20 метрах от экрана размером 1060 дюймов. В соответствии с теорией возможностей идентификации PPI человеческим глазом, мы можем рассчитать для расстояния просмотра 20 метров PPI, необходимый для экрана Retina стартового уровня, равный 4.46. Разрешение 2K мобильного видео для услуги VR будет разделено на две картинки 1080p. На 1060-дюймовом экране, PPI — 2.08 (до 46,6% требований PPI). Для 6-дюймового мобильного телефона комфортное расстояние просмотра 34 см, требуемый PPI для Retina стартового уровня — 258. Для видео 360p это 122 PPI (до 47,3% требований PPI). Таким образом, разрешение 2K для впечатлений просмотра видео VR соответствует впечатлениям просмотра видео 360p на 6-дюймовом экране. Чтобы достичь впечатлений PPI стартового уровня Retina, 6-дюймовому экрану нужно как минимум разрешение выше 720p, в то время как для VR необходимо разрешение по крайней мере 6K (равно разрешению двух 4K).
3. Методология оценки качества мобильного видео
Видео — это фундаментальная услуга сети мобильного широкополосного доступа, которая была интегрирована во все виды приложений. Нам нужен индикатор для оценки качества видеоуслуг. Из-за различия характеристик видео и речи мы не можем использовать традиционные определения KPI, используемые для речи, для описания качества и впечатления пользователей от видео. Следовательно, нам нужен новый набор множества индикаторов, которые смогут реально отражать впечатления абонентов от услуг видео. Это создаст новую возможность в представлении качества услуг и планировании сети.
В соответствии с инженерными исследованиями человеческих факторов, субъективные впечатления существуют для различных уровней восприятия, например, от нарушения восприятия до потери внимания и, наконец, отказа от просмотра. Таким образом, этот интегральный индикатор должен быть способен отражать различия субъективных впечатлений когда пользователи смотрят видео.
Таблица 1: Рекомендация МСЭ-Т P.800
Для голосовых услуг, МСЭ использовал MOS (Mean Opinion Score, среднюю экспертную оценку) для определения качества речи на основе субъективных впечатлений. При реализации, из-за высокой стоимости и трудоемкости субъективные измерения заменялись на объективные измерения для расчета MOS и оценки качества речи. По той же методологии мы можем использовать MOS мобильного видео для синтетической оценки множества KPI услуг мобильного видео.
Устанавливая структуру оценки MOS мобильного видео, мы можем напрямую оценивать баллами субъективные чувства пользователей при просмотре мобильного видео; и объективно представлять качество видео, подверженное влиянию от качества исходного видеоролика и ухудшения передачи данных в сети.
Для определения интегрального индикатора качества приложений мобильного видео, мы можем взять опыт голосового MOS и использовать MOS мобильного видео для синтетической оценки множества KPI мобильных видео сервисов. В определении MOS мобильного видео, необходимо учитывать следующие принципы:
1. Непрерывность. Значения и иерархия должны быть совместимы с существующим голосовым MOS.
2. Измеряемость. В коммерческой реализации объективные оценки индикаторов могут быть рассчитаны по ряду легко измеряемых параметров.
3. Мобильность. Необходимо учитывать характеристики мобильной сети и устройств, такие как размер экрана мобильного терминала, что будет влиять на впечатления пользователя.
4. Эволюционность. С улучшением качества мобильных приложений, впечатления пользователей существенно повысятся. Поэтому определение лучших впечатлений должно будет адаптироваться к изменениям приложений.
3.1 Рамки исследований
Области применения
Области применения мобильного vMOS:
• Основанные на HTTP потоковые услуги, такие как услуги OTT (over-the-top) (например, YouTube) и предоставляемые операторами услуги видео (по HTTP);
• Поддержка неадаптивных протоколов, HTTP Progressive Download (HPD); и адаптивных, HTTP Live Streaming (HLS) и Dynamic Adaptive Streaming over HTTP (DASH);
• Поддержка только 2D-видео. 3D и виртуальная реальность (VR) откладываются для дальнейшего изучения;
• Поддержка контейнерных форматов, таких как Flash (FLV), MP4, TS, WebM и 3GP. Обратите внимание, что модель агностическая для типов контейнерного формата.
Для адаптивного потокового видео или для продолжительного неадаптивного потокового видео целый видеоклип может быть разделен на множество сегментов и каждый сегмент будет оцениваться во время измерений. Итоговое значение будет объединять значения для каждого сегмента. Оно должно отражать оценку качества на всем продолжении видеоклипа.
Взаимодействие пользователя с плеером (такое как остановка, воспроизведение, перемотка, ускоренное воспроизведение, перепрыгивание и т.д.) изменит характеристики потокового видео. Для упрощения оценки качества видеоуслуг поведение пользователей не будет учитываться.
Анализ ключевых факторов
На основе совместных исследований с Институтом интернета Оксфорда и Школой журналистики и связи Пекинского университета, тысячи пользователей видеосервисов заявили, что четкость видеоконтента и возникновение буферизаций во время просмотра больше всего влияют на их впечатления.
Основные факторы, которые влияют на четкость видеоконтента являются видеокодек (алгоритм сжатия, такой как H.264, H.265, VP9, а также профиль кодека, такой как Основной Профиль, Высокий Профиль), разрешение видео, скорость передачи данных и частота кадров.
Плохое покрытие и полоса пропускания сети являются факторами возникновения буферизаций во время передачи видео. При оценке влияния буферизации учитываются задержка начальной буферизации (или время загрузки видео) и длительность остановок в процессе проигрывания видео.
Таким образом, мы можем разработать модель мобильного Mobile vMOS с тремя ключевыми факторами: качество видеоконтента, задержка начальной буферизации и продолжительность остановок, и оценить влияющие факторы с помощью теоретического и экспериментального анализа.
Рисунок 9. Рамки исследований
Методология измерений
Для количественной оценки влияющих факторов, mLAB (лаборатория Huawei в Шанхае) сотрудничает с лидирующей лабораторией человеческого инжиниринга в Китае, используя слежение за глазами и физиографию для измерения восприятия человека во время просмотра видео.
Рисунок 10. Слежение за глазами и физиография
Неощутимый экспериментальный материал — это лучшая основа, устные отзывы пользователей, такие как "бросил смотреть, недопустимо, отвратительно" — это пределы отрицательных впечатлений. В соответствии с физиологическим индексом, мы ищем точку перегиба, которая отражает изменение настроения испытуемого. Затем, в соответствии с существующим определением эмоциональных критериев, мы определяем ключевые точки индикаторов (от 1 до 5). Устные отчеты и шкала оценок могут использоваться для их подтверждения.
Рисунок 11. Методология измерений субъективного восприятия человека
Результат анализа
На основе теоретических исследований, анализа экспериментальных результатов, сбора данных и подбора формул, mLAB получила следующие результаты:
• Стандарт мобильного vMOS с 1-5 баллами с учётом качества видеоконтента, задержек начальной буферизации и коэффициента остановок.
• Параметрическую модель для объективной оценки, по которой значение мобильного vMOS может быть рассчитано по ряду входных параметров.
3.2 Ключевые выводы о Мобильном vMOS
• Требование лучшего PPI и разрешения экрана
В соответствии с методом субъективной оценки качества видео, представленном в рекомендациях МСЭ-Т P.910 / 911 / 920, дистанция наблюдения должна составлять 1-8H при выполнении теста, где H — высота наблюдаемого объекта.
Для мобильного видео мы должны учитывать размер мобильного терминала и дистанцию комфортного наблюдения. На основе физиологического восприятия человека были проведены сотни экспериментов для определения лучшей дистанции наблюдения для типичного размера терминала. Результаты приведены ниже.
В соответствии с результатом, комфортная дистанция наблюдения должна быть между 2.5H (для планшета) и 5H (для смартфона).
В 1897 году немецкий доктор Кониг установил, что предел между двумя (темной/светлой) линиями, который может различить человек, определяется наименьшим углом, который называется углом обзора. В 1990 году Курсио использовал круг в качестве цели различения, что могло быть лучше адаптировано к тогдашним технологиям дисплеев.
Результаты эксперимента показали, что для хорошо видящих людей угол обзора равен 0.4 угловой минуты, а для нормальных людей угол обзора равен 1 угловой минуте.
Если дистанция наблюдения равна d, минимальный пиксель, который может различить человек: p=2*d*tan(θ/2), где θ — угол обзора. Более того, соответствующий PPI терминала должен быть: 2.54/(p*screen_size).
Возьмем в качестве примера 9.7-дюймовый планшет, дистанция комфортного наблюдения — 41 см, соответствующие предельные требования к PPI Retina — 534, требования к PPI Retina начального уровня — 214. На сегодняшний день PPI для 720p/1080p/2k/4k равен 151/227/303/461. Для экрана 5K (4800*2700) он равен 568. Таким образом, видео 5K может достичь предельных требований разрешения видео в мобильных устройствах, что эквивалентно 5 в оценке vMOS.
Основной стандарт разрешения видео
Хотя максимальное разрешение существующих экранов может достигать 2K, на сегодняшний день пока очень мало контента в стандарте высокой четкости 2K/4K. На основе результатов исследований, эффект видео хуже, чем картинки. Поэтому мы выбрали картинку вместо видео для исследования качества дисплея смартфонов. Мы выбрали для теста различные картинки высокой четкости, а содержание картинок включало множество сценариев различной сложности.
Результаты в таблице показывают теоретический максимальный балл в терминах разрешения. В реальности, оценка видео контента будет несколько хуже из-за различных режимов сжатия видео контента (алгоритм видеокодека, уровень кодека, битовая скорость видео и т.д.)
Таким образом будет получена формула определения качества видео для vMOS. Входные параметры включают разрешение видео, информацию о видео кодировании (алгоритм кодека, уровень кодека) и битовой скорости видео. Например, типичное видео OTT с разрешением 2K (2560*1440), кодированное с помощью H.264 High Profile при битовой скорости около 6 Мбит/с. На основе формулы получим оценку качество контента видео 2K равную 4.63.
Стандарт задержки начальной буферизации и коэффициента длительности остановок
Для анализа впечатлений, связанных с буферизацией, мы провели множество тестов по задержке начальной буферизации и коэффициенту длительности остановок. С помощью анализа множества физиологических индексов испытуемых во время тестирования впечатлений, мы определили соответствующие задержки буферизации и коэффициент длительности остановок для различных уровней впечатлений.
Методология расчета Мобильного vMOS
Мы исследовали факторы, влияющие на впечатления пользователей видео, включая категорию видео, четкость контента, размер экрана, дистанцию наблюдения, задержку начальной буферизации, коэффициент продолжительности остановок и т.д., используя метод AHP (метод анализа иерархий).
Мы обнаружили, что четкость контента, задержка начальной буферизации и коэффициент продолжительности остановок являются ключевыми факторами сильно связанными с качеством работы сети.
С целью уменьшения сложности модели и инженерной реализации, мы упростили параметры модели, расчет учитывает только влияние факторов разрешения контента, задержки ожидания и остановок на субъективные впечатления.
Например, типичное видео OTT 2K (оценка контента — 4.63), с хорошими впечатлениями то загрузки видео (задержка начальной буферизации — 1 с) и отличными впечатлениями от воспроизведения видео (без остановок), получает итоговую оценку vMOS — 4.2.
А вот пример анализа для наиболее популярного в настоящий момент HD разрешения 720р.
Для 720p, как показано в таблице, итоговый V-MOS = 3.65 где
-
Коэффициент успешного запуска = 95%,
-
Задержка первичной буферизации = 4 с,
-
Коэффициент среднего времени остановок = 4%,
-
Скорость загрузки = 2.8 Мбит/с
На базе мобильного vMOS, мы можем оценить качество vMOS в мобильных сетях. В соответствии с различиями в оценках покрытия vMOS, делаемыми по всей сети, мы можем примерно разделить по разным уровням качество видео в мобильной сети.
Одним из методов является оценка общего качества видео в сети на основе доли оценок vMOS >=4. Так как vMOS=4 является порогом хороших впечатлений для мобильного HD видео. Когда vMOS>=4, впечатления хорошие. Когда vMOS<4 впечатления нормальные. Таким образом, на основе доли оценок vMOS>=4 во всей мобильной сети по сравнению с количеством исследований субъективных впечатлений, мы можем получить оценку качества видео во всей сети.
В настоящее время исследования в части мобильных сетей показывают, что когда доля оценок vMOS>=4 обеспечивается для более чем 80% покрытия, впечатления от видео получаемые в данной сети практически отличные.
Когда доля vMOS>=4 находится между 50% и 80% покрытия, впечатления пользователей могут быть в основном гарантированы.
Когда доля vMOS>=4 менее 50% покрытия сети, впечатления пользователей будут серьезно ухудшены. Большое число пользователей снизят разрешение из-за недостатка емкости сети или это приведет к более длительному времени ожидания, а затем к слишком частым остановкам.
Больше чем воображение
При массовом развертывании сетей LTE, возможности сетей будут постепенно улучшаться за счет внедрения ключевых технологий, таких как технология многоканальной агрегации несущих частот, массовое MIMO, технологии низких задержек и т.д. Кроме того, по достижении зрелости технологии 4.5G, сеть в качестве высокоскоростной магистрали видеоуслуг сможет предоставлять среднюю скорость передачи услуг около 50 Мбит/с. И даже скорость более 100 Мбит/с в большом количестве сценариев зон концентрации трафика и покрытия внутри зданий. Предельно высокие впечатления мобильного HD-видео будут доступны везде.
В будущем, услуги мобильного видео не только унаследуют традиционное воспроизведение видео, но и будут поддерживать режим виртуального кинотеатра, а также моментальную съемку/выгрузку видео высокой четкости; то есть, в будущем возникнет большое количество основанных на видео интерактивных приложений. Особенно с возникновением технологии VR / AR, которая будет поддерживать все виды виртуальных интерактивных услуг, такие как игры, офис, шоппинг и т.д. Это позволит нам восхищаться неисчерпаемыми инновациями.
Мы верим, что мобильное HD-видео снова изменит нашу жизнь.