面向UHD显示器的视觉无损压缩

作者:Pedro Ricardo Miguel,高级ASIC数字设计工程师,Synopsys公司

用于高端智能手机、汽车信息娱乐系统以及增强现实(AR)/虚拟现实(VR)设备的显示器正在变得越来越复杂,采用四倍HD或4K分辨率,而且采用更快的帧速,并支持RGB格式。这种演进为设计人员带来了新的挑战 – 他们一方面需要管理所需的数据带宽,同时还需要降低功耗,而且不能影响视觉质量。设计人员需要一种协议来通过显示接口(如MIPI® 显示串行接口(DSI®))实现视觉无损压缩。

视频电子标准协会(VESA)显示流压缩(DSC)标准实现了超高清(UHD)显示器的视觉无损和低延迟。VESA与MIPI联盟合作,把DSC标准纳入到MIPI DSI标准中。本文介绍了VESA DSC标准,并特别介绍了该标准如何将视觉无损的数据压缩率提高4倍之多,设计人员可以使用集成的MIPI DSI IP解决方案来实现这一功能。

挑战:需要更高带宽来支持更高分辨率的显示器

MIPI DSI提供低功耗、低延迟、低成本的“芯片到芯片”连接解决方案,用于将多媒体处理器与显示器或其他多媒体片上系统(SoC)相连接。它面向众多应用,包括移动设备(智能手机、平板电脑)、汽车(高级驾驶辅助系统(ADAS),例如信息娱乐)和多媒体(AR/VR)。然而,随着需求向高分辨率4K显示器转移,该规范的带宽限制成为一个挑战。

MIPI DSI以每四通道2.5 Gbps的速度运行在MIPI D-PHY物理链路上,因此,可以实现最大数据速率10 Gbps。然而,如下所述,高端视频和图像分辨率(如4K和3D 1080p)需要更高的带宽。

  • 4K:每秒60帧(FPS)的24位RGB需要13 Gbps(12 Gbps用于有效区域)
  • 3D 1080p:60 FPS 的24位RGB需要12 Gbps(11 Gbps用于有效区域)

对于更深的色彩模式,带宽需求甚至更高。这就造成一个问题,它通常要求设计者通过重新设计设备和电路来增加DSI数据通道,这进而又导致更长的设计时间、更高的成本和更大的风险。整合到MIPI DSI规范的VESA DSC可以帮助突破这种带宽限制,而不必大幅度改变ASIC架构和系统电路。

解决方案:显示流压缩(DSC)

MIPI与VESA合作将DSC整合到DSI中,已经“为源设备和显示设备的设计者提供了一种视觉上无损的、标准化的压缩方式,以便通过显示链路传输更多的像素数据,并节省显示驱动器IC中嵌入的帧缓冲器的内存”(VESA显示流压缩白皮书,2014年3月3日)。图1显示了集成到MIPI DSI中的VESA DSC框图。

图1:DSC和DSI如何在主机端和设备端进行互操作的示例

图1:DSC和DSI如何在主机端和设备端进行互操作的示例

VESA DSC算法可以以恒定比特率模式压缩数据,提供可以通过DSI传输固定的数据流,而无需进一步处理或填充。通过使用固定的数据流,所有数据包大小都是已知的,与图像颜色变化或其他复杂性无关。

表1显示了采用和不采用DSC的多个压缩率。例如,24位RGB图像通常每像素传输24位(bpp),如果使用DSC实现2:1的压缩,带宽就可以被压缩到12 bpp,因此只需要以一半的数据速率传输—即实现2:1的压缩率。对于相同的24位RGB图像,使用DSC实现3:1的压缩率时,数据也可以压缩至8 bpp,因此只需要传输原始数据量的三分之一 – 即3:1的压缩率。这些压缩不会影响图像质量,因为DSC编码在视觉上是无损的。

表1:采用和不采用DSC的压缩率样例

表1:采用和不采用DSC的压缩率样例

采用VESA DSC时,4K和3D 1080p视频和图像分辨率现在可以通过现有的显示链路传输。

  • 4K,压缩到12 bpp @ 60 fps需要6.5 Gbps -- 使用3或4个通道可以完成传输
  • 4K,压缩到8 bpp @ 60 fps需要4.4 Gbps -- 使用2、3或4个通道可以完成传输
  • 3D 1080p,压缩到12 bpp @ 60 fps需要6 Gbps -- 使用3或4个通道可以完成传输
  • 3D 1080p,压缩到8 bpp @ 60 fps需要4 Gbps -- 使用2、3或4个通道可以完成传输

DSC标准的优点

在压缩之前,图像被划分成一个多片网格。每个片段总是独立进行编码和解码,以确保传输错误不会影响到其他片段。每个DSC编码器可以由并行运行的多个核心组成,从而可以独立地对每个片段进行压缩。图2显示了DSC核心如何高效压缩图像的一个示例。本示例中(左侧),DSC编码器包含四个核心。一幅4K图像(左侧)被分割成4列x15行,并且所得到的每个片段都被相应的DSC核心(由不同的颜色指示)并行压缩。

图2:4K (3840x2160)分辨率的图像被分割为多个片段并进行并行压缩的示例

图2:4K (3840x2160)分辨率的图像被分割为多个片段并进行并行压缩的示例

由于DSC不使用帧间压缩,因此,与其他压缩标准(如H.264或H.265)相比,它提供非常低的延迟并减少了内存占用。DSC的压缩算法在设计上能够在硬件上实现,而不需要多媒体处理器参与,这使其在SoC(片上系统)中可以实现极其高效的面积和功率的平衡。通过适当的架构,DSC解码器可以每个时钟周期处理3个像素,从而可以降低时钟频率要求,这非常适合于诸如芯片到玻璃(chip-to-glass)液晶显示器(LCD)等更新颖的技术。

质量评估

VESA严格测试了其算法,以评估在选定参数条件下的图像质量。一组经过挑选的志愿者,他们都不熟悉图像压缩技术,但具有良好视觉能力。向他们每个人提供一个应用,该应用能够在原始图像与解压缩图像之间进行交替显示。这些图像包括摄影照片、文本和计算机生成的人造图案。他们的任务尽力发现任何稍纵即逝的,可能的人为加工痕迹,以便检测出任何质量损失。然后将结果填入表格中,以计算出平均得分。VESA再依据该得分对压缩结果是否存在视觉损失进行分类。

结论

视觉无损压缩作为一种理想的方法可以在高端智能手机、汽车信息娱乐系统以及AR/VR设备中,支持四倍高清或4K分辨率嵌入式显示器。目前的显示链路带宽有限,使得设计人员无法满足4K、甚至3D 1080p图像和视频分辨率所需要的数据传输量。VESA DSC标准能够帮助设计人员克服这些限制,而无需进行昂贵且有风险的电路重新设计。VESA DSC是一种能够提供视觉无损压缩新兴标准,可以为设计人员带来灵活、低延迟、低内存占用并具有错误恢复能力的效果。

Synopsys公司已经将其VESA DSC集成到其经过硅验证的DesignWare® MIPI DSI IP中,能够支持四倍HD或4K分辨率显示器。该IP与DesignWare MIPI D-PHY IP相结合,为设计人员提供了一套完整、可互操作的显示解决方案,并可以集成到应用处理器中。集成的IP减少了内存占用和数据传输带宽,而且降低了功耗和电磁干扰。