近日,民众顶级信号处理期间会议 ICASSP 2022 公布了论文入选名单。由王君乐博士指挥的腾讯Turing Lab实践室论文——《针敌手机游戏的主不雅与客不雅视频质料评价》(Subjective and Objective Quality Assessment of Mobile Gaming Video)、《引入用户共鸣学习的好意思学质料权衡》(Considering User Agreement in Learning to Predict the Aesthetic Quality)被大会收受。
ICASSP?(International Conference on Acoustics, Speech, and Signal Processing)是国外声学、语音和信号处答理议。是由IEEE附近的全天下最大的、亦然最全面的信号处理十分诈欺方面的顶级学术会议,具有泰斗、凡俗的学界及工业界影响力。往届ICASSP会议完好受AI领域沟通学者的热议和存眷。
这次,腾讯Turing Lab实践室在国外舞台全概念展示了腾讯在视频质料评价、图像质料评价方面的实力。
以下为腾讯Turing Lab实践室入选论文抽象:
01.针敌手机游戏的主不雅与客不雅视频质料评价
Subjective and Objective Quality Assessment of Mobile Gaming Video 频年来,手机游戏在统共这个词游戏市蚁合占据的份额已超50%,手游联系实质也成为酬酢媒体平台上短视频的进军构成部分。同期,基于视频流的云游戏也迟缓眩惑了越来越多的用户。跟着这些游戏联系的视频流媒体期间和职业的茂密发展,用户对游戏的质料体验(QoE, Quality of Experience)建议了更高的条款。只须对这个视频链路及实质推崇进行愈加严格的质料把控,才不错为用户带来更佳的游戏体验。
画质当作质料体验QoE的进军维度之一,如何正确地权衡东说念主眼感知的画质在很长一段时辰内一直是学术界及工业界沟通的要点及热门。然则,当今大批的已有沟通主要聚焦在传统的视频实质上,包括PGC实质、UGC实质、以及面向线上会议和分享屏幕等场景的特定实质等。当这些画质评价表率径直诈欺在游戏视频时,性能推崇一般。
因此,在本篇论文中,咱们针敌手机游戏在云游戏场景下的画非难题,进行了主不雅实践及客不雅算法模子研发的联系责任。咱们先从腾讯时尚云游戏平台上遴荐17款手机游戏中,并针对不同场景采集了共150段源视频,之后使用多种编码器和编码参数构造出1293段视频。咱们基于ITU联系尺度进行严格的主不雅实践,从而获得了全新的针敌手机游戏的视频质料评价数据集TGV dataset(Tencent Gaming Video dataset)。
在这篇论文中,咱们建议质料评价模子ERAQUE(Efficient hard-RAnk QUality Estimator)。聚首新建议的贫寒样本排序吃亏(Hard Pairwise Ranking Loss, Fig1),该模子在教学经过中不错愈加针对相通的样本对,从而学习到更细粒度的失真信息,进一步进步模子的性能。在建议的TGV数据集上,咱们进行了模子教学和对比熟识,实践限度标明ERAQUE模子比较业界其他质料评价模子推崇出了更好的性能。
临了,为了让模子以在端侧更高效地推理,咱们使用学问蒸馏的决策(Fig.2)对ERAQUE模子进行压缩和加快,最闭幕尾ERAQUE模子的轻量化部署,实践限度标明ERAQUE模子配合建议的蒸馏政策不错使模子在复杂度和性能之间终局高度权衡。
02. 引入用户共鸣学习的好意思学质料权衡
Considering User Agreement in Learning to Predict the Aesthetic Quality 频年来,针对图像的视觉好意思感评价期间在很多诈欺场景中阐扬着进军作用,包括图像的自动化剪辑、图像生成、以及在实质推选领域等。因此,图像好意思学评价成为了学术界及工业界热门的沟通课题。
与传统的图像质料评价问题不同,由于东说念主在进行好意思学评价时会引入更多high-level的评价维度,如形貌、画面布局、颜色搭配与衔尾性等,这也使得好意思学评价比较针对失真进行的传统图像质料评价,具有更高的主不雅性与省略情味(见Figure 1)。
Figure 1:在这两幅图中,评测东说念主员关于A图的好意思感评分具有更高的省略情味(尺度差σ=1.36),而关于B图,评测东说念主员关于好意思感的评分则趋于一致(尺度差σ=0.59)
在这篇论文中,咱们建议了立异了的多任务attention汇集(见Figure 2及Figure 3),不错对输入图像的好意思学MOS分数,以及代表了该分数不一致性的尺度差进行端到端的权衡。在吃亏函数方面,咱们同期也建议了全新的针对的置信区间排序吃亏(confidence interval ranking loss),用于促使模子在教学经过中更多地存眷具有更高好意思学省略情味的图像对,从而学习到更具有永诀性地特征,以及与不雅测者省略情味更联系的特征。
Figure 2: 著述所建议模子的总体架构
6
华大九天:拟1亿元参设产业基金 其主要投资集成电路领域
解密主力资金出逃股 连续5日净流出447股
Figure 3: 著述所建议的LMLSP模块
在这个责任中,咱们通过大批的实考据明了咱们所建议多任务学习好意思学模子不但在游戏图像的好意思学权衡中具有广泛上风,同期关于传统的当然实质图像好意思学权衡任务,也达到了很好的效果。
产学研聚首,落地业务,反哺期间
在业务层面,以上AI期间均已诈欺到腾讯时尚云游戏平台,腾讯时尚云游戏通过Turing Lab画质评价、多媒体视频质料评价、实质生成及虚实互动等智商,致力于于于全概念的进步云游戏画质推崇,打造云游戏极致的用户体验。
除了在C端业务的落地除外,在面向产业互联网层面,Turing Lab的视频质料评价期间也还是通过“腾讯WeTest质料云平台“对外怒放,行业用户不错通过体验Demo快速体验了解到该期间。
除此除外,在AI诈欺上的探索,腾讯WeTest官网近期全新上线了AI职业专区,并同步推出视频画质评价/游戏实质安全措置决策等居品智商。将来,腾讯WeTest将抓续在科研领域深耕,并致力于于于将AI期间前沿沟通与测试场景进行会通,用期间开动测试乃至质料保险行业的发展,并以怒放气派,对外输出优秀的期间智商,助力行业的发展。
王君乐博士简介
腾讯人人沟通员,Turning Lab追究东说念主
领有10余年算计机视觉、多媒体、机器学习领域沟通训导,在东说念主体姿态推测与重建、图像质料评价、算计影相学、千里浸式多媒体等领域有较深的了解及实战训导,并在这些领域指挥团队进行探索与落地的责任。曾主导腾讯CenseoQoE画质评价决策的陶冶与社区开源开彩彩票网,主导腾讯时尚云游戏云表虚实互动期间的研发。此外,在包括CVPR、NeurIPS、TIP、TMM等顶级会议及期刊上发表多篇论文,并为多个会议及期刊担任审稿东说念主及组织者。