ady映画 VR基础表面的新进展——全景视频视觉贯注力模子的构建
导语:ady映画
2018年7月16日,东谈主工智能与机器学习规模顶级期刊《边幅分析与机器智能汇刊(IEEE Transactions on Pattern Analysis and Machine Intelligence(TPAMI))》(影响因子:9.455)接受了我校电子信息工程学院王祖林教唆、徐迈副教唆的最新酌量效果“强化学习在瞻望视觉贯注力范围中的模子构建”。学生作家为2014级本科生宋宇航、王建伊、樵正式,训诲作家为徐迈和王祖林,北京航空航天大学为论文独一单元。
制定秩序时的念念维火花
徐迈副教唆的团队一直在参与VR(虚构现实技能)秩序的制定,到当今一经参与了四次VR秩序制定的会议,多项提案被海外秩序继承。VR中最遑急的一环即是全景视频的处理与传输。由多个不同角度的镜头来录制全景信息,并对画面进行拼接,变成能露馅空间整个所在的视觉图像,这么的视频即是全景视频。全景视频需要相配高的分辩率支抓(如8K以至16K),才智已毕用户推己及人的千里浸式体验。
图1.全景视频
在参与VR关联秩序制定的经由中,徐迈副教唆以为,刻下的秩序主要分为两个标的---球面映射和用户体验,因此,一直带领团队致力于于晋升用户体验和经管关联推行问题。高分辩率视频的处理需要浪费无数的策动资源和通讯带宽,而由于VR头盔自己策动智商和无线传输带宽的完毕。如安在保抓视频质料不变的前提下,减少处理和传输的数据范畴,晋升用户体验,就成为了刻下全景视频及VR酌量的要点问题。针对这一问题,徐迈副教唆带领他的团队伸开了探索。
实验室坚强与问题相接
东谈主眼少见十亿的视锥视杆细胞,相配于十多亿像素高清相机,而眼部与大脑之间的神经节细胞仅为数万个,相配于数据传输速度只好8Mbps,这证实说大脑并莫得全部处理整个图像数据,而是选择性地处理了一些区域,色狼窝影院而这些区域就被称为感知区域。凭据东谈主眼职责机理,缔造全景视频贯注力模子就成为了团队的遑急酌量职责。
在不雅看全景视频的时刻, 东谈主类通过限度头部清爽从而来限度视线范围,进而产生推己及人的交互式千里浸体验。因此,瞻望头部清爽是构建全景视频贯注力模子的关键。该论文初次缔造了一个全景视频贯注力的数据库,得回58名被测者不雅看76个全景视频序列时的头动及眼动位置。经过四个月的数据清洗和处理,通过冤家动数据的跟踪,变成每个视频逐帧的热门图。最终,论文初次揭示了东谈主类不雅看全景视频的视觉机理。
ady映画
图2.不同算法瞻望完毕对比
在对热门图分析后,团队发现,尽管不同的东谈主不雅看归拢内容时感知区域存在一定相反,但与视频内容依然具有强关联性。基于此,可构建瞻望模子,瞻望东谈主类不雅看全景视频时的头动位置。而这种模子的构建机理,又与强化学习法子有内容上的关联。因此,他们提倡一种新式的深度强化学习(DRL)模子,构建智能体模拟东谈主类动作,瞻望东谈主类不雅看全景视频时的头部清爽。初次提倡全景视频视场热门图的生成法子,可离线地瞻望全景视频视场,并提倡一种全景视频的在线生成法子,可在线及时瞻望全景视频视场。终末,实验完毕考证:与传统算法比拟,论文提倡的算法所瞻望视线热门图,CC(和真正完毕的关猜度数)精度晋升跨越20%。论文对全景视频的压缩,渲染,感知,有着世俗的利用场景,为晋升全景视频用户体验提供了表面扶助。
尤物皇后
图3.全景视频视觉贯注力模子走漏图
图4.对中心偏见取不同秩序差和权重整个下瞻望完毕的CC值拟合曲面
本科生科研与不懈探索
此项酌量效果完竣由三个本科生在徐迈副教唆的指导下完成,徐迈副教唆对他们有很高的评价:“本科生有较强的酌量积极性,同期在王人心合力相助上表现很好,诚然学位上比起其他的投稿东谈主欠缺一些劝服力,但最终完毕如故好的。”三位同学走漏,在他们的初次科研经由中碰到了好多穷苦,徐迈副教唆相配细腻负责的匡助他们经管碰到的每一个问题,时常凌晨一两点发出的问题都能连忙的收到防御的复兴妥协答;每周都要集体开会商酌进程、所碰到的问题和接下来的标的;在论文第一次收到大修认识后,徐迈副教唆饱读吹全球陆续英勇,何况和他们一谈对论文进行了数次修改,才最终被接受。
结语:
新念念路与新视角会带来新的变革,使用不同于传统信号处理的深度学习和强化学习等多种法子,徐迈副教唆和他的团队从新的角度完成了对全景视频视觉贯注力模子的构建,已毕了全景视频所需策动资源与通讯带宽的压缩,为VR大范畴实用化提供了相配成心的条目,有很广的利用价值。接下来他们将会陆续将酌量深刻下去,稳固经管在推行利用中所碰到的问题,进一步改善全景视频的用户体验。除了在全景视频规模进行了始创性的酌量外,徐迈副教唆和他的酌量团队也在对包括图像、弥远视频的各方面进行着晋升用户体验的酌量。敬佩在将来,他们能陆续在这个规模取得更多的轻易性效果。
该论文得到了国度当然科学基金及北航后生拔尖东谈主才基金的支抓。
论文诱骗:https://ieeexplore.ieee.org/document/8418756/
名目诱骗: https://github.com/YuhangSong/DHP
案牍:曾嘉琪、曹嘉辉
采访:曾嘉琪
策动:杨彦卓
编审:北航派别网站总编总管职责室
投稿:geoos@buaa.edu.cn ady映画