周伯文夏季达沃斯语录:5G为AI插上了翅膀 计算机视觉和多媒体将大有可为

周伯文夏季达沃斯语录:5G为AI插上了翅膀 计算机视觉和多媒体将大有可为

推荐 2019-07-04 11:53:11

近日,《蜘蛛侠:英雄远征》正在热映,其中神秘客使用的无人机全息投影技术让人瞠目结舌。其实在很多影视作品中AI已经成为大家常见的应用:全息手写操作设备、虚拟电脑屏幕、人工智能机器人、光谱绘图的无人机、无人驾驶、智能眼镜等等。

img_pic_1562212391_0.jpg

漫威超级英雄片《蜘蛛侠:英雄远征》剧照

那些曾经只有在科幻作品里见过的科技,很多已经逐渐走进大家日常的生活,而随着5G时代的到来,让这些应用离我们更近一步。相比于4G,5G网络带宽高、延时低、连接更广,还将对物联网、零售、AR/VR等诸多领域带来革命性改变。

img_pic_1562212391_1.jpg

正在参加夏季达沃斯的京东集团副总裁、京东人工智能事业部总裁周伯文表示,5G带来的不仅仅是网速的改变,5G更具有的高密度万物互联,毫秒级的极低延迟,结合人工智能等技术,更可以带来思维方式、商业模式的变革。比如,万物互联后的群体智能优化和多角度数据来源将极大提高与加速人工智能与实体经济的结合进程。

img_pic_1562212392_2.png

京东集团副总裁、京东人工智能事业部总裁周伯文博士

5G是人工智能的功放 计算机视觉和多媒体将迎来爆发

作为一个从业十多年的人工智能研究者,在周伯文看来,5G或将成为释放AI应用能力的巨大“功放”,AI将在5G时代展现更大的社会和商业价值。

img_pic_1562212392_3.png

大连国际会议中心,达沃斯演播室

毫无疑问,5G将为人工智能带来新动能,5G是基础设施,如同“信息高速公路”,它为庞大数据量和信息量的传递提供了可能性,同时,它也带来了更为高效的传输速度。而人工智能,不仅仅是云端,让边缘计算技术和实时智能终端成为可能。尤其是与计算机视觉和多媒体等相结合,将在社会和产业层面产生巨大的价值。

就在近期,为了迎接即将到来的冬奥会,京东人工智能团队正在进行一项研究:利用AI技术+5G技术融合,实现千人千面的视频直播。例如在一场滑雪比赛中,不同观众的关注点其实是不一样的,一位滑雪初学者可能会关注滑雪选手的整体动作和精彩瞬间,而一位滑雪高手可能更加关注滑雪选手处理动作的细节,而目前普向性的视频直播很难满足这种差异化需求。

“所以我们现在用AI技术结合5G技术去做高清晰度、低延时的千人千面视频直播,也就是说基于观众的需求和画像,我们会实时决定在这个视频转播中,我们在哪些细节上进行放大、延迟和重放,如果没有5G这是不可能做到的。”周伯文说,不仅仅是滑雪项目,在任何一个视频的播放上,观众都能感到自己的兴趣被尊重。

img_pic_1562212392_4.png

周伯文博士

京东人工智能视频动作识别全球夺冠

人工智能要想理解真实世界发生的事,读取视频中的信息是一项重要的内容,不仅要分辨出图像中的物体或人,还要搞清楚他们在干什么。

近日,京东AI研究院在美国长滩召开的计算机视觉顶级会议CVPR 2019上获得视频动作识别冠军。ActivityNet号称视频领域的ImageNet,它涵盖动作识别、动作定位与检测等多种视频内容理解任务,是目前视频动作分析方向最大的数据集。

据了解,ActivityNet视频动作识别任务(Kinetics)由Google DeepMind组织,已连续举办三年,今年视频数据量达到65万,覆盖700个以人为中心的动作行为类别,这是视频领域数据和参赛规模最大、影响力最广、也是技术难度最大的比赛。

img_pic_1562212392_5.jpg

京东AI研究院在视频动作识别竞赛排名第一

鼓舞人心的是,在今年ActivityNet视频动作识别任务(Kinetics)中,京东AI研究院取得了世界第一的领先水平。

img_pic_1562212392_6.png

常规视频动作