首页 > 机器人资讯 > 视频也能提

视频也能提

日期:2019-02-21   人气:  来源:互联网
简介:视频也能提……

视频也能提取“指纹”人工智能破解行业盗版难题

版权问题一直是困扰视频行业发展的一大瓶颈,随着人工智能技术的逐渐成熟,这一问题也有望得到解决。

日前,阿里大文娱集团联合阿里巴巴达摩院共同发布了名为鲸观的全链路数字版权服务平台。据悉,该平台通过搭载达摩院iDST(数据科学技术研究院)的人工智能技术,可实现对视频的智能编辑,同时在音视频素材上抽取指纹,让其在全网范围可追溯。

这也是阿里达摩院自成立以后,研究成果的首次落地。阿里巴巴达摩院iDST首席科学家兼副院长任小枫告诉21世纪经济报道记者:马老师(指马云)给我们定的目标非常高,我们要做的就是解决未来的问题。其中就包括视频行业的版权保护问题。

解决盗版难题

近年来,视频行业得到了迅猛的发展。据中国互联网络信息中心第40次《中国互联网络发展状况统计报告》显示,截至2017年6月,中国网络视频用户规模已达到5.65亿。

与之对应的是视频数量的爆发。据今日头条创始人张一鸣近日表示,仅今日头条旗下的平台,每天就有超过2150万条短视频上传。但是,随着行业的迅猛发展,搬运工、剪刀手等侵权现象也变得日益突出,如何更高效地进行版权保护,成为视频行业发展的当务之急。

任小枫告诉21世纪经济报道记者,指纹对于视频的版权保护来说非常重要。如果能够像指纹一样去计算视频的精确特征,那就可以对每一个视频实现唯一的匹配。

以往,侵权者会通过加logo、压缩分辨率或者调整亮度等一系列操作来改变某一视频的特征。但通过指纹技术,就能够在各种各样的变化中找出他们,现在我们已经可以去分辨多场景的视频,且准确率在99%以上。任小枫说。

实现这一成果的背后,人工智能功不可没。据悉,鲸观平台在处理视频时,会利用达摩院iDST的人工智能技术对视频内容进行各个维度的分析,并为之打上两万余种标签,同时利用知识图谱对标签进行多维度编目。这样一来,视频内容就变得可识别和搜索了。

另据21世纪经济报道记者了解,除了精准的识别技术外,鲸观平台在视频处理效率上也实现了突破。目前,其通过一台机器就可以处理近30万小时的视频。

任小枫告诉记者,这是因为该平台采用了一个二值的索引引擎。简单来说,就是把视频所有的变化都转化成二值,即零或一,这样便能简化视频的指纹特征,机器人维修,使得存储和计算速度得到大幅提升。

目前,鲸观平台上视频的下载、解码、编码都能够达到毫秒级的处理速度,5分钟时长的视频经过上述全链路处理可在10秒内完成。更为重要的是,在这个过程中,视频的精度不会损失,和原始特征一模一样。

视频技术接近美国

今年6月,任小枫加入阿里担任阿里巴巴iDST首席科学家和副院长。资料显示,iDST是阿里巴巴负责人工智能技术研发的核心团队,成立于2014年,由一批杰出的科学家及工程师组成,分布在杭州、北京、西雅图、硅谷等地。

而在此之前,任小枫是亚马逊级别最高的华人科学家。他从2013年开始任职于亚马逊无人零售店AmazonGo部门,并领导计算机视觉算法团队。因此,其对计算机视觉领域中的图像分类、物体识别、跟踪、检测、事件检测等均有全面且深入的理解。

任小枫告诉21世纪经济报道记者,对于视频技术,KUKA机器人维修,他有很多期望,这次与阿里大文娱一起发布鲸观平台,也是希望视频技术在这个平台上能够得到锻炼和提高。

加入阿里以后,任小枫仍专注于计算机视觉领域的研究,并主攻图像视频内容的识别和理解。在他看来,目前的工作内容其实与在亚马逊并无太大差异,都是对动态的人体或者物体进行检测,同时对其姿态、动作进行分析等。

从技术角度来说,动态的视频要比静态的图片更加难以识别和分析。以人脸识别为例,在视频中就可能会受到分辨率、角度、距离等因素的影响。为解决这些问题,我们选择使用超深卷积网络,并对模型简化加速,从而实现精准的人脸检测、跟踪、识别。任小枫说。

但对于这位技术大牛而言,他脑海中对视频的理解,并不是简单的给视频加上一些标签,而是要能对视频内容更加细致的理解和分析。比如有些视频的人物、场景都无法识别,库卡机器人驱动器维修,但可以分析他们的关系;或者可以对一些动作、行为进行识别和分析。这也将是阿里巴巴iDST未来要研究的方向。

任小枫坦言,视频技术正处于快速发展的阶段,他自己也在思考,除了提升现有的一些技术应用外,还有没有新的领域可以进行探索。

而在谈及中美的技术差异时,他告诉记者,中国在人工智能技术上与美国其实还是有一些差距,不过,在人脸和图像的识别技术上,这个距离已经非常接近。

免责声明:本网部分文章和信息来源于互联网,本网转载出于传递更多信息和学习之目的。如转载稿涉及版权等问题,请立即联系网站所有人,我们会予以更改或删除相关文章,保证您的权利。