首页 > 机器人资讯 > AI场景的价值体现——视觉AI技术落地实践

AI场景的价值体现——视觉AI技术落地实践

日期:2019-02-26   人气:  来源:互联网
简介:AI场景的价值体现——视觉AI技术落地实践 杨帆,商汤科技联合创始人、副总裁,EGO北京分会会员。作为商汤科技工程产品中心总负责人,在泛安防智能视频、移动互联网、金融等行业开发和提供人工智能解决方案。凭借在计算机视觉算法产品化、项目管理、研发管……

AI场景的价值体现——视觉AI技术落地实践

杨帆,商汤科技联合创始人、副总裁,EGO北京分会会员。作为商汤科技工程产品中心总负责人,在泛安防智能视频、移动互联网、金融等行业开发和提供人工智能解决方案。凭借在计算机视觉算法产品化、项目管理、研发管理和团队管理方面十余年的积累和经验,杨帆推动商汤科技在技术应用商业化落地方面取得重大进展,仅2016年就获取了数亿元的产品订单。因参与创建商汤科技,并在短短三年内将其打造成为人工智能领军企业的突出表现,于2016年当选北京市优秀青年人才。

以下内容由InfoQ对杨帆先生的部分采访整理。

AI更大的价值在于跟不同的行业结合

杨帆在计算机视觉技术领域沉浸多年,在微软任职期间,他主要从事计算机视觉、计算机图形学等领域的新技术孵化工作,包括人脸识别、图像物体识别、人像三维重建等;目前商汤的核心技术也是以人脸识别、智能监控、图像识别等为主。作为主导技术落地的负责人,杨帆笑称自己是给公司的研究员们打下手的。杨帆带领逾200人的工程开发团队,在泛安防智能视频、移动互联网、金融等行业开发和提供人工智能解决方案,推动商汤科技在技术应用落地方面取得重大进展。

杨帆认为,AI技术并非新事物,工业机器人维修,但却在过去的两三年集中爆发,其关键原因就在于今天对语音、图像、视频,有了更加信息化的处理技术,在各个环节上具备了更强的技术储备。从技术到落地,AI技术所实现的这一切,都离不开场景的支持。

AI技术继承了多种基础技术,在面向工业、金融、医疗、家居、自动驾驶、安防、物流、农业等不同应用场景的解决方案,比如AI和医疗的融合应该会体现在智能设备和识别诊断主要两个方面;AI和金融的整合使金融交易和管理更加安全,实现精准营销、大数据征信和普惠金融;AI和安防的融合实现智能监控、安保机器人等应用场景;AI、大数据等这些东西纯谈概念是没有任何意义的,最终都要回归场景,可复用的基础技术和平台工具固然重要,但只有落在应用场景里,我们才知道其明确的价值在哪里。

业界曾出现一种批评的声音,称现在很多公司和开发者其实对于深度学习的运作原理并不清楚,只知道应用,却不知其所以然。

杨帆表示:学术界有两套观念,一套观念说知其然不知其所以然是离经叛道、是不对的。对于这个观念,杨帆表示认可,其实现在已经有很多团队,包括商汤也投入力量在进行更加前沿、更加基础性的科研,这样的基础科研能够指导我们将来在正确的方向上走得更远。但杨帆认为,基础研究与应用科研,二者不可偏废,完整的科学体系和持续的方向性指引非常重要,但是实证科学也非常重要,企业最终还是要以技术落地的结果说话。

人脸识别大行其道,不免让人对这项技术及其背后的公司产生了许多好奇。商汤的人脸识别技术到底有何门道?

对于这两年非常火的刷脸,开始有各种基于人脸验证能力的实用化场景。在互联网信息安全方面,对于账户的盗用能够更好的分析和调查,包括线上的手机端、桌面端、H5,包括定制的摄像头。操作逻辑非常简单,最开始做刷脸的注册,现在刷脸的支付,手机逐渐去进行刷脸的解锁。在对于个人的认证上,也有非常多的价值。人脸识别的技术,可以判断操作手机的是不是真实的人。有一个活体检测的技术服务,也包括在线下一体机的形态。对身份证的关键信息进行扫描,包括对身份证内部照片的读取和当前采集人之间进行判断。基于人像的身份认证也是一个非常有价值的工作,它是一个特殊的跨行业的解决方案。这个解决方案现在已经从线上到线下开始极大范围地蔓延。对中国来说,个人公民身份信息的实名制是一个非常重要的诉求,这个诉求能够有效地帮我们在一定程度上解决互联网的安全问题、解决线下的公共安全问题。所有线上的互联网行业应用,到各种线下行业,包括机场、超市、酒店,都会有越来越多的对于个人身份信息核验的强烈需求,商汤在这方面也提供了非常完整的解决方案。

大家都关注识别正确率,在实际场景中正确率是否为最关键因素?

近几年,很多公司在人脸识别技术上投入了大量的研发并取得了亮眼的成绩,其中识别率一直是各家宣传的重点,今年我们能在各类报道中频繁看到各种99%、99.4%、99.8%等。虽然企业这么宣称,但实际背后蕴含的差异是非常大的,它会有非常多影响因素,所以准确率跟行业背景以及前置假设会是一个强相关的关系。而不同的场景下取得的识别准确率很难做类比。

当识别率达到99%以后,人脸识别技术面临的难点主要在于,如何在不同行业场景中深化这项技术。虽然看上去99%的识别率已经很高了,但不同行业场景对于识别率的要求不同,99%可能只是该技术得以使用的入门条件;而安防场景下,照片模糊、有遮挡、角度不佳都给人脸识别带来了更现实的挑战。

看似同质化很强、很简单的人脸识别,细分的技术场景其实非常复杂,所以脱离场景去谈技术是没有太大意义的,今天能看得到的,包括以安防、手机这样的一些重点行业为代表,对于真正的人脸识别技术的全面深化存在着非常多的挑战,值得我们去攻克。

那么,怎样判断一个行业是否具有做AI场景的价值?如果从商汤自身说起,在做AI平台化的进程中,遇到过哪些挑战和问题?

1、看需求

首先,需求得是真实的。杨帆举了个具体的例子:有一个家电厂商想通过人脸识别功能,实现我进去之后这个房间自动调节成16度,我母亲进这个房间自动调节成26度。我问他:如果你和你母亲一块进去怎么办,如果你背着身进去怎么办?他说这个需求,其实最好的解决办法就是摇控器。

其次,需求得是刚性的。需要考虑用户愿不愿意买单,愿意花多少钱买单?往后更深层次的逻辑链,需要对场景的更深的了解。

2、规模化

今天完成一套解决方案成本很高。人脸识别这样的技术,在不同的场景中技术差异很大。我今天做金融,1:1的认证,错误率做到百万分之一,千万分之一,准确性非常高,在金融场景中非常好用。如果放在安防的场景下,安防要求百万人的黑名单库。而且黑名单库还要有误报,每一次误报有一个出警。同样是人脸识别,不同场景下关注的技术指标和任务是完全不同的。所以同样一个技术概念,在不同场景下的差异性非常明显。再者技术什么时候成熟需要在特定的需求场景下,离成熟多远要有一个预判力。

3、数据闭环

做AI技术,数据闭环是非常重要的环节。为什么?我们做视频的会发现,当你技术不成熟的时候你的业务不能用,业务没有落地的时候就没有数据。做不好,就形成死循环。这样的死循环如何去打破?原动力的突破来自于技术,当你的技术有小的突破,把其他场景迁移过来。技术的突破可以带来业务的落地,业务的落地带来数据的累积,数据的累计可以带来技术的进步。这样的数据闭环,帮助整体业务拓展并能带来非常大的价值。今天,数据面临隐私性和安全性的质问和考验。包括区块链在内的很多技术,还有一些非技术的方式方法,可以带来更深层次的探索。

4、商业化

光做出好产品是不够的,还要在市场上真的有价值,并且能持续保有竞争力。任何新技术都会随着时间的推移而扩散,一般所拥有的时间窗口最多也就是一年多的时间。

免责声明:本网部分文章和信息来源于互联网,本网转载出于传递更多信息和学习之目的。如转载稿涉及版权等问题,请立即联系网站所有人,我们会予以更改或删除相关文章,保证您的权利。