- 什么是有效负载?如何控制您的库卡机器人?
- KUKA库卡机械手KR360维修保养技巧分享
- 维修保养|库卡KUKA机器人KR 210维修保养经验丰富
- 库卡KUKA机器人维修保养小手册
- 维修保养|KUKA库卡机器人维修保养干货知识
腾讯的“移动互联网+AI”,正通往移动医疗
腾讯的“移动互联网+AI”,正通往移动医疗
BAT们与各路资本齐齐砸下血本,对这个AI技术当下最热门的垂直场景之一发起了多轮攻势。AI与医疗的双高门槛,是区别于两年前移动医疗热潮的最重要因素之一。但是,将上一轮移动医疗热情彻底浇灭的那些教训,却仍然值得此轮医疗创业者借鉴。
当下,移动医疗从2015年下旬开始经历的那一场突然而又漫长的寒冬,已基本无人谈起。
那是2015年吧,移动医疗就已经死了一批了,有些融完A轮就不行了。后来慢慢的,相比移动医疗,大家就开始更多地用数字医疗这个词了。这是一位从2014年就开始深入调查分析医疗创业项目的分析师给到我们的碎片式回忆。
实际上,早在2016年10月,动脉网根据深入调查而出具的一份名为《互联网医疗生存报告:38家企业为什么死去?》的医疗创业项目倒闭白名单,曾轰动一时。
其中,技术含量不高导致的创业同质化,对医疗工作流程特殊性的错误理解,监管层面的约束,对市场的忽视,以及过高的估值与资本介入,都是那时候医疗创业者用血与泪换来的教训。
2016年中旬左右,几乎像是一场足球比赛上下场的转换,AI+医疗强势崛起。这个难得让BAT与资本们共同找到兴奋点的医疗新赛道,在过去不到2年的时间里,孕育出超过100家以医疗为重点的AI创业公司。
如果再快进到2017年,你会发现在过去的9个月中,国内外以医疗为重点的AI创业公司获得融资的频率几乎可以媲美曾红极一时的共享充电宝。其中,医疗影像自动化诊断算是一个近期各家齐头并入的热门应用场景。
当然,与曾经同质化严重的移动医疗相比,极高的AI门槛加上极高的医疗门槛,让进入AI医疗界的一众创始人们一开始就似乎有了睥睨天下的资本。
业内人士,算法专家,海归博士与其他AI创业公司并无太多差异,技术与研发当仁不让成为公司宣传的核心;而资本方也难得进入高僧打坐模式,只是期待,闭口不谈商业模式与盈利要求。
那么,一个如此早期的领域,只有拼技术就够了?移动医疗曾经经历的那一场暴风雪,是否也有相似的教训值得当下借鉴?
VoxelCloud(体素科技),算是最近一头扎入这个领域的AI创业公司中比较露锋芒的一个。2016年才成立,就在2017年5月获得红杉领投的千万级融资;仅隔3个月,又在今天得到腾讯的超亿元人民币A+轮投资。很显然,这个数额与融资频率应该会让当下一众同类型的创业公司十分眼红。
当然,尽管腾讯有自己医疗布局的考虑在内(刚刚推出一款医疗影像产品觅影),但对于选投VoxelCloud的理由,腾讯与红杉的口径较为一致:
他们之前就有了明确的产品,以后还会有更多创新性应用。
VoxelCloud的创始人丁晓伟很爽快地接受了我们的专访,而且并不避讳一些敏感问题。不过,自始至终,对于AI医疗,他的态度是谦卑且谨慎的,甚至承认现在的技术和硬件并不天然满足医疗应用级产品的研发,需要通过大量另辟蹊径实现。
我们有技术,有很强的人,但是我们也必须考虑商业模式,也需要正确面对那些市面上的AI医疗诊断系统曾经犯过的错误。
只谈学术,不谈应用,这不靠谱
借助先进的人工智能技术,系统在短时间内处理海量数据,并对病人做出愈加准确的诊断。这是IBM旗下的AI诊疗系统Watson曾做出的承诺。
然而,在IBM将Watson推向全世界的6年里,这个AI医疗领域最负盛名的产品,却遭到了无数医生的质疑与媒体的嘲讽。
可靠的技术,高质量的数据,医生的配合。事实上,这些在研发人员中最为看重的几个因素,一旦合体落实到临床实验中,就会遇见各种各样的麻烦。这就像一个仅有完整的身体与四肢,却没有关节与润滑剂的机器人,只能是一个无法动弹的残次品。
譬如,在实际工作中,Watson合作医院的医生们真的会主动用它来处理病患信息吗?医生输入数据过程中是否会遇到各种问题?给出的诊断结果是否会参考不同国别、人种的差异?
作为加州大学洛杉矶分校的计算机视觉博士,VoxelCloud的创始人丁晓伟并没有否认研发与应用之间横亘着巨大的鸿沟。那些在实验室中熠熠闪光,让人十分兴奋的技术与样品,其实很容易见光死。
这也是他为何通常在产品研发过程中,选择与医生们一待就是6个月的原因:
我虽然学的是计算机视觉这一学科,但是我家人都是医生,我基本从小就长在中国的医院里。哪个科室做什么,到底怎样运转,我都见过。我觉得,做医疗产品必须走到医院里,去观察医生的每一步到底是怎么做的。
譬如我们在研发无创肺癌筛查诊断系统的时候,就跟医生长时间一起工作,大概要相处半年吧,天天在一起讨论。这不是说我们一定要掌握哪一种病症,而是要去了解这个病的知识难点,看看医生处理的时候会有哪些问题。然后我们再独立去分析一个病种的时候,再去考虑怎么与深度学习技术融合。
另外在临床实验过程中,对某一项任务的安全编制,医生的需求是什么,这里面的容错空间有多大,做成什么样子是最能为他们解决问题的,这些都是非常细节的问题。
你不走进医院,你绝对不知道有哪些很棘手的问题。
但是,即便与医院进行长时间无缝隙合作,也不能保证机器给出的治疗方案给出的一定是精准的,或者是被医生认同的解决方案。这就像欧洲一些曾对Watson系统多有抱怨的医生透露,Watson给出的建议带有针对美国患者与美国医院治疗方案的倾向。
对于这个疑问,丁晓伟首先提出了一个大部分人对人工智能医疗应用的理解误区:机器诊断报告一定需要与某个医生的主观印象高度匹配。
他认为,与医生主观印象做比对是一种错误的认知,机器诊断结果,应该在有条件的情况下,去对比该疾病的金标准检查结果(GoldStandard)。
早期疾病的筛查在绝大多数状况下,不确定性是不可避免的。而且医生也知道,在初步筛查结果下得到的只是初步意见,不能作为金标准来下定论。我们能够保证的,是基于数据信息量,让病症在某一阶段的诊断准确率无限接近金标准。
当然,如果出现某一特殊病症没有现有的金标准可以参考,也同时为了保证诊断结果的客观性,我们会请权威医疗专家,把他们分成4~5组,分别独立去做一批数据诊断,对数据做质控标记。
这就相当于,把我们的系统作为第6组医生,它与每一组医生的差异率要维持在这几组医生之间差异率之内。
实际上,一些市场中现有计算机辅助诊断系统出现的问题,在某种程度上也被丁晓伟认为是AI医疗产品之间存在的目标性差异。
譬如,有些公司可能只做图像诊断,给出一个辅助性的诊断结果,而有些产品是既给出诊断结果,也会改进医生的工作流程,把医生写报告、做随访的时间也给一同安排了。大概我们的产品在人性化方面会要求的更高一些,丁晓伟说得比较委婉。
你看市面上的大部分的诊断应用,可能都是机械地去做特定疾病检测与判断。这起到的是查缺补漏的作用,因为我们显然不可能完全相信算法。
但我想让自己的系统多一点特性,就是能给予医生一种信任感,让人不会觉得那么生硬。你看,就像完成一个机械动作,人与机器都能完成,但是过程与感觉是不一样的。
作为医生,除了给出一个诊断,他还具备『处理不确定性的能力』。他知道哪些是不确定的,会去找上级医生寻求帮助,会去寻求更进一步的但代价更大的医学检查。
举个例子,某一种病的治疗方案如果没有特别有说服力的信息量,医生的选择总是通过各种各样的方式去验证,譬如不断地去随访,或者寻求外部援助。而这些机制机器都是通通忽略的,妄图在一次检查中给出最好的答案。
换句话说,在他的认知中,一件成功的医疗诊断产品,不仅会学习海量的数据,还要对诊断过程有一个深度理解。把医生写报告,向上级寻求帮助,二次审核等梯级任务都学到手,具备像人类一样的处理不确定性的能力。
某种程度上,这个设想与GoogleDeepmind团队一边做糖网病筛查诊断系统,一边研发医务支持与任务管理系统的两手抓计划有共通之处。
所以,我们想优化的是整个看病流程,而非仅仅提高一个诊断结果的准确率。这不是一个单纯拼技术水平高低的问题,而是谁能在现实诊疗过程中更有风险控制的能力。
但是,无论通过什么手段来保证诊断的准确率与提升医生的满意度,丁晓伟也承认一定需要考虑地域之间的差异。这也是VoxelCloud在美国与中国分别设立研发中心,与美中两国医疗机构同时进行项目试验的根本原因:
我们的研发中心是洛杉矶,跟梅奥医学中心,UCLA医学中心的关系也非常好,项目都是一起合作的。在国内,虽然合作医院需要取得授权才可以透露名字,但已经有100多家了,都是北京和上海的三甲医院。
这样做的理由,不只是因为病患的数据会有地域差异。国内外的诊疗流程也很不一样,两者都是相辅相成的,而且两地的研发结果也能做到互补,我们必须同时考虑到。
VoxelCloud与交大洽谈医疗影像合作
数据是否是核心竞争力?
好算法虽然是价值千金,但是好数据却更是千金难买。
风投机构8VC的CEOJoeLonsdale曾在今年在斯坦福举行的LightForum会议上称:做医疗诊断一开始遇到的挑战就在于搜集与创建数据。
而美国癌症中心MDAnderson的一位负责人也认为,只有在拥有上万患者数据的前提下,才能初步找到针对性治疗模式:
从各种患者数据中找到不同的特征很关键,这对针对性治疗与精确用药非常有帮助。但是如果不能扩大现有数据集,上述愿景是无法实现的。你可能只有1万个肺癌患者数据,但其实这个数字并没有很大。
此外,一位专注于医疗创业项目的分析师告诉机器之能:现在AI医疗初创项目之间的竞争核心,就在于谁能拿到更多的数据。
很简单,医疗数据之于医疗诊断的重要性,就像道路测试之于无人驾驶汽车。你只有不断地让汽车去实地训练,不断地收集与咀嚼道路数据,才能绘制出更高精的地图,逼近更高的安全数值。
同理,人体的复杂性更是不必多说。这也是为何IBM的数据工程师与医生们耗费了六年之久,才仅仅让Watson学习了7种癌症;而科技巨头与这个领域内所有创业公司也只能从单一的或者两三种疾病入手来进行摸索学习。
丁晓伟也认同这个观点。他认为,目前这个市场,大多数公司都在做肺癌、糖网病的AI医疗诊断,一方面是因为这些病种发病率非常高,影响范围非常广,且难以攻克,所以研究价值非常大。
而另一方面,其实是因为这些病的数据比较容易能拿到,包括网络等很多途径都是能搜集到很多案例的。
这些可能是起点与上手都相对其他病症来说更容易一些(不是说本身容易)的项目,所以大家都从这几个病种入手。
目前大多数AI医疗公司研究最多的4种病症:肺癌、糖网病、冠心病、肝病
根据知名医疗媒体mobihealthnews的一份调查,在医疗领域,数据的收集形式其实很丰富,包含临床实验、医生报告、医学图像、传感器和生物样本等多种获取途径。
然而,如何获取优质数据,特别是干净的患者数据,对于所有该领域的公司来说,是更为至关重要的。
不管是研究项目、还是产品项目,模型的能力是不可能超出收集数据的质量。目前对于癌症来讲,可能最有效的做法就是取得病人的手术活检,或者穿透活检的病例结果,然后把这个结果作为金标准用于目前的训练。
但问题在于,在一家医院里,有活检病人的数量是远少于没有活检病人数量的。丁晓伟这样解释高质量数据的重要性。
换句话说,要保证有持续的高质量数据的输入,公司只能尽可能多得通过与医院及其他医疗机构的合作来获得。因此,如何拿下医院的合作项目,也是鉴别AI医疗创业公司生存能力的一个重要衡量标准。