【新智元导读】机器学习专家、著名的计算机科学和统计学家 Michael I. Jordan 近日在《哈佛数据科学评论》上发表文章,评论当前的人工智能炒作,认为现在被称为 AI 的许多领域,实际上是机器学习,而真正的 AI 革命尚未到来。
人工智能(AI)已经成为当今时代的口号。
技术专家、学者、记者、风险投资家都在说这个词。跟其他许多从技术或学术领域流入普通大众的词语一样,“AI”这个词的使用也存在严重的误解。
然而,跟其他领域中公众不理解科学家在做的事情不一样,对于“AI”,科学家们经常和公众一样困惑。
某种程度上,我们这个时代正在看到一种与我们人类的智能相匹敌的硅基智能的出现,这既让所有人感到兴奋,让我们着迷,同时也让我们感到恐惧。不幸的是,它分散了我们的注意力。
Michael I. Jordan
我们急需发展构建推理和决策系统的原则
我们可以从另一个角度来讲述这个时代。有这样一个故事,其中涉及人类、计算机、数据和生死抉择,但重点不仅仅是硅基智能这类的幻想。
14年前,我的妻子怀孕时,我们做了超声波检查。医生是一位遗传学家,她指出胎儿心脏周围有一些白点。“这些都是唐氏综合症的标志,”她说,“现在你的风险已经上升到20分之一了。”她告诉我们,可以通过羊膜穿刺术了解胎儿是否真的有唐氏综合症基因畸变,但羊膜穿刺术存在风险——在穿刺术过程中胎儿死亡的几率大约是300分之一。
作为一名统计学家,我决定找出这些数字的来源。在我的研究中,我发现十年前英国有人做过一项统计分析,这些反映钙沉积的白点确实被认为是唐氏综合症的预测因子。我还注意到,我们做检查时使用的成像机每平方英寸的像素比英国研究中使用的成像机多几百个像素。我回去告诉遗传学家,我相信那些白点很可能是假阳性,也就是字面上的白噪音。
她说:“啊,这就解释了为什么我们几年前开始发现唐氏综合症的诊断有上升趋势。那恰好是新机器运来的时候。”
我们没有做羊膜穿刺术,几个月后妻子生下一个健康的女孩。但这件事一直让我放不下,尤其是我知道由于一次粗略的计算,那天可能有成千上万的人得到同样诊断,然后许多人选择做羊膜穿刺术,造成许多婴儿不必要的死亡。
这件事揭示的问题不是我个人的医疗问题;它关乎一个医疗系统,在不同的地点和时间测量变量和结果,进行统计分析,并在其他情况下使用结果。
这个问题不仅与数据分析本身有关,而且与数据库研究人员所称的“溯源”(provenance)有关——数据来自哪里,从数据中得出了什么推论,这些推论与当前的情况有多大关系?虽然专业人士可能在遇到个案时能逐步解决这些问题,但问题是设计一个行星级规模的医疗系统,该系统要能在不需要如此详细的人类监督的情况下做到这一点。
我也是一名计算机科学家,我突然想到,在我所受的教育中,根本找不到构建这种行星级规模的推理和决策系统所需要的原则,这些原则融合了计算机科学和统计学,并考虑到人类的效用。在我看来,发展这些原则至少与构建玩游戏之类眼花缭乱的AI系统同样重要,这些原则不仅在医学领域,而且在商业、交通和教育等领域都需要。
一个新的工程学分支:将人类和计算机结合起来
无论我们是否很快就能理解“智能”,我们都面临着一项重大挑战,那就是如何将计算机和人类结合起来,从而增强人类的生活。
尽管一些人认为这一挑战只是AI创造的一种辅助,但另一种观点认为,这是一个新的工程学分支。就像过去几十年的土木工程和化学工程一样,这门新学科的目标是围绕一些关键思想,为人们带来新的资源和能力,并确保安全。土木工程和化学工程建立在物理和化学的基础上,而这门新的工程学科将建立在上个世纪赋予了实质的思想之上,如信息、算法、数据、不确定性、计算、推理和优化。此外,由于新学科的大部分重点将放在来自人类和关于人类的数据上,因此,它的发展将需要社会科学和人文学科的观点。
虽然各种构建块已经就位,但是将它们组合在一起的原则还没有到位,因此目前将这些块组合在一起的方式是临时的。因此,就像人类在土木工程出现之前建造建筑物和桥梁一样,人类也在继续建造涉及机器、人类和环境的社会规模的推理和决策系统。正如早期的建筑和桥梁有时会以无法预见的方式倒塌,并带来悲剧性的后果一样,我们早期的许多社会规模的推理和决策系统已经暴露出严重的概念缺陷。
不幸的是,我们并不擅长预测下一个可能出现的严重缺陷是什么。我们缺少的是一个分析和设计原则的工程学科。
目前大多数AI,实际上是机器学习
目前关于这些问题的公开讨论中,经常使用“AI”这个术语作为一个智能的通用词,这使得人们很难推断出新兴技术的范围和后果。因此,我们有必要深入了解AI在最近和曾经被用来指代什么。
如今大多数被称为AI的东西,尤其是在公共领域,实际上是机器学习(ML),这个术语在过去几十年里一直在使用。ML是一个算法领域,融合了统计学、计算机科学和许多其他学科的思想(见下文),设计处理数据、做出预测和帮助做出决策的算法。
就对现实世界的影响而言,ML是真实存在的,而不仅是最近才火起来的。事实上,在20世纪90年代初期,ML就已展现出将为产业界带来巨大改变的苗头。到了世纪之交,亚马逊等具有前瞻性的公司就已经在他们的业务中使用机器学习、解决关键任务、后端检测和供应链预测中存在的问题,以及建立面向消费者的创新服务,如推荐系统。
在随后的20年里,随着数据集和计算资源的迅速增长,很明显,ML很快将不仅为亚马逊提供动力,而且将为任何一家可以将决策与大规模数据关联在一起的公司提供动力。新的商业模式将会出现。