- 什么是有效负载?如何控制您的库卡机器人?
- KUKA库卡机械手KR360维修保养技巧分享
- 维修保养|库卡KUKA机器人KR 210维修保养经验丰富
- 库卡KUKA机器人维修保养小手册
- 维修保养|KUKA库卡机器人维修保养干货知识
为什么说AI创业不是4、5个人的团队就能搞定的事
为什么说AI创业不是4、5个人的团队就能搞定的事
在人工智能领域内的一系列突破点燃了无限商机,大公司希望抓住机遇来加强现有职位,小公司希望借助新技术来提升市场领先地位。作为FirstMark的投资者,MattTurck已经看到机器学习领域内的初创正在跃跃欲试。MattTurck曾任BloombergVentures常务董事,现为FirstMarkCapital合伙人。
以下MattTurck对于机器学习型初创公司发展模式的讨论,哪些是推动生态系统发展的原因,以及为什么它们看起来与之前的SaaS初创公司不同。
采访人SamDeBrule是人工智能、技术、创业等领域的优秀博主。在Medium社区,他有8600多粉丝。他的《机器学习和人工智能的非技术指南》、《如何找到一个值得工作的创业公司》等文章获得了许多喜爱。
Sam:Matt,请你简单介绍一下自己以及你所做的工作吧。
Matt:我是纽约风投公司FirstMark的合伙人,FirstMakr管理着61亿美元的资金,已经成为纽约市最大的早期投资创业公司。作为投资者,我虽然对很多事情感兴趣,但我重点关注的领域有两个。
第一个是数据领域,包括大数据、机器学习和人工智能公司,以及将大数据视为护城河的初创公司,如ActionIQ、Dataiku、x.ai、Sense360和HyperScience这样的公司,我很热衷于投资于这样的企业,并时常在博客上讨论这些话题。与此同时,我还运营着一个有着14000名大数据和AI爱好者的社区DataDrivenNYC。
第二是前沿科技领域,包括新型计算平台、VR/AR、物联网以及你所能想到的所有流行新事物。同样地,我也会在个人博客上讨论,并运营着一个超过5000人的社区HardwiredNYC。
1.现在确实是投资AI的最佳时机
Sam:你是在什么时候开始考虑投资机器学习领域
Matt:我是以数据分析师这个角色进入科技行业的。我是一家搜索引擎初创公司的联合创始人,我们用贝叶斯理论(一种机器学习方法)来进行问题搜索和检索。
实际上,机器学习已经存在于创投领域很多年了。但近年来,因为大数据的出现这个领域变得有趣了许多。大数据技术以合理的成本和速度捕获和处理大量数据。另一方面,它同时加快了机器学习的发展速度,特别是需要大量数据工作的领域,如神经网络。
现在正是投资该领域的最佳时机。在我看来,人工智能确实很热。
2.营销盖过现实:IBM可能在兑现承诺方面做得最差
Sam:接下来,我们来讨论一个比较犀利的问题。如今众多的AI企业中,哪家企业在兑现消费者承诺方面做得最差?
Matt:根据我从市场上听到的,可能是IBM。
很大程度上,正是因为他们的营销机制和雄心勃勃让他们陷入了一个尴尬的境地:承诺太多,同时间投入在多个领域难以得到市场的满意回馈。据说,只要你愿意花几个月的时间和大量的金钱去训练IBMWaston,你就能用它来实现有趣的事情。但是,很明显,这有些言过其实了。
他们会发现,在每个垂直领域的竞争上都十分激烈。据我了解,他们正在损失大量交易,通常是败给那些更为专注、灵活的小公司。
3.人才是核心,而创业公司距离人才更近
Sam:Salesforce是否会走上和IBM同样的路径?
Matt:我觉得不会。当Salesforce创始人MarcBenioff去年宣扬人工智能平台Einstein时,Salesforce公司自己的人都有些害怕,不过这可能是因为Marc本身就爱吹牛。
问题的核心是,创业生态系统的导向和市场收购动作有着直接联系。因为创业公司距离机器学习领域的人才更近,而目前来看,这个因素是该行业的决定性条件。Salesforce和创业生态系统有较强的连接性,这一点很重要。
4.没有大数据对创业公司的影响并没有想象中大,行业里最敏锐的人正在致力于减少神经网络对大数据的依赖,这是未来的一个方向
Sam:众所周知,专有数据是模型训练的关键,这使得创业公司和大公司相比会处于劣势。是否能找到更小的数据集来为模型提供动力的方法?
Matt:创业公司在这一方面确实处于劣势,但是这同时也会让他们具备更多创造性,让资源变得丰富。
从技术角度来说,当下该行业中最敏锐的人(不仅仅是初创公司里的人)正在致力于让神经网络在数据量较少的情况下发挥作用。在可以看得到的未来里,这将是这个行业前进的方向。
几家我很熟悉创业公司已经取得了一些真正的进展,并在迁移学习方面做了一些有趣的事情。话虽如此,这似乎还是一个特别棘手的问题,所以还需要些时间。
同时,创业公司也正在寻找多种的方法获得他们所需要的大型数据集。例如医学成像领域的人工智能公司,他们中的一些人在与特定医院建立了合作后,能安全地访问一些特定的放射影像数据库。在保险、工业机械、农业等领域也同样如此。
另外,获取数据只是挑战的中一部分,你还需要给它贴上标签,以便深入学习。一些创业公司在世界各地雇佣了一大批人,用MechanicalTurk(Amazon旗下的公司,网络交易平台)的套路来给他们的数据贴上标签。
我还看到其他一些创企聘请了一些行业专家来给特定类型的数据贴上标签,比如一个外科医生精英组给最复杂的医疗图像数据集贴标签。
5.理论上,任何人都能收集到足够多的数据,形成马太效应
Sam:基于Netflix、Spotify和Facebook等平台,我们看到数据集带来的马太效应。哪些初创公司在构建下一代强大的数据马太效应?
Matt:理论上,任何人都能从多个用户那里收集到足够多的数据,在集合数据集上运行算法,并将学习反馈给每个客户的机器学习企业这些都可以从数据网络效应中受益。
以x.ai项目为例,人工智能助手安排的会议越多,得到的数据也就越多,算法随即变得越聪明。算法越智能,体验也就越好。反过来,体验越好,www.zr-kuka.com,人们也就会更愿意使用x.ai来安排会议,从而x.ai就能获得更多的数据。如此良性循环下去。这便是数据网络效应。
这种效应的奇妙之处适用于很多创业公司,从像x.ai帮助人们安排会议的公司,再到像Phosphorous帮助医院经营基因检测实验室的公司都能适用。
在B2B模式背景下,通常不会轻易受到数据聚集带来的马太效应影响,因为企业都很注重对数据的保护,比较抗拒把自家数据和所在行业其他公司的数据掺糅在一起。
另一方面,数据集造成的门槛问题也将在一定程度上得到解决。谷歌搜索在几个月前发表了一份关于联合学习的文章,文章的想法是:在不实际收集数据的情况下支持协作式机器学习。这就可以解决所有关于数据隐私的担心,充分利用各类数据网络效应了。
不管怎样,数据网络效应的影响要几年才能发挥出来。创企要建立客户基础来收集足够的数据,这才能让他们的模型进行学习。不过,一旦完成,企业就会形成较强的竞争力。
6.人工智能创业不是简简单单4、5个人就能搞定的事
Sam:人工智能是否将成为创业公司的最佳市场策略?