为什么企业在机器学习上频繁失败

Cassie Kozyrkov
1 min readJul 5, 2018

--

译者 :Xiaosong Rong (荣小松) 原文作者:Cassie Kozyrkov (柯凯茜)

我想分享一个秘密:当人们提到“机器学习”时,听起来这只是一门学科。而实际上有两门不同的学科,如果企业不能理解其中的区别,他们很可能会经历许多麻烦。

两种机器学习的故事

设想聘请一位大厨来制作一个烤箱, 或者请一名电气工程师来烘烤面包。谈到机器学习时,我看到的是企业不断重复类似的错误。

如果你将要开一间面包店,聘请一位精通烘培美味面包和糕点的经验丰富的师傅一定是个好主意。你也需要一个烤箱 — — 虽然那是不可或缺的工具,但我敢打赌,你不会向你的高级面点师傅分配制作烤箱的任务。那么关于机器学习贵公司是否也要有轻重之分呢?

你的生意究竟是烘烤面包,还是制作烤箱?

这些是不同的业务!不幸的是,太多的机器学习的失败了,原因是团队不知道他们是要制作烤箱,研究配方,还是烘烤面包。

机器学习研究

没有人告诉你的是,所有这些机器学习课程以及教科书都是在教授从零开始制作烤箱(以及微波炉,搅拌机,烤面包机,水壶,甚至厨房水槽!),而不是如何烹饪和创新配方。

如果你研究实现机器学习算法,关注的重点是如何给他人提供通用的工具(类比厨房器具)。这种业务被称为机器学习研究,通常由学术届或谷歌等大公司进行。

在机器学习方面,许多组织机构都处在错误的领域。

你需要接受大量的教育才能从事这类工作,因为这里有悠久的学术历史。 一些流行的算法已经存在了几个世纪。 例如,回归最小二乘法发表于1805年。相信我,人类在200年的学术历程中取得了更多的成就。

今天,你能找到一些相当复杂的工具。如果你不知道其中的工作原理,怎么可能制作一个更好的微波炉?你当然需要进行大量密集的学习和研究!成为一名研究员需要若干年的时间,初级课程从基础的微积分学开始是不无道理的。

应用机器学习

大多数企业只是要烹饪 — — 即解决他们的商业问题。他们没有兴趣销售微波炉,然而却常常错误地试图从零构建这类器具。也不能苛责他们 — — 当今的教育和市场一味地关注学术研究而不是实际应用。

如果你正在尝试创新配方,请不要重新发明轮子。这些工具早已存在了。你可以从许多地方免费获得需要的工具。而且如果建立你自己的机器学习“厨房”太过繁琐,你可以选择现有的供应商(如谷歌云平台) — — 器具食材食谱应有尽有。

如果你在厨房进行创新,请不要重新发明轮子。

对于大部分应用来说,你的团队不需要理解神经网络中反向传播等数学知识,就像是厨师不需要了解微波炉的电路原理。然而你如果想要经营一所专业厨房,确实需要了解许多其他方面的知识,包括从准备食材到检查菜肴的所有相关内容。

你在销售哪类商品/服务?这决定了你要聘请什么样的团队。

Crashing and burning with machine learning

不幸的是,我看到许多企业未能从机器学习中获益,原因就是他们他们没有意识到机器学习应用与算法研究是两门不同的学科。相反,这些企业尝试通过聘用那些一直在制作微波炉却从未烹饪过人来开办厨房,怎么可能不出错?即使成功了,那也只能证明你很幸运并且恰好聘用了一名会做饭的工程师。

但你通常没有那么幸运。人生苦短,如果你把时间花在学习微波炉的电路原理上,就不会有足够的时间来精通烹饪艺术。你聘用的博士研究员们是否真正具备从事应用机器学习的技能?如果你致力于寻找同时精通两方面(研究和应用)的人才,那就难怪你会抱怨招人难啦!

如果你打算通过雇佣那些一直在制造微波炉零件却从未烹饪过的人来开办一家餐馆,怎么可能不出问题?

那么你要招聘什么样的人呢?就像是成功的厨房一样,你需要一个跨学科的团队,以及了解这个领域的领导型人才。否则,项目难免会一败涂地。

招聘最合适的团队

如果你在销售顶尖的器具,请聘用研究人员。如果你在创新食谱并大规模的销售食品,你需要能搞懂市场需求和工作目标的人(决策者和产品经理),了解供应商和客户的人(领域专家和社会学家),能够处理大规模食材的人(数据工程师和分析师),可以快速尝试不同食材组合并发明新食谱的人(应用机器学习工程师),可以检验食品质量的人(统计学家),能够将潜在食谱转化为可以有效供应的多种菜肴的人(软件工程师), 管理跨学科团队的人(项目经理),以及保证在极端情况下也能提供顶级料理的人(可靠性工程师)。

这些角色不必要都是单独的个人,你只要保证团队具备各类必需的人才。我承认这样的信息太过笼统,关于招聘应用机器学习人才还有很多话要说。我会在未来的文章中继续讨论这个话题。

至于外包,如果你的团队尝试了所有现有的工具但依然不能制作出满足商业目标的配方,那么考虑增加制作工具的技能是有意义的(即聘用研究员)。正式招聘相关领域的研究员还是外包给有经验的算法研究机构,取决于公司的规模的成熟度。

与研究员合作的另外一个原因是你做的原型很成功,定制化的工具在大规模应用上会产生更大的价值。这是多么幸福的烦恼!

决策智能

专家们早该谈论这个话题,然后他们并没有。他们没有说明这个事实,即存在两种不同的机器学习。所以全世界范围内都在教授如果进行算法研究,而不是实际应用这些算法。

我的团队正在努力解决这个问题。我们已经创建了一个涵盖应用层面各种知识的新学科,并且训练了超过15,000 名成员。我们称之为决策智能工程,它包括机器学习和数据科学的所有应用方面的内容。

换句话说,如果把机器学习研究比作制作微波炉,而机器学习应用是使用微波炉的话,那么决策职能工程就是安全地使用微波炉来实现你的目标,并且在不需要微波炉时能够使用其他更合适的工具。

祝君好运!

在应用机器学习方面,最困难的部分是理解你想要做什么,以及如何在服务你的客户前有效检验你的产品。这部分其实也不是那么困难 — — 只要保证不要忘记这一步

至于其他方面,通过机器学习来解决商业问题比大部分人想象的都要简单。那些高端的厨房正在等你来大显身手!就像你置身于一个真实的厨房中那样来探索吧!每当我遇到认为完成全部机器学习算法课程,甚至是获得学位,才能开始使用机器学习的人,我就不得不联想到他们为了做饭非要自己制作而拒绝使用现有的微波炉。不要相信那个谎言 — — 你不需要一个博士学位也可以通过机器学习来做许多有趣且有益的事。相反地,你真正需要的只是一点创造力。祝君好运并玩得开心!

您可以在这里阅读其他有趣的中文文章:bit.ly/ai_chinese

--

--

Cassie Kozyrkov
Cassie Kozyrkov

Written by Cassie Kozyrkov

Head of Decision Intelligence, Google. Hello (multilingual) world! This account is for translated versions of my English language articles. twitter.com/quaesita

No responses yet