Google 的人工智能:让流动的信息产生智能
早在 2001 年,拉里佩奇对于 Google 的定位就是人工智能。这个理念源于拉里·佩奇的恩师威诺格拉德,上世纪 70 年代,威诺格拉德曾作为MIT人工智能实验室的一员,一门心思要制造与人类思维匹配的智能。然而威诺格拉德看到所谓人工智能在各个领域的溃败,同时又受到加州大学伯克利分校教授塞尔斯「中文房间」理念的启发,最终退出这个领域。
1998 年,威诺格拉德和他的学生拉里·佩奇、谢尔盖·布林及其导师拉杰夫·莫特瓦尼联合发布了一篇学术论文《你能用自己口袋里的论文做什么?(What Can You Do with a Web in Your Pocket?)》,该论文提出了谷歌搜索的产品原型。同年,佩奇和布林从斯坦福大学毕业,创立谷歌,通过改善人类信息组织和发现的方式,创造一种可以为人类服务的智能方式。
该论文的概念也体现在 Google 的 Slogon 里:「整合全球信息并为其使用」。因此 Google 对于信息背后的智能方式有着天然的热爱,硅谷资深记者 Steven Levy 在六年前探访Google 总部后这样写道:
Google 搜索的最大创新是引入新算法 Page Rank。而网络搜索是一个多方过程。
首先,谷歌机器人获取每个可访问网站的内容。这些数据将被分解成一个索引(通过文字进行组织,就像书本的目录),这样就可以根据内容找到任何页面。每当用户键入一个查询,谷歌就会在索引中搜寻相关页面,然后返回一个包含多达数百万页面的列表。最复杂的是对列表进行排序,也就是决定哪些页面应该出现在最上面。
此时,上下文便有了用武之地。所有搜索引擎都会引入上下文,但没有一个像谷歌那样引入得那样多、应用那样自如。PageRank本身也是一个信号,同时也是页面的一个属性(指其相对于其他网页的重要性),该属性可以帮助确定其与查询内容的相关性,其中的一些信号在现在看来是显而易见的。
2012年,Google 提出了知识图谱,所谓知识图谱,简而言之就是一种深度挖掘搜索词潜在的知识关系,来呈现更结构化的搜索结果。比如当你搜索硅谷,你所看到的不仅仅是关于硅谷的网页信息,还提供结构化及详细的关于主题的信息,下图的右侧就是 Google 的知识图谱:
将杂乱无章的网页到结构化的实体知识,搜索引擎可以通过知识图谱给用户提供更具条理的信息,甚至顺着知识图谱可以探索更深入、广泛和完整的知识体系,让用户发现他们意想不到的知识。Google 高级副总裁艾米特·辛格博士一语道破知识图谱的重要意义所在:「构成这个世界的是实体,而非字符串(things, not strings)」。
根据 Google 官方的说法,知识图谱的信息来自许多来源,包括CIA的世界概况,Freebase 和维基百科,通过知识图谱,Google 在践行「整合知识并使其可用」方面迈出了坚实的一步。
2011 年开始,Google 引入深度学习框架。深度学习并非什么新技术。上世纪60年代发明后,先后在 80 年代和 90 年代初期流行过一整,但随后就逐渐消沉。但在 Google 看来,深度学习需要的海量数据恰好也是 Google 最擅长的领域,与此同时,对于计算能力的高要求也是 Google 自身技术架构足以应对的。
深度学习最开始由吴恩达推动的Google大脑计划,Google 技术大拿 Jeff Dean 也参与其中。当时想通过使用神经网络来提升技术水准,但并没有把研究做成像大学象牙塔那种,而是结合 Android、Gmail、图片去改进产品解决真正问题。
2012 年 6 月,《纽约时报》率先报道了 Google 大脑项目,吸引了公众的广泛关注。公众第一次了解到,利用16,000个CPU Core的并行计算平台去训练含有10亿个节点的深度神经网络(DNN,Deep Neural Networks),使其能够自我训练,能够实现对2万个不同物体的1,400万张图片进行辨识。
到了 2012 年年底,在业界关注的图片分类的竞赛 ImageNet 中,Google 一支采用深度学习的精英团队完败给 Geoff Hinton 手下的博士生团队。这也促使 Google 重新开始认识深度学习带来的巨大价值,一年后,Google 高价收购了 Geoff Hinton 的团队,并全面开始在产品里部署基于深度学习的相关技术。
从早期基于 page Rank 的搜索技术到引入知识图谱以及全面整合深度学习,Google 一遍遍地将互联网上的原始信息、基于 Android 系统收集到信息、利用Google 服务( 搜索、Gmail、Youtube)搜集的信息清洗、过滤、重组,寄希望于从这些「0和1」的组合里找到智能的存在方式。
2014 年 10月,Google 推出 Gmail 的「进化版」—— Inbox,这是一个基于对邮件自动扫描后的重新展示,自 Inbox 的帮助下,用户收件箱里的邮件可以自动被归类到「旅行」(如机票邮件)、「财务」(如信用卡账单)、新闻资讯(如各种网站的订阅) 。2015 年的 Google I/O 大会发布的 Google Photo 令人震惊。Google 开辟了对于照片处理的新方式,基于深度学习的算法,Google Photo 可以自动识别、分类,并支持自然语言搜索。
Google :把鸡蛋放在多个篮筐
直到 2015 年夏天 Google 宣布重组,或许很多人还没有意识到这家公司的业务有多繁杂,在新的 Alphabet 架构下,新 Google 聚焦在在线业务和 Android 产品线以及云服务。尤其是在 Google 商业模式即将转型的大背景下,人工智能或许将出现在更多的 Google 产品里。
长期以来,Google 的盈利渠道都是广告。在今年 4 月财报电话会议上,Google CEO 桑达尔·皮查伊公开表示:Google 将加快云计算业务发展,并计划在 2020 年使云计算业务超过广告业务。就在皮查伊上述表态的前后,Google 云计算服务签下了Netflix、Spotify 这样代表未来的企业级大客户;并挖来曾一手打造 VMware 的 Diane Greene 来统领云计算团队。
2016 年 7 月的腾讯「云+未来」大会上,马化腾这样定义未来:「未来互联网行业就是利用人工智能在云端处理大数据。」这实际上也是Google 在做的事情。皮查伊的这一幅手牌就是 Google 构建的云计算生态。今年的Google Next 云计算大会上,Google发布了面向开发者的新机器学习平台,并开放语音识别API等等,如果再加上去年推出的 TensorFlow 平台,Google希望通过将这些人工智能的服务模块化、开放化,让云计算的PaaS 层、IaaS 层的服务都具备人工智能属性,从而能够快速完成数据处理。
DeepMind 则是 Google 的另一个秘密武器。日前,Google 宣布在数据中心的节能方案中采用 DeepMind 的算法,效果显著。根据官方的数据显示,这项技术帮助该公司将电力使用效率(PUE)提升了15%,与使用效率提升同时带来的则是耗电量的下降,如果能将数据中心的耗电量降低10%,便有可能在几年时间内为 Google 节约数亿美元电费。而进一步来看,倘若 Google 能在数据中心节能方面不断优化,其云计算的价格极有可能继续下降,在云计算服务目前还处在价格敏感阶段的时候,Google 的想象力还很大。
总结
上世纪 60 年代,包括约翰·麦肯锡、马文·明斯基在内的人工智能先驱们坚信,只需十年时间就足以制造一种可以匹及人类智能的智能。后来的故事大家或许都知道了,半个多世纪的时间,人工智能在寒冬与初春的交替中缓慢前行。现在,在算法逐步成熟、数据量增加以及计算能力突飞猛进的帮助下,我们或将有幸见证一次最接近人类智能的智能。
与过往不同,这一次的智能诞生在每个人的手里紧紧握着的智能手机。本文并没有去对比其他互联网巨头,包括微软、亚马逊、Facebook 以及中国 BAT 的布局和思路,但无一例外,你能感受的这些智能都或多或少地在你的指尖呈现。
从计算普及到交互进化,苹果和 Google 在两条不同的道路上快速前进,相比来说,包括微软、亚马逊、Facebook 在内的人工智能计划都与 Google 类似,而坚守「隐私价值观」与「设备智能」 的苹果,似乎并没有同盟者……虽说殊途同归,但观察以及见证他们的行进故事,也颇具意义。
您需要登录后才可以评论, 登录| 注册
甜找出15个字是什么?汉字找茬王找字甜关卡2023-04-10
闽南网推出专题报道,以图、文、视频等形式,展现篮球比分直播:在补齐养老事业短板,提升养老服