• 1
  • 2
  • 3
  • 4
  • 5
百家谈云计算 首 页  »  帮助中心  »  云服务器  »  百家谈云计算
机器学习已成谷歌第三大技术 开源有助创业者
发布日期:2016-3-16 21:3:54

  五年后重新谈论搜索之后的技术的时候,机器学习成为谷歌(微博)接下来产品必备的技能,并且谷歌已宣布将开放这一能力,原因是其需要大量的数据使得机器更加智能。

  

  机器学习不止是用于优化减少垃圾邮件及YouTube的视频推荐,如今最能代表这项技术的产品就是Google Photos。发布6个月后,用户已上传了500亿照片。这样大量的数据以使得谷歌可自动帮助用户组织和管理图片,而且更加人性化的搜索图片和分享。周二,Google Photos产品经理Chris Perry在日本向媒体展示了Google Photos是怎样识别出十几年前父子在峡谷的合影,而这张照片并未被人工添加任何标签。与传统照片管理依靠特定标签不同,谷歌虽然也同样会根据关键词进行搜索,但对于图片的识别技术已发生了根本的改变。

  Chris Perry展示了怎样利用神经网络识别一张图片,而不是使用信息点匹配的方式,原因是后者只能识别静物。这项被称为“神经网络”的项目包括26个层次的识别,而每个层次识别的内容并不相同。简单来说,谷歌可从像素、线条和形状分别进行对图片的识别,最终告诉用户这是什么。不过,这里存在着一个难以突破的困境。机器可通过已上传的多张图片识别出他们相同的特点,并知道这是同一类事务,但是无法将这些事务与人的认知相联系。举个例子,机器识别一张猫的照片,并知道这是一只喵喵叫的猫,但它却无法告诉用户这是一只“猫”。

  面对大千世界的海量数据,在实际中是无法有专门的人对每个事物进行标定。推特和Pinterest通过五年的时间实现了这个方式,而Instagram用了两年半的时间。然而,谷歌的做法就是利用每一个人的搜索,以此代替专门的人工添加,这是自7、8年前语音团队开始切入机器学习后开始的。2、3年前谷歌开始大规模投资这项技术,如今,谷歌向外界开放其机器学习系统TensorFlow,Alphabet执行主席Eric Schmidt表示,这将不断扩大网络,组成更大的知识基础,获得更多回馈,进而有更多发现。

  当你看到被白雪遮盖了部分的路标,你可大致猜测出这个图片是什么及背后的含义。谷歌认为,机器也应该可同样做到。为此,谷歌将机器学习引入旗下的产品。谷歌高级研究科学家Greg Corrado告诉腾讯科技,“机器学习已经成为谷歌搜索第三大重要技术”。在Greg Corrado看来,人工智能是机器响应环境,而机器学习是可根据经验进行学习。谷歌真正感兴趣的是这两者的交集部分。“我们预测机器可预测不断重复同一工作”,然后使其对工作处理的更好。

  机器学习的基础实际上包括三个重要的部分。首先,需要找到“Model(模型)”,这就是在输入和输出中间的一个转换公式,也就是“机器学习”中的“机器”;其次,需为这个公式找到固定的“参数”,这是需要机器进行学习,并不断修正;最后,需要一个“学习”的软件,知道怎样调整参数、降低错误。不过,对机器的调整速度十分缓慢,这需要机器对至少上千万,甚至达到10亿G的案例进行学习。这也是,机器学习与人类学习的最大差别,前者需要大量数据作为“助推器”。

  尽管并未对外公布是不是该技术引入谷歌眼镜等硬件产品,但是谷歌母公司Alphabet执行主席Eric Schmidt证实,目前有一百多个团队在用机器学习技术,其中包括Youtube核谷歌搜索等。谷歌披露,机器学习提高了对Gmail垃圾邮件的识别率,及对语音转换文字的识别率提高了20%。谷歌在上周曾发布了自动回复邮件的功能。当用户收到新的邮件后,深度学习系统可判断是不是需要简单地回复。若需回复,系统会进入第二个判断,即怎样对邮件进行回复。这样的判断与识别垃圾邮件类似。

  事实上,机器学习的未来并不只是谷歌搜索所引发的业务。若计算机视觉比人更好,那么就应让机器来开车;机器对X光片的识别或许比人能够的出更精准的判断,而对时间顺序发生事情的判断对医疗诊断异常重要。Eric Schmidt表示,若选择创业,会进入医疗领域,因为这个领域的规模和机会。“我预测,会有很多的医疗机构可以利用我们的技术做正确的事情”。对于目前的开放策略,Greg Corrado称,机器学习需鼓励大家从不同的角度研究,即使在谷歌内部也有不同的方法,而学术界和不同的企业之间有很大的差异,谷歌也正在与 Facebook 和百度合作。而此次开源更可以为创业公司、学生,及粉丝爱好者打开机器学习的入口。

  原文链接:http://tech.qq.com/a/20151110/037655.htm