百度高级副总裁 王劲
9月3日上午消息,2014年百度世界大会今日在京举行。本届大会主题为拥抱移动时代,打造人与服务连接的移动开放平台。百度高级副总裁王劲描述了百度大脑如何将人工智能化为现实,包括语音图像搜索、BaiduEye、百度云计算中心以及直达号。
王劲描述了百度大脑如何将人工智能化为现实。比如,将花的照片转化成0101数据,会和存储在百度大脑中的样本进行匹配,通过一层层的算法进行比对识别,得到所有相关信息。
他指出语音图像搜索技术使得使用门槛大幅下降,并描述了语音图像搜索在百度上的应用场景。
在图像搜索中,如果用户拍下一束不知道名字的花,想了解更多信息,百度大脑将通过拍摄花,根据用户属性,通过百度大脑将学生推荐到百度百科,而对于养花者可以通过“直达号”推送到附近的花店。
在语音搜索中,如果用户听到一首陌生的歌曲,拿起手机可以告知是什么歌,普通听众将导入百度音乐听歌,而歌星粉丝可以通过“直达号”导入票务服务下单选座和支付。
在健康方面可以帮助用户预诊断,导向附近的医院,同时进一步帮助挂号、选择专家和就诊,连接患者和医疗企业。
同时,百度集成了视听说的能力,推出BaiduEye产品。BaiduEye主要功能帮助用户拓展视野,完全打通线上线下服务。它可以对眼前的视觉信息进行图像分析,并结合百度大数据分析能力和自然人机交互技术,为用户提供所见事物背后的信息及相关服务,帮助用户认知世界并连接服务。
此外,同时百度正斥资47亿建立百度云计算中心。它背后的软件为百度大脑的深度学习算法能力,而硬件包括整机柜、ARM和GPU服务器等。百度的深度学习模拟了最大规模深度神经网络。投资47亿建造云计算中心,将搭载超过300万服务器内核、存储4000PB数据。(娜拉)
以下为王劲文字实录:
谢谢明远的介绍,百度直达号,把我们日常的服务变得更简单、更智能,这种智能靠的是百度在后面的人工智能的技术和能力。刚才李彦宏也指出 来了,过去人们和计算机和电脑交流主要靠文字,今后将超过一半、超过50%的交流将会通过语音和图片,语言和图片的识别技术使得我们的使用门槛大幅度的下 降,我们今后能够主要通过图片和语音跟电脑交流。
中国有一句古话叫“百闻不如一见”,当我们来到一片美丽的花田,被眼前的美景倾倒,拿到手机拍下照片,但是我们不认识这个花,过去只能问朋友或 者到图书馆查阅,更多的时候我说我不认识我这朵花,就只能说算了,今天我们可以非常轻易的到“百度大脑”,“百度大脑”可以告诉你这是什么花,百度大脑是 个个性化的,如果我是学生,可以到百度百科告诉我这个花的是什么名字,也可以知道这个花相关的属性,如果我是一个喜欢养花种草的人,“百度大脑”可以通过 百度直达号帮我找到离我最近的又有这个花卖的花店,让我可以非常轻松的下单去买到我喜欢的花。
所以我不仅仅可以通过直达号,“百度大脑”这个技术,知道花的名字和信息,还可以得到服务。对于这个花店来说,过去我只能靠到我店里头来的人, 我才能把花卖出去,现在整个大自然都是我的橱窗,一朵小小的美丽的花朵就可以刺激起人们当时对这个花朵的购买欲望,使得我能够非常好的、非常准确的在那个 时刻,当人们有了这个购买的冲动的时候去捕捉到这个商机,所以“百度大脑”使得我们能够在最合适的时间、地点找到最合适的人。
不仅仅我们可以通过图片找到这个商机,百度的语音识别能力在最近几年也有了大幅度的提升,现在我们中文语言的识别能力已经做到全球最高了,当然 英文、法文这些我们还有一些差距要去追赶,但是中文正常的交流,大家可以去尝试一下我们的语音输入法、我们的语音搜索都做的现在已经是可以接受了。
我们不仅仅可以听话,我们还可以听歌。在街上如果你听到一首非常好听的歌,你只要拿起手机,“百度大脑”就可以告诉你,这是什么歌,这是谁唱的 歌,最近陈亦迅刚刚出了一首“稳稳的幸福”,非常好听,如果我是一个喜欢音乐的人就可以通过手机直达号到音乐下载网站就下载这首歌,如果我是陈亦迅的粉 丝,就可以通过百度直达号查找,然后原来再过两天陈亦迅就要到我所在的城市开一个演唱会,我就可以通过直达号找到对应的票务公司下单,并且选定好座位。
“百度大脑”不仅仅可以帮助我们做更好的满足我们的娱乐相关的诉求,让娱乐的诉求可以变得更简单、更便捷,我们还可以帮助一些我们生活中更重要 的事情,现在非常非常多的行业都正在拥抱互联网,我们最近跟医疗行业有了很多的合作,在这里我们跟祥云医院有了一个初步的合作,就是在网上提供皮肤病的预 诊,过去一个新生的小宝宝皮肤出了问题,年轻的父母会非常焦虑,他们不知道这个问题有多大、多严重、多紧急,也不知道应该找谁,他们应该做什么样的处理, 今后只要很简单的用手机拍个照,把患病的部分上传到百度,百度就可以给你一个预诊的诊断,说大概是什么问题,今天预诊的准确率已经达到93%了,但是还远 远不够,因为不足以成为一个正式的医疗的结果,只是一个预诊,帮助我们帮这些年轻的服务去了解他们现在应该做一些什么初步的处理,也能帮助他们后面去找到 谁、什么样的专家来帮他们治这个孩子的问题。所以我们能够把一个线下的服务和患者对接起来,我们今后希望能够跟越来越多的医疗企业一起合作,把中国的医疗 水平提高到更高的层次。
刚才看到我们听的能力能够帮助我们的用户,我们看的能力也能帮助我们的用户,也能帮助我们的商家,如果我们把视、听、说的能力集成在一起,将为 我们的生活打开一扇新的窗子,百度现在推出了一个新的产品,本来我们是准备今天宣布的,但我注意到,昨天晚上已经有些信息,也就是一款产品集成了视听说能 力的叫BaiduEye,我们一起来看一个视频。
这款集成了视听说能力的设备,不仅仅可以给我们的顾客、还可以给我们的服务员,设想一下,如果我是一个餐馆的服务生,我看到一个人走进我的餐 馆,BaduEye能够马上告诉我这是一个新顾客还是一个老顾客,如果是一个老顾客,他过去已经在这里获得了什么样的服务,设想一下,当我把我的菜单递给 这个顾客的时候,我对他说,“陈先生,上个月你来我们店点了一道红烧肉,今天我们有些新的菜品你要不要尝试一下?”这将带给他什么样的全新的体验。所以大 家可以设想一下,通过这样一个小小的设备被将为生活打开一扇什么样的窗子。
“百度大脑”能够做这样新的事情,它到底是由什么做成的呢?
“百度大脑”看的见的部分,有服务器和云计算中心,但更重要的是他看不见的那部分,那个被称为深度学习、人工智能的算法。很多人都知道,百度是 一个技术比较领先的公司,都知道我们的软件做的很漂亮,尤其是在互联网上面,但很多人不知道,百度在硬件上面也有非常多的创新,百度是全球第一个最大规模 的使用ARM服务器的公司,我们的工程师设计了这个服务器,我们也是全球大规模的GPU服务器在深度智能算法和人工智能算法的公司,当我们把普通的CPU 服务器、ARM服务器和GPU的服务器整合在一起,构成大规模的集群,把它用在人工智能的算法就是深度学习算法的时候,达到了整个计算的高度和计算的能 力、存储的能力达到了一个新的高度。
我们用这个集群打造成了世界最大规模的深度学习神经网络,所谓深度学习和过去传统的区别在于,过去的机器学习只是一味扩大他的数据规模,但是他 的层次只有一层,而深度学习的算法更好的模拟人类大脑这个思维和学习的过程,使得他能够处理更复杂的事务。我们深度学习的网络规模以后达到百万级的连接, 这是世界最大规模的深入学习神经网络。
百度拥有大大小小20几个云计算中心,就以我们今年6月30日刚刚落成的云计算中心为例,这个云计算中心我们投资47亿,我们今天正在北京建设 一个比这还大的云计算中心。这个计算中心大家可以看到,他的外观美伦美奂,就像一个景点一样,但是更重要的是他里边,他里边搭载了超过300万颗服务器的 内核。大家注意到,我没讲服务器,因为这里头大部分的服务器已经不是一台一台的存在了,我们重新进行构成和设计,整个机架就是一个大服务器。他能够处理和 存储的数据量已经超过了4千PD,百度云计算中心的设计和运维能力已经多次获得了国际国内的大奖,我们的能效达到了国内最好,在全球也是领先的一个水平。
我们的工程师在这个数据中心里头7天24小时的值班,我们的保障是全年99.99%的高可靠性,这些都保障百度大脑、百度的搜索能够提供长久的 稳定的服务。那好,大家会问,你说的这些硬件、软件的能力,百度大脑到底是怎么帮助我们去实现这个人工智能的?这是很难的问题,我尝试用解释花朵的例子来 解释一二。当我们用拍一个花的照片,这个花的照片就会被转化成0101的数据流,被输入到百度大脑,百度大脑会拿这个跟我们存储在中心里面的海量的数据进 行比对,经过一层一层的识别,经过整个算法和比对之后知道原来这是一朵花,这个花的名字是什么,同时我们也能够找到跟这个花相关的这些所有的信息,这是百 度大脑模拟人脑进行思维、思考辨认自然界的一个过程。
当我们有了这样的一个百度大脑,有了这样的逻辑思维以后,当我们把他跟我们的大数据结合,能够找到以前我们不知道的规律,通过这些规律我们能够 尝试做一些对于未来的预测和预判。今年6月我们和全球另外四家高科技的公司做了一个小小的竞赛,就是对世界杯的结果进行预测。这些公司里面有,谷歌、雅虎、微软,还有投行的高盛,很多人想问高盛为什么参与到这里面来,因为高盛喜欢预测股票的趋势,所以他们投入很大在预测的软件上面和人工智能上面。
竞赛开始的时候,因为谁都不知道结果,我也非常紧张,这是一个在公平环境下大家技术上面的比拼,今天我非常欣慰的告诉大家,百度作为唯一的中国 企业,在这场比拼中间我们获得全球第一的成绩,我们的预测结果是全球最高的。我看到微软的张亚勤先生在底下笑,对不起,这次我们暂时的领先了,希望我们以 后良性的竞争。
当我们把百度大脑的技术能力和百度的大数据拿出来一起和中国疾控中心进行整合,我们现在已经能够提供流行病的预测,希望通过我们的努力和还有百度的大数据,帮助中国疾病的预防和控制提高到一个新的层次。
不仅仅这些,我们整个大数据系列、大数据的预测系列已经有8个产品上线了,我们同时还有一个旅游的预测,我们能够预测两星期内中国各个城市他们 的旅游热度,这样能够帮助我们的旅游者更好的规划他的旅游路线,我们也能够帮助我们的相关单位做更好的宏观调控,大家有空可以到百度预测上去看一看。里头 还有一些宏观经济的“生产者指数预测”等等等等,大家可以去看下。
当我们有了这么多的数据,当我们又有了这样的人工智能,我们还能做什么?我们还能做一些以前只敢想而又做不到的事情,我们通过网友上传的海量照 片,我们用它来重构一些热门景点的三维模型,当然今天我们还只能限制在热门景点,因为只有热门景点大家拍的照片才足够,我们从各个角度没有死角的地方都有 照片,我们通过百度大脑的能力把一些重叠的地方去掉,然后重构出一个完整的三维模型,希望有一天我们大家都能够在电脑上面到这些景点进行三维的虚拟旅游。
这是用故宫的太和殿为例,我们大家看一段视频。
(播放视频)
当然大家可以看到,这个产品我们还在打造过程中,等到正式产品推出来以后可以变得更平滑、更顺畅。当我们得到越来越多的图片之后、照片之后,我们还可以把它更多的景点纳入到这个三维旅游的规划中来。
无人驾驶技术,是人工智能的集大成者,它既需要我们有很好的外界的感知能力,又要有很好的反应和决策能力,又要有非常快速的执行力,这样才能做到无人驾驶。
我们大家一起来看一个视频。
(播放视频)
把这种人工智能的能力放在四个轮子上面,它就叫无人驾驶汽车,放在两个轮子上面叫无人驾驶自行车,放在一堆翅膀上面就是无人驾驶飞机,放在一个 人形的机器里边,他就是机器人。机器人是制造业皇冠上的明珠,百度希望通过我们在这个技术上的不断努力,能够为人们摘取这颗明珠。为此我们不断加大在人工 智能方面的投入和努力,两年前百度成立了自己第一个研究机构IDL,就是深度学习研究院,今年5月我们把这个研究院进行了扩大,成立了百度研究院,下辖三 个实验室,这三个实验室都专注于大数据和人工智能的研究,而这个的成功最重要的取决于我们能够吸引全球的人才来帮助我们。
我认识这么一个人,他在香港长大,在美国求学,今天他不远万里来到中国,他不是白求恩,他是吴恩达,现在有请百度首席科学家吴恩达先生。
电话:0371-67970699
邮件:zzipa0371@163.com