|
刘骏:首先感谢互联网协会和互联网实验室给大家组织了这么一个活动,所以大家也一个互动交流的机会。我今天做一个小小的演讲,希望能够抛砖引玉,能够引发大家的思考,让大家一起互相讨论一下。
我个人认为搜索引擎在中国和全世界还是有很广的发展前途,大家今天有兴趣聚集在一起,我们可以有一个讨论的机会。
其实这个PPT我以前在外面讲过一次,可能信息稍微有点旧,不过非常符合我们今天要讨论的内容,所以我特意把这个PPT拿过来再讲一遍,主要是起到抛砖引玉的功能。
首先我想讲一下什么是搜索引擎。大家可能认为搜索引擎主要是安一个搜索词进去,然后结果出来。但是,实际上搜索引擎正在往一个方向发展,它在搜集全世界各式各样的信息。这是一个地图,这个地图上的信息,Google的宗旨实际上就是要整合世界上所有的信息,然后让大家一起来享用。那么整合所有的信息就包括很多方面的因素,所以我们提出这样一个观点,就是多维搜索,从各个方面搜集资料满足用户的需要。用户从一个点进入我们的搜索引擎,把所有的信息都可以整合在这个下面。所以我们提出这样一个观点,就是要用多维从各个方面整合我们的搜索,那么怎么样是一个多维整合的搜索呢?我们从这么几个方面来看。过去的搜索还是很简单的事情,如果你们可以看到,这是我们大概6个月以前的图,只要你打一个关键词搜索出来的结果很简单。Google的特性是功能非常单一,如果你搜索一个词,他肯定给你一串网页的结果,而且结果也非常单一,是网页的结果,没有各种各样的多样性。更重要的是,他没有各种各样的功能的整合。
那么新一代的搜索,我们在多维搜索的情况下,我们可以把各式各样的信息整合在一个搜索方式内。我不知道你们最近有没有访问Google的搜索引擎,如果你访问的话,你会发觉除了我们一些简单的搜索结果出来,上面会有附加的各式各样的信息,会经常给你一些小小的惊喜。但这不完全是网页的结果,比如说你搜南方基金,会把在南方基金下面所属的各种各样的信息都列在那里。比如说昨天的节气是春分,如果你打春分,会国家你昨天是什么样的节气,为什么叫春分,各种各样的信息都整合在一起。所以你可以经常试一下,会有很多的多维的信息整合在里面。
那么要做到多维整合搜索,从几个方面来看?我们先看一下有几个方面的多维。第一个是地域上的,大家都知道Google的搜索是全世界范围内的,当然我们在中国搜索的话,我们不会把土耳其的结果放到中国来。但是你真的要找土耳其的结果,我们会有一个地域的优化,但是不是地域的限制,这个是蛮重要的观点,就是怎么样优化地域。甚至在中国也碰到这样的问题,比如说你在上海售房地产,如果你显示的是北京的房地产的信息,那么用户就不是太感兴趣。
第二个是在时间上的整合,实际上互联网现在有一个比较大的特征就是变化非常快,信息流量非常大,那么搜索引擎一定要按照实时及时地整合各种各样的信息。那么怎么样人搜索引擎变得更加动态,这个也是比较困难的。
第三就是说我们各种各样的媒体,比如说可以是有视频的,或者是音乐、语音的搜索,这个我们也在不断地整合。
最后就是刚才姜老师也谈到了,就是网上和网下的整合,就是你有各种各样的渠道,有一些不一定是网上的信息,它也整合到一起,让大家来共享。
那么要做到整合,其实难点有几个。一个就是说你要有一个比较智能的,就是你要知道什么时候地域比较重要,什么时候时间比较重要,什么时候媒体比较重要。所以这个方面你要做大量的数据分析,然后才能做到整合,所以其实这个上面有两个难度,一个是你要有智能化,第二个是数据量比较大你要整合。这方面我们还是有很多的发展空间,这方面我们还是有很多的工作可以做,不像有些人认为搜索引擎现在已经发展到头了。
现在我稍微讲一下地域的问题。比如说我们在亚运会期间,如果你搜索多哈,在那个时候你搜索多哈,可能人家并不想主要多哈的旅游情况,机票多少钱,那个时候可能人家想知道关于亚运会的情况。那么怎么把多哈和亚运会联系起来?这需要有一个地域的整合的过程。再比如你搜索小雪的时候,如果在中国搜索小雪,你可能是要了解中国的节气,我们会有一些非常有中国特色的东西。再比如说你查找孔子,即使你打的是英语,但是你想知道的是关于中国的新闻。我们一开始是有一个全世界的优化,现在可以做到国家,最后可以做到城市或者是小区,各种各样的地域优化,这个有很多的工作可以继续往下做。
刚才说了一个地域上的优化,也可能你想知道别的地方发生的事情,这个需求也是很大的。我们Google现在在地图和网页的搜索上做了很大的工作,其实就是为了把地域信息怎么样整合到普通的网页搜索上。比如说这里大家看到的是一个普通的网页搜索,这是跟地图和卫星照片怎么整合起来的,这个也是我们现在在做的一个工作。那么我们跨越地域限制的还有一个是要促进地域之间的交流。大家知道Google有一个非常好的机器语言翻译的工具,不知道大家试用过没有,现在的流量还在上升。左下角的图可以说明为什么Google机器语言翻译是全世界领先的,这个图表示Google有一个比较大的优势是因为我们有海量的数据。下面的数据是说每翻一倍的数据量翻译的精度就往上提高,到现在为止还没有把所有的数据整合起来,如果所有的数据都整合起来,那么翻译的精度会大大提高。比如说你是学习语言的,老师会要求你多背一点书,在机器上也是一样的,你多见了各种各样的翻译效果就会增加,在这方面我们也做了非常好的工作,在世界的机器翻译里面Google一直是名列第一的。
下面我再谈一下刚才我谈的时间的纬度。还是举卡塔尔的例子。如果在亚运会的时候搜卡塔尔,我们会有非常快的信息,会告诉你中国队最近在卡塔尔上的战绩怎么样。我们甚至可以几个小时之内把所有的结果都显示出来,我不知道你们有没有试过。再比如说地震,大家知道在去年12月26日左右,台湾发生了一次地震,把光纤震断了。Google是国外几个大的互联网网站中唯一一个没有断线的,如果那个时候你试一下Google的搜索,搜查地震,我们在短短的几十分钟之内,台湾的地震就会有一个结果,会告诉你台湾地震了,光纤震断了。更有意思的是,到了1月份你再去查地震这个词,那个时候是为什么呢?据说上海传说有一个地震,那个时候在几个小时之内,你查Google会发觉上海地震是一个谣言,所以我们这个也可以把辟谣的工作做得非常快。
但是不是所有的人都需要很及时的东西,在这里我可以给大家看,Google可以收集非常非常早的信息。这里有一个例子是阿波罗登月,这都是69年的事情了,那么你想知道阿波罗登月的时候《华盛顿邮报》是怎么报道阿波罗登月的,我们这里面都有,这个从时间的跨越来说是非常大的一个事情。
下面讲一下跨越媒体的限制,我们Google有video还有视频上载,还有各式各样的比如说电视、图像我们都在不断地往下整合。这个方面的工作在美国已经开展得比较轰轰烈烈,中国我们还在继续努力,把这个东西做得更好。
那么跨越渠道的限制我可以再讲一下。我们知道有一个互联网连接到手机上的工作我们也在继续加强,怎么样把手机和互联网的互动不用受到PC的限制。从另外一个角度,是不是说往下的东西?这个图显示,如果以前要找一本书可能要跑到图书馆找这个书,现在可能不用,你可以到Google的书本搜索,这个在中国马上要更加加强推广。我们跟几个合作单位签了合同,越来越多的书会上线。刚才讲了几维的搜索,正因为有刚才这么多挑战,现在搜索面临一个很好的创新机会。挑战在哪里呢?正如刚才各位所说的一个是海量数据,你现在考虑的越多,带来的就是要把数据存起来,这是比较大的问题。在这方面,Google也有一个比较大的优势,Google在世界上有最大的数据存储库。第二,光有数据堆也没用,必须有人工能力。比如语言处理得能力,或者相关能力处理起来。比如前段时间如果你搜索《雷雨》,就会有黄金甲,因为黄金甲也是按照《雷雨》改编的。那时候黄金甲上映的时候搜索《雷雨》,黄金甲的结果也会有,这就是智能化。Google也做了很多的基础研究,我们在各方面都在继续努力。
Google有什么优势呢?Google有比较大的优势一个是硬件构架。比如海量数据,这个照片是某个数据中心的情况,Google在数据中心上有非常大的优势,我们有最大的机群。第二是软件的构架,也是比较大的优势,一个是大规模数据存储的系统,世界上最大的存储系统。还有一个是INDEX,人工智能。
最后Google各方面的优势,一个是技术和创新一个是规模还有品牌,还有企业文化。我这里讲四个例子大家都比较容易理解,品牌理解不是那么明显,其实Google在品牌上还是非常重视的,比如我们在公正性上面,Google因为在全世界影响非常大,对很多用户会有比较大的影响,为了我们的品牌,做了非常大量的工作,就是说保证绝对公正,所有结果都是按照机器排出来的,任何手工排的都缺乏公正性。
今天我基本上讲这些,欢迎大家多提问题。
|