search
百度为什么Hi
Friday, July 21st, 2006 | 搜志 | 14 Comments
百度空间的发布可以算是继新浪在去年推出Blog后,中国Blog圈最重要的一个事件了。百度空间凭借自己广大的用户群,依赖百度贴吧等互动产品的人气,打出草根牌,与新浪的名人牌对垒,对那些BSP们造成了不小的压力。正如布棉所说的“[这些巨头做BSP业务是]作为大内容战略的补充,他们可以不靠这个赚钱,但是却可以从中获得流量和内容,提高访问量的粘性。BSP跟这些大头对碰,死的会很多。”
从百度贴吧开始,到百度知道、百科,以及这次的百度空间,百度在一步一步地构建着自己的社区平台,对于一个搜索引擎公司来说,为什么对于自建社区这么有兴趣呢?这仅仅用社区在中国很火这样的理由当然是无法解释得通的。用百度自己的话来说,这是为了搜索藏在用户脑中的信息,这用来解释百度知道与百科,甚至贴吧都顺理成章,但作为推出空间的理由似乎有点牵强。
在百度推出空间时,有人认为百度已经与Google走上了截然不同的道路,“Google 非常明确地定位在数据营销,而 Baidu 则是社区。说得白话些,就是今后 Google 可能成为数据库的代名词,而 Baidu 是想把自己做成门户,做成新浪2.0。”但我不认同这个判断,当我们的目光被百度贴吧和百度空间所吸引的时候,我们却忘记了Google其实也早就有自己的社区(GoogleGroup)和blog(Blogger.com),甚至也有SNS(orkut)。
我不怀疑百度可能也眼热Myspace的成功,也想成为中国的Myspace。但我更相信百度的布局与其核心的搜索业务相关。一方面,百度将利用其搜索技术为其空间服务,实现对“人”的搜索,再用这个对“人”的搜索来完善它的社区搜索,这一点实际上在百度空间的一系列新闻稿中都已经有所体现。另一方面,百度空间还与搜索广告有关。百度空间与裁员门事件使百度力推的另一个产品“精准广告”被人忽视。通过对百度空间中的用户文章分析、用户对百度知道、百度百科以及百度贴吧的内容参与情况的分析,百度可以准确地得到每一个百度用户的兴趣点、爱好点以及特征,百度只是通过记录用户在百度上的使用行为,也不会受到很多隐私保护方面的质疑。在掌握了用户特征后,再利用cookie等技术手段,就可以在百度竞价广告以及百度主题推广中结合其特征进行广告投放,达到百度的“精准”广告的效果。此外,百度空间也为百度的主题推广提供了大量的可投放平台。
百度空间不仅仅有着想成为中国Myspace的野心(参考麦田的文章),而且也想借此让它的搜索产品与搜索广告也High起来,它的后续动作值得我们更多的关注。
Google Blog Search仍需努力
Friday, September 16th, 2005 | Around the Web | 5 Comments
Google居然在Yahoo事先张扬了几个月之后,领先一步突然推出Blog搜索引擎,有些出乎我的意料之外。Blog圈毫无悬念地大肆讨论着,目前比较一致的评价是速度快,主要指的是出搜索结果的速度快,zheng说感觉不太明显,不过与technorati相比的话,我也感觉速度的确要快一些。
但对于blog内容被索引的速度,则个人的看法各不相同,Rubel特别作了一个测试,而且选用的是Blogger.com的服务,但结果却是Technorati胜出。我昨天也分别测试了自己的两篇blog,Technorati都在很短的时间内能够搜索到。Google的结果却很奇怪,其中的一篇很快(大约二十分钟之内)就被索引了,而另外一篇却至今(超过18小时)搜索不到,而我的blog已经是设置成ping weblogs.com的了。chedong提示说需要到Google sitemap上确认网站,我准备看看确认后是否会加快被索引的速度。
而Google Blogsearch更让人郁闷的倒是搜索结果上的奇怪表现:直接用“未完成”作关键词进行搜索,得到的相关Blog中没有我的blog,全部是Spaces上的,估计是因为Spaces的PR比我的blog高,但如果使用高级搜索中的Blog标题搜索,却能够找到我的Blog,而且除了我的Blog之外,其余四个都变成了日本的Blog。
用“未完成 – Incomplete”进行标题搜索,得到我的Blog被索引的所有内容,一共25篇,包括了通过Feedburner聚合的网摘,显然Google爬取了我的被烧制过的Feed。但感觉有点奇怪的是按照Blogsearch的帮助说明,Google应该是从一些ping中心获取数据的,Feedburner聚合的网摘应该不会ping那些中心的啊。更奇怪的是如果使用URL搜索这个Blog的URL,却只能得到11个结果,其中有一个还是keso的网摘,最新的更新只是在9月3日。
而Google Blogsearch最让人郁闷的是其中的语言选择似乎形同虚设,无论你选择简体中文还是繁体中文,无论你搜索什么内容,都是得不到任何结果。
Google Blogsearch由于是利用ping中心来收集数据,因此明显缺乏历史数据,不知道今后Google会采用什么办法来补上这块。此外,还有个在高级搜索中不能选择的语法,利用link:URL就可以搜索到反向链接的情况,比如可以搜索到我的Blog的反向链接是37个。
就目前的情况而言,Google还不足以于Technorati竞争,当然以Google的能量推出这一服务,还是足以让Technorati感到巨大的竞争压力。不知道Yahoo的Blog搜索什么时候会推出呢,Blo.gs也已经被收购很长时间了,界面也泄露过了,Google也后发先至了,Yahoo还要等多久?百度会跟进吗?
另外,分别用BlogChina.com/Blogbus.com/Blogcn.com/blog.donews.com进行URL搜索,发现无论是被索引的数据总量还是最新的最新时间,都是donews>Blogchina>blogcn>blogbus。但即使是Donews,最新的被索引时间也只是9月14日,而且明显有大量的blog未被收录。看来一方面是Google自身改进自己的Blogsearch,另一方面,国内的BSP们或许也应该考虑如何优化自己的技术让Google更好地索引。