Blog中文搜索引擎简单比较

随着Blog的普及和流行,专门针对Blog的搜索引擎就显得越来越重要,尤其是今后预计会有越来越多的企业更加重视来自Blog的个人的声音,因此他们会产生强烈的追踪Blog内容的需求。

正因为Blog搜索有着重要的应用前景,国外不断涌现出新的Blog搜索引擎,其中比较常用而且支持中文的主要包括technoratiFeedstericerocketbloglinesblogpulse,还有推出测试后就不见踪影的Yahoo RSS Search。而中文Blog搜索引擎还处于发展的初期,无论是知名度还是用户的使用率应该都比较低,主要是八方Grasslandfeedsearch.netfeedss.comRssShow

我并不想在此做个详尽的中文Blog搜索引擎的测试,我也不具备这样搜索引擎详细测试的知识背景,只是想从几个简单的方面来判断哪个搜索引擎目前能够带给我最好的中文Blog搜索结果。

1、测试关键词的选择
本来想用keso作为关键词测试,但由于有些搜索引擎在结果中会根据URL收录keso自己的blog,有些不会,会造成搜索结果较大的偏差,而且keso这个词太集中在IT blogger上。而豆瓣在中文Blog圈中成功的口耳相传,是个不错的测试关键词。而且豆瓣虽然在IT blogger中更常被提到,但由于其书评与影评的特性,非IT blogger中也常会提及。但是用豆瓣作为测试关键词会有个问题就是搜索的结果中会包括豆瓣酱、郫县豆瓣或者豆瓣鱼这样的结果,不过这样也正好可以测试这些搜索引擎是否支持高级语法搜索。

2、豆瓣测试结果
由于不少人在提到豆瓣的时候很可能会使用douban来代替,因此在搜索中如果搜索引擎支持就尽量使用OR来包含两个关键词。

英文搜索引擎:

  • technorati:搜索结果935个,但是搜索结果中包括大量的豆瓣酱,不过technorati支持用NOT来去掉不希望出现的关键词,在去掉豆瓣酱与豆瓣鱼之后,搜索结果只剩下51个,而且大部分的结果都是MSN Spaces上的blog。利用technorati的tag进行搜索,标记豆瓣或者douban作为tag的blog共有8篇
  • Feedster:搜索结果301个,但点击到后面的页面会发现是空页,实际搜索到的结果是154个,而且不支持进一步的高级语法,不能去掉不相关结果和进一步缩小搜索结果。
  • icerocket:搜索结果1388个,同样包括不少豆瓣酱的结果,去掉这些不相关的结果后,得到714个搜索结果
  • bloglines:立志要做Blog搜索引擎的bloglines的搜索结果却非常让人失望,居然只能找到两个结果,大为出乎我的意料之外。
  • Blogpulse:得到27个搜索结果,搜索结果中不包含豆瓣酱的结果,但由于Blogpulse的特点在于追踪某个词在过去一段时间内在Blog圈中被谈论的频率,因此它的搜索只能涵盖过去3个月的结果。
  • Yahoo RSS Search:Yahoo RSS Search虽然没有正式推出,但我们仍然可以在Yahoo搜索的高级选项页面选择RSS格式类型,得到595个搜索结果,去掉“豆瓣酱”等之后的搜索结果是503个
  • 中文搜索引擎:

  • 八方:得到356个搜索结果,去掉“豆瓣酱”等不相关结果后得到243项结果
  • GrassLand:搜索“豆瓣”得到61个结果,搜索“douban”得到7个结果,由于GrassLand还不支持高级语法,因此无法进一步排除,初步目测大部分结果都是豆瓣网,预计清除不相关结果后搜索到的blog应该在50余篇。
  • feedss:得到186个搜索结果,去掉不相关结果后得到161个结果
  • feedsearch:搜索豆瓣得到30个结果,douban得到3个结果,也不支持高级语法搜索。
  • rssshow:得到63个结果,去掉不相关的之后得到62个结果,不过其中包括大量重复的搜索结果。
  • 综合中英文Blog搜索引擎的搜索结果,获胜的是icerocket与Yahoo,而且搜索得到的结果与其他对手相比并不在一个数量级上。而在中文Blog搜索引擎中,八方优势明显,其次是feedss

    3、搜索结果订阅
    绝大部分的Blog搜索引擎都支持RSS结果订阅,其中technorati采用的是添加到watchlist的方式,不支持RSS订阅,feedsearch与Rssshow均未提供RSS订阅功能,feedss同时提供了将搜索结果以javescript方式订阅输出的功能。

    4、其他功能
    icerocket与blogpulse都提供了以图形化输出反映搜索结果变化趋势的工具
    icerocket、Feedster、八方与feedsearch都在搜索结果中提供了目标网站的RSS以供订阅
    Yahoo可以将搜索的结果直接添加到My Web
    GrassLand将搜索结果分为文章与评论两类,但从评论中搜索到的结果似乎未必是blog的评论,困惑中。

    以这样简单测试的结果,无疑icerocket是目前功能最强,搜索结果最齐全的blog搜索引擎,而其他的中文blog搜索引擎与它还存在不小的差距。但icerocket的高级搜索不支持仅在中文blog或其他特定语言中搜索,这方面Yahoo的功能最强,如果Yahoo的RSS搜索正式推出,是否会成为Blog搜索的王者呢?那么Google呢?百度又是否会意识到对blog搜索的需求而尽早进入这一领域呢?

    Update:看来偷懒是不行D,加了比较结果表
    æ¯?è¾?ç»?æ??

    25 thoughts on “Blog中文搜索引擎简单比较”

    1. 很有趣的比较,不过如果能够将这些结果以表格或者图形来表现,或许更加直观。

    2. Pingback: Confluence: ??
    3. 你好,我通过python的一个matplotlib.pylab模块,把你的数据做出了一个柱状图。
      在这里:http://photos21.flickr.com/26085688_10f86a11f4_o.png

      不过暂时中文显示有问题,所以里面都没有用中文。

    4. Pingback: keso
    5. Pingback: 死马
    6. Pingback: 只说
    7. Pingback: Vingel
    8. 试用了以下TeeBit,搜索到结果的确比较丰富,虽然其中有少量的非Blog搜索结果,谢谢你的资讯。

    9. Pingback: BLOG-KEN
    10. Pingback: BLOG-KEN
    11. Pingback: BLOG-KEN
    12. Pingback: ITҲԸ
    13. Pingback: banerzhuan.com
    14. 临近狗年岁末,互联网依旧是热闹非凡。博客势头是丝毫不减。从奇虎进入社区搜索,随即推出博客搜索之后。Souyo便挂着“中文博客搜索引擎”的噱头进入博客搜索领域,在随后的短短的几个月,不经意间的冒出了Baidu博客搜索频道,博狗,网易有道等数家博客搜索平台。
      对于博客的搜索,毫无疑问收录博客更新文章的速度应该是一项重要的指标。
      单从这一点上来看,这四家博客搜索引擎,不分上下,从中都可以搜索到更新于几小时前的文章。不过未曾仔细分析过,对单个博客更新抓取的时间,这项指标除同系统软配置有关外,同硬件支持能力也有很大的关系,相信大公司在这方面会有一定的先机。

      一、搜索响应时间
      随手测试了下,网易的有道和百度的博客频道以及奇虎搜索在响应时间上,有着一定的优势。大多数的结果都会在0.05秒以下,博狗紧随其后在0.03-0.07区间内,Souyo则响应相对有些迟缓大致上会在1秒上下。

      百度 ★★★★★
      有道 ★★★★★
      奇虎 ★★★★★
      博狗 ★★★★
      搜游 ★★★

      二、搜索结果的准确性以及相关度
      对于用户搜索意图的判断,这几个博客都还没有做到非常的到位。“有道”虽然有“你要找的是不是”以及“博狗”的搜索查询推荐,但具体显现的作用不是非常有效。奇虎、博狗和百度的相关主题、相关搜索推荐倒是对用户查询有一定的帮助。输入“的士”“和服”,小小测试了下搜索效果。奇虎、博狗、有道、百度都能够非常清楚的对词性做出一个准确的判断。而Souyo则不具备搜索的基本核心功能,搜索“的士”“和服”都出现了些许混乱。

      有道★★★★☆
      博狗★★★★☆
      百度★★★★
      奇虎★★★★
      搜游★★★

      三、搜索数据量
      这项指标是常年积累的结果,虽然对于新兴搜索引擎有一定的劣势,但是相信不久就会在应用上达到一定的数量囤积。特别是搜索引擎作为中立应用,如果过于倾向于某些托管商的内容则有些顾此失彼。随便检索了一个词汇“刘德华”得到综合数据指标如下:

      奇虎★★★★★
      百度★★★★☆
      有道★★★★
      博狗★★★
      搜游★★★

      四、功能特性
      对于博客搜索来说,一些创新性的功能和应用应该是区别于其他搜索的一项重要指标。百度虽说是中文搜索领域的老大,但是这次博客频道似乎推出的有些仓促。可以说是毫无特色可言。除了搜索响应速度快之外,没有给人留下特别深刻的印象。

      博狗做的比较细致。在搜索的结果页面,不但给出了作者,博客名称,更新时间,更是提供了日志相关的“文章主题”,使得用户可以在最短的时间内对日志有一个初步的判断,以便用户找到感兴趣的日志。日志有各种RSS阅读器的订阅,在页面右侧还提供了写作关注度曲线,便于用户了解事件的发展趋势。其推出的用户管理模块也包含了许多易用性功能,比如快讯、趋势、博客绑定、搜索历史、搜藏等等。相信会对于将来新产品的推出和整合奠定一个比较好的基础。

      在同博狗的博客搜索列表类似的基础上,有道的博客中间页应该说做的比较有特色,对于博客以及博客作者的一些特性做了非常好的表现优化,比如博客评语、反向链接等等小功能都是让用户加深对于该博客认知的功能,博客发文时刻,发文长度,发文周期性都可以非常好的展示博客写手的习性,对于博客间的互动提供了一个比较好的选择方法。博狗与之相类似的写作曲线图也有一样的味道。

      Souyo在用户兴趣方面做了一些工作,有点搜索SNS的味道,但是表现方式过于硬性,走阅读的道路个人认为不是一个特别好的方法。

      奇虎的博客搜索经过了若然次改版,很多功能都是加了删、删了加,可以看出奇虎对于博客搜索并没有什么特别好的想法或者不是很重视,除了博客中间页做的有些新颖之外,表现能力中规中矩。可能是受大奇虎发展方向的制约所限。

      有道、博狗,搜游对搜索对象都做了区分。博狗的先睹为快,Souyo的Mini阅读,有道的“预览”,能方便地对日志RSS的输出进行阅读。并且三家都增设了博客信息档案页这一环节。从尽量多的将博客的信息浓缩在一个页面进行展示来看,目前做的比较好的当属有道和博狗。

      以发展的眼光综合的来看这五个博客搜索,相对而言,博狗和有道更具有博客搜索的特色性,也更加的贴近用户的搜索习惯。而百度仅仅是做为一个搜索的频道扩展,并未根据博客的相关特性做出调整。奇虎的深入程度有限,目前还没有什么特点。Souyo则明显的给人以小众的感觉,更多的是纠缠在用户收藏,博客推荐,未在搜索的本质核心功能上有所斩获。

      博狗★★★★☆
      有道★★★★
      奇虎★★★
      搜游★★★
      百度★★

      五、综合评分
      博狗★★★★☆(www.blogool.com)
      有道★★★★☆(www.yodao.com)
      奇虎★★★★(blog.qikoo.com)
      百度★★★(blogsearch.baidu.com)
      搜游★★★(www.souyo.com)

    Leave a Reply

    Your email address will not be published. Required fields are marked *

    You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>