Tag Archives: search engine

中文blog搜索引擎再比较

去年7月的时候曾经写过一篇Blog中文搜索引擎简单比较,半年多过去了,Google推出了自己的blog搜索引擎,Baidu还没有这方面的动作,Technorati在不断地改进,在国内也出现了奇波、中客、博搜等新的中文blog搜索引擎。

我选取了昨天blog圈的一个热门话题“google 黑板报”再进行一次简单的搜索比较,不过从结果上看,国内的blog搜索引擎不但没有改进,反而在退步。

测试评价的标准是收录的相关文章数量以及是否收录黑板报CWR以及keso的三篇相关文章,分别判断其对blogger.com, 国内BSP以及独立域名Blog的收录能力,当然这三篇文章未必具有代表性,只是作个很简单的判断。(update:本来以为黑板报是使用独立域名的blogger.com服务,不过刚才看看可能不是)

    先看几个主要的英文搜索引擎

  • Technorati:得到503个结果,不过剔除非相关结果后,实际搜索结果约70个,三篇文章均有收录;
  • icerocket: 得到61个结果,剔出非相关结果后,实际结果50个,似乎未收录黑板报与keso的文章;
  • Feedster:仅得到3条结果,Feedster这样的搜索能力要到中国拓展市场也不是什么好事啊,呵呵;
  • Google Blogsearch:得到125个结果,实际相关结果约85个,三篇文章均有收录;
  • Yahoo Blogsearch:上次比较中使用的Yahoo RSSsearch不知何故这次出不了任何结果,是用Yahoo Blogsearch得到6条结果,其中一条重复结果,全部相关,收录了keso以及CWR的文章。
  • 上次测试中还比较过的Blogline、Blogpulse,由于搜索效果差,就不一一列出。

    再看几个中文搜索引擎服务的结果

  • 八方:这是上次测试中表现最好的国内搜索引擎,但这次却只有5条结果,而且全部为不相关结果,几乎都是spam blog;
  • Grassland:得到7条结果,全部相关,但三篇文章均未收录;
  • Feedsearch.net:得到11条结果,全部相关,但三篇文章均未收录;
  • Feedss:得到10050条结果,但其中没有任何相关结果;
  • Rsshow:无任何结果
  • Booso:出错(Service Temporarily Unavailable);(Update: Booso得到数万条结果,但没有任何相关结果)
  • 号称最大的blog搜索引擎中客网:得到7条结果,无任何相关结果;
  • OKRSS:无任何结果
  • 李安科的奇波:得到6条相关结果,全部相关,三篇文章均未收录
  • 七搜八搜:得到大约10条相关结果,三篇文章均未收录

比较的结果,很明显是Google Blogsearch和Technorati胜出,上次的赢家icerocket开始落伍了,而国内的所有服务商全线溃败,而且输得非常彻底。Blog搜索有没有独立的商业模式,我们姑且不论,但两次比较的结果至少说明要做好blog搜索引擎并不容易,甚至由于其实时性以及大量更新的特点,要比普通的网页搜索更难做好。或许我们需要等待百度的blog搜索引擎?

如果还有哪个中文blog搜索引擎我漏掉的话,欢迎大家指出,我再补充进去。

ps. 由于technorati、Google Blogsearch以及Icerocket的收录结果在不断更新,所以你们再去搜索的时候结果可能与我作测试的时候有所不同。
再ps. 大家可以玩玩这个中文搜索引擎比较的小游戏

2006年我最希望看到的6个中文网络服务

2005年在中文互联网中出现了许多优秀的网络服务,但与国外相比,我们还有很大的空间可以去发展,在即将到来的新的一年,我最希望能够在中文互联网中看到下面的这六种网络服务:

1、中文Blog搜索:虽然Technorati与Google BlogSearch以及IceRocket这些现在流行的Blog搜索引擎都已经能够进行中文Blog搜索,而且搜索的结果也比现有的这些中文Blog搜索引擎表现得更好,但他们对中文Blog的收录与索引数量还很不足够,而且也不时存在中文乱码等问题,很想在2006年能够有表现更好的中文Blog搜索引擎出现,不仅仅能够进行关键词、Tag、反向链接这些常规的搜索,而且能够学些Openmind等其他Blog搜索引擎的新特性,推出能反映Blog特点的搜索产品。无论是来自改进后的Technorati,中文版的Google BlogSearch还是其他服务商。今天百度公布了中文Blog的一些数据,是否意味着百度即将推出中文Blog搜索引擎呢?

2、中文的MemeorandumMemeorandum显然是一个有一定技术含量的网站,否则我估计国内也很早就有模仿者出现了。Memeorandum其实同样也是一个基于搜索的服务,而且能够很好地体现Blog是对话的这一特点,非常期待能够有类似的中文网络服务出现。。

3、中文WritelyWritely无疑是在线协作文本编辑工具中的佼佼者,也是zheng选出的2005年最喜欢的网络服务之一。为什么WPS不做一个类似Writely的工具呢?

4、Wiki地图与Wiki黄页:希望地图Wiki化的想法在很早以前就有了,但国内一直没有这方面的服务出现。51ditu倒是提供了开放API,在国内的地图服务中率先迈出了这一步,而且在其搜索结果中也会发现有部分信息是由用户提供,可以说也提供了少量的wiki特性,但还很不够;Wiki黄页的价值我想也可以很容易地想象到,或许YellowWikis会是一个比较好的模仿对象(事实上,YellowWikis已经有提供中文版)。

5、社会性搜索/Squidoo:虽然我也与Google一样相信性本恶或者说相信人性的自利性,但我想在搜索中引入更多的人的群智的力量也仍然会是未来搜索引擎发展的一个重要方向,2005年出现的WinkRollyo等多个社会性搜索服务都在进行这方面的探索,而Squidoo虽然方向有所不同,但也可以看作是为了实现同样的目的而采取的另外一种的方式。

6、智能化RSS阅读器/个人门户:国外已经出现了几种智能化的RSS阅读工具,能够提供根据阅读习惯自动调整RSS内容出现的顺序等功能,这对于每天需要处理大量信息的人而言的确是非常有用的工具,希望无论是阅读器还是个人门户都能够有更多的智能化功能,帮助我们实现更好的知识管理。

Yahoo以Tag对抗Google

上次是从web2.0的角度分析Yahoo收购美味书签事件,这篇尝试从Yahoo的角度来分析。

Yahoo对del.icio.us的收购的确事出突然,但可以说是意料之外却又是意料之中。说它是意料之中,是因为这项收购延续了Yahoo对Tag的重视,以及希望利用人工筛选后的Tag来对抗Google的机器算法的思路,但这又是意料之外,因为Yahoo的My Web2.0在很大程度上就是del.icio.us的竞争对手,为什么还需要再去收购美味书签呢?

与Google不同,Yahoo创始的时候就是靠人工对网站进行分类后提供目录及搜索的,或许Yahoo一直具有这样的人工组织网络的情节,只是网络内容的爆炸性增长使得Yahoo不得不放弃这样的努力,这时Google独特的Pagerank机器算法开始占据上风。而Flickr和del.icio.us的兴起使Yahoo突然发现了自己赖以与Google竞争的新武器:Tag。利用用户的积极参与以及对内容的tag标注,Yahoo重新有机会实现自己那个利用人工来组织网络和搜索的梦想。

不过利用人的力量不仅仅是Yahoo的想法,Google同样也在朝这个方向努力。但Google毕竟是一个以技术为主导的公司,Google从爬虫到Sitemap到Google Base以及Analytics,也是在利用用户来为自己的搜索提供更好的条件与参数,但从本质上,Google仍然是以技术手段来处理人的这些参与价值。在某种程度上,Google是相信人性本恶(或许正因为如此,Google才会将不作恶作为原则之一),而Yahoo则相信人性本善。

Flickr与del.icio.us作为在Tag应用上最成功的两个网站,为网络搜索及网络信息的组织创造了新的可能与机会,同时也在很大程度上推动了Tag的发展,使Tag几乎成为web2.0的标准配置之一。在这种情况下,Yahoo分别将它们收入帐下,也可以说是顺理成章的一项并购了。而Yahoo对Flickr的收购也的确收到了好处,像Business2.0的那篇文章标题所说的“Yahoo的Flickr化”。

今天没时间了,下次再续,看来我要把Yahoo的收购事件写成一个系列的分析了,呵呵。

Blog排行是“乱”还是“百花齐放”?

我昨天认为“Blog的排名现在有点乱”的观点,Zheng不是太赞同,他觉得“我倒是认为这样的百花齐放应该更多。因为排行可以有不同的角度,反应不同的情况”。百花齐放我是赞同的,但我的感觉是现在出现的这几个Blog排行,他们基本上都是依据反向链接的数目作为排行的依据,但大家得到的排行依据(链接数目)却有很大的区别,所以才显得乱。

Zheng比较详细地说明了目前主要的几种Blog排名方式,包括Feedster/TechnoratiBlogrollingBloglinesPubsubBlogpulse。其中除了Bloglines的订阅排行外,其余的排名依据都是链接数目,只是大家的取样范围和爬虫的能力不同。

Feedster与Technorati是最为类似的,但双方的数据已经有很大的差异,看zheng昨天的文章或者是去详细比较他们的排名榜都可以清楚地了解这一点。本来想用Bloglines的citations功能比较一下这两个排行榜前几名的blog在bloglines中的结果,但bloglines的反向链接搜索功能现在用不了,不过按照以前zheng等人的比较,估计真要按照bloglins的结果来作个排行榜,结果又会有不同。Icerocket不久前也推出了反向链接搜索功能,估计在不久以后他们也会有自己的基于反向链接的Blog排行榜,会不会让局面更乱,到时候也可以看看。

Pubsub的LinkranksBloglines toplinks同样都是依据来自blog的反向链接作排名,但因为Pubsub的排名是依据域名,而Bloglines是根据某个具体的URL,因此结果差异巨大,二者之间没有直接的可比性,可以看作是两个不同的产品。但从这两个排名都可以发现,在榜上位居前列的有不少是传统的媒体网站,比如NY TimesWashingtong PostBBC等,也就是他们在取样上并不是限定于Blog中的链接,因此并不能算是个严格意义上的Blog排行榜。

我倒是比较喜欢Blogpulse的这个profile功能(可能是因为只有在这里才能够查到我的blog的排名吧^_^),一方面它只考虑最近30天的数据,但又不像Pubsub那样只取一天的数据,更可能反映出blog的动态变化,二来它区分了来自排名较高的blog的链接,而且还有变动的趋势图可以看。

Blog排名的算法当然最好能够百花齐放,既有依据反向链接的排名,也有依据订阅量的排名,还可以有每日的话题排名(就类似现在的Pubsub或者bloglines的toplinks),或者是综合排名,这样多种多样的排行榜才会更有看头,也更有意思。不过目前的情况的确有点乱,我也并不指望Feedster和Technorati的排名会基本上完全一样,毕竟不同的搜索引擎总有不同的强项,就算是Google和Yahoo的搜索结果还存在差异,只是大家现在的产品总给人一种不太成熟的感觉。但乱总是新产品在创新和发展中的必经阶段,至少“乱”总比“没有”要好得多。

Update:
刚才看到这篇Blog,的确现在的排行榜都太综合了,没有分类的排行榜的价值始终有限。

Blog反向链接搜索存在的问题

Blog的反向链接搜索在Blog搜索中占有重要的地位,Technorati敏感地抓住了Blog搜索的这一特点,很早就推出反向链接搜索(包括基于反向链接的blog排名)以及Tag搜索两个重要的创新功能。尽管Technorati的搜索表现并不太理想,并经常被blogger所批评,但却丝毫没有妨碍Technorati的这两个创新功能逐渐开始成为行业的标准之一。

而更多的竞争对手也开始重视反向链接搜索,并纷纷推出相关的功能,包括pubsubblogpulseicerocket等等,当然在这一领域的竞争还包括几个主要的在线RSS阅读器bloglinesnewsgator,同时也出现了专门进行反向链接搜索的Meta搜索引擎,比如TalkDiggerKBCafe。但是,目前的Blog反向搜索引擎在实际的使用过程中由于Blog本身的特点,还是存在着一些亟待解决的问题:

1、在搜索结果中包括本站链接:按照我自己目前的使用经验,在Bloglines的搜索结果中就包含着较多的本站链接,这在很大程度上与我在Blog中使用的Tag有关,由于每篇blog内容的每个Tag都对应着一个相应的本站Tag搜索链接,因此我的每篇Blog都存在本站的站内反向链接,造成Bloglines搜索结果包含大量的站内结果。
2、在搜索结果中包含网摘链接:由于FeedBurner的普及应用,因此许多Blogger都在Feedburner烧制过的Feed中包括了美味书签链接,而365key也能够方便地将昨日收藏加到Blog中,因此在多个反向链接搜索引擎的搜索结果中都包含着大量的美味书签或者365key的网摘链接,从我的“做笔记的五种方法”这篇Blog在Bloglines中的反向链接搜索结果就能够明显地发现这个问题。当然,被网摘收录对于Blog搜索来说也会是个重要的组成部分,但网摘链接与Blog链接毕竟具有不同的意义,个人认为在反向链接搜索中应当尽量过滤到网摘搜索的结果。
3、在搜索结果中包含blogroll结果:这最明显地出现在Technorati的搜索结果上,由于Spaces的用户自定义列表内容也会出现在RSS中,因此对于主要基于RSS的反向搜索结果中也往往会出现Spaces的用户自定义Blog友情链接。在Blog反向搜索结果中如何将Blogroll有效地排除在外,也是各大服务商所需要努力的方向。

尽管目前的Blog反向搜索存在着这些问题,但毕竟已经能够成为Blogger们Ego Surfing的重要工具,在中文的Blog搜索引擎中目前还没有出现合适的反向搜索工具。国内对于Blog的注意,很大程度上还集中在BSP领域,而对于整个产业链中的其他领域,例如重要的搜索领域,还缺乏足够的重视和创新,八方等中文Blog搜索服务商们应该尽快迎头赶上。

Blogpulse的Blogger排名

在Blog搜索引擎中引起众多Blogger最多关注的应该算是Technorati,虽然它的功能表现并不理想,但却一点都没有妨碍它在Blog圈子中的名声,而Technorati的Tag搜索以及Blogger反向链接排名这些创新也的确造就了它今天的声誉。

但随着Blog搜索的重要性日益显著,更多的竞争对手都开始窥视Technorati所占据的这两个重要领域。随着Icerocket推出Tag搜索以及反向链接搜索功能后,以追踪Blog圈话题变动趋势见长的Blogpulse也于今天推出了Blog反向链接搜索以及与Technorati类似的基于反向链接的Blogger排名。

就以我这个Blog的URL分别对Technorati,Blogpulse以及Icerocket的反向链接搜索进行测试,得到的结果如下:

Technorati:搜索得到38个网站链接到“未完成”,但未说明有多少篇帖子有链接。进入我的个人Profile可以看到一共是来自38个网站的50个链接,排名47,936位。搜索结果中最早的在100多天以前。

Icerocket:搜索得到44个反向链接,包含少量重复的结果,而且与Technorati不同的是,Icerocket的搜索结果中包括了本站的链接,而更奇怪的是,在搜索结果中我的Blog旁边显示的是来自19个Blog的31个反向链接,与搜索得到的结果不一致。最早的搜索结果是6月7日,大约45天以前。

IceRocket 搜索结果

BlogPulse:搜索得到来自11个网站的26次引用(citation),但与Blogpulse的其它服务一样,它只提供过去30天的结果,排名2593位,高了许多。BlogPulse也可以显示过去30天反向链接排名的变动趋势,趋势图是利用30天移动平均数绘制的,看到我的排名在7月初曾经突破2000名:)。

Blogpulse's trend on Incomplete

不过这次Blogpulse推出的服务称作Profile服务,除了反向链接外,还包括写blog的频率、Blog中的链接引用以及类似Blog等功能,不过似乎这些分析是基于我的Blog经过烧烤的Feed进行的,因为在分析结果中包括了大量我的美味书签结果,因此分析得到的类似Blog的结论也与我的实际Blog相差较远。

Icerocket也推出了tag搜索

尽管Technorati是目前在Blog tag搜索领域的领先者,而且目前索引有超过1300万个Blog的13亿个链接以及和超过160万个tag,但很多人一直对于Technorati的Blog搜索和tag搜索功能表示不满。根据我自己的使用经验,也发现Technorati无论是关键词搜索,还是Blog反向链接搜索的结果都不太全面,搜索结果落后于其他的Blog搜索竞争对手。

而在我的Blog搜索简单测试中胜出的Icerocket也推出了tag搜索的功能。而且看看icerocket的Tag说明页面会发现与technorati的页面如出一辙,甚至举的例子都一样,icerocket有点不够厚道了。

从两个搜索引擎生成的Tag图上看,两者也比较类似,tag得较多的词非常的一致。但从目前的搜索结果上来看,technorati还是明显地占有优势,我从tag图上随意选取几个词进行比较,Technorati都能够得到比icerocket多几倍的搜索结果,比如blogging是22,906 vs. 562,football是6034 vs. 210,photos是18776 vs. 489。Icerocket的tag搜索也支持中文Tag,不过在搜索出的结果上仍然是远低于technorati。而且,technorati与icerocket相比还有个明显的优势在于,它可以根据tag搜索到flickrbuzznet以及del.icio.us等网摘站的结果。

不过Icerocket毕竟是才刚刚推出tag搜索,假以时日,以icerocket在Blog搜索上令人满意的结果,以后在Blog的tag搜索上胜过technorati似乎也并非没有可能。

ps. 1、发现icerocket也有类似technoratiblog反向链接搜索功能,以我这个blog测试的结果,目前technorati得到的结果也较icerocket更多,icerocket在表示有多少link链接到某个blog上时所用的图标也与technorati雷同,还是不厚道;
2、聚合搜索引擎Clusty也已经能够搜索Blog了,利用了icerocket,feedsterdaypop等blog搜索引擎,依旧以“豆瓣”进行测试,结果发现其实与只搜索icerocket得到的结果是一样的,唯一的好处就是它能够将搜索结果根据不同的方式进行聚合

Blog中文搜索引擎简单比较

随着Blog的普及和流行,专门针对Blog的搜索引擎就显得越来越重要,尤其是今后预计会有越来越多的企业更加重视来自Blog的个人的声音,因此他们会产生强烈的追踪Blog内容的需求。

正因为Blog搜索有着重要的应用前景,国外不断涌现出新的Blog搜索引擎,其中比较常用而且支持中文的主要包括technoratiFeedstericerocketbloglinesblogpulse,还有推出测试后就不见踪影的Yahoo RSS Search。而中文Blog搜索引擎还处于发展的初期,无论是知名度还是用户的使用率应该都比较低,主要是八方Grasslandfeedsearch.netfeedss.comRssShow

我并不想在此做个详尽的中文Blog搜索引擎的测试,我也不具备这样搜索引擎详细测试的知识背景,只是想从几个简单的方面来判断哪个搜索引擎目前能够带给我最好的中文Blog搜索结果。

1、测试关键词的选择
本来想用keso作为关键词测试,但由于有些搜索引擎在结果中会根据URL收录keso自己的blog,有些不会,会造成搜索结果较大的偏差,而且keso这个词太集中在IT blogger上。而豆瓣在中文Blog圈中成功的口耳相传,是个不错的测试关键词。而且豆瓣虽然在IT blogger中更常被提到,但由于其书评与影评的特性,非IT blogger中也常会提及。但是用豆瓣作为测试关键词会有个问题就是搜索的结果中会包括豆瓣酱、郫县豆瓣或者豆瓣鱼这样的结果,不过这样也正好可以测试这些搜索引擎是否支持高级语法搜索。

2、豆瓣测试结果
由于不少人在提到豆瓣的时候很可能会使用douban来代替,因此在搜索中如果搜索引擎支持就尽量使用OR来包含两个关键词。

英文搜索引擎:

  • technorati:搜索结果935个,但是搜索结果中包括大量的豆瓣酱,不过technorati支持用NOT来去掉不希望出现的关键词,在去掉豆瓣酱与豆瓣鱼之后,搜索结果只剩下51个,而且大部分的结果都是MSN Spaces上的blog。利用technorati的tag进行搜索,标记豆瓣或者douban作为tag的blog共有8篇
  • Feedster:搜索结果301个,但点击到后面的页面会发现是空页,实际搜索到的结果是154个,而且不支持进一步的高级语法,不能去掉不相关结果和进一步缩小搜索结果。
  • icerocket:搜索结果1388个,同样包括不少豆瓣酱的结果,去掉这些不相关的结果后,得到714个搜索结果
  • bloglines:立志要做Blog搜索引擎的bloglines的搜索结果却非常让人失望,居然只能找到两个结果,大为出乎我的意料之外。
  • Blogpulse:得到27个搜索结果,搜索结果中不包含豆瓣酱的结果,但由于Blogpulse的特点在于追踪某个词在过去一段时间内在Blog圈中被谈论的频率,因此它的搜索只能涵盖过去3个月的结果。
  • Yahoo RSS Search:Yahoo RSS Search虽然没有正式推出,但我们仍然可以在Yahoo搜索的高级选项页面选择RSS格式类型,得到595个搜索结果,去掉“豆瓣酱”等之后的搜索结果是503个
  • 中文搜索引擎:

  • 八方:得到356个搜索结果,去掉“豆瓣酱”等不相关结果后得到243项结果
  • GrassLand:搜索“豆瓣”得到61个结果,搜索“douban”得到7个结果,由于GrassLand还不支持高级语法,因此无法进一步排除,初步目测大部分结果都是豆瓣网,预计清除不相关结果后搜索到的blog应该在50余篇。
  • feedss:得到186个搜索结果,去掉不相关结果后得到161个结果
  • feedsearch:搜索豆瓣得到30个结果,douban得到3个结果,也不支持高级语法搜索。
  • rssshow:得到63个结果,去掉不相关的之后得到62个结果,不过其中包括大量重复的搜索结果。
  • 综合中英文Blog搜索引擎的搜索结果,获胜的是icerocket与Yahoo,而且搜索得到的结果与其他对手相比并不在一个数量级上。而在中文Blog搜索引擎中,八方优势明显,其次是feedss

    3、搜索结果订阅
    绝大部分的Blog搜索引擎都支持RSS结果订阅,其中technorati采用的是添加到watchlist的方式,不支持RSS订阅,feedsearch与Rssshow均未提供RSS订阅功能,feedss同时提供了将搜索结果以javescript方式订阅输出的功能。

    4、其他功能
    icerocket与blogpulse都提供了以图形化输出反映搜索结果变化趋势的工具
    icerocket、Feedster、八方与feedsearch都在搜索结果中提供了目标网站的RSS以供订阅
    Yahoo可以将搜索的结果直接添加到My Web
    GrassLand将搜索结果分为文章与评论两类,但从评论中搜索到的结果似乎未必是blog的评论,困惑中。

    以这样简单测试的结果,无疑icerocket是目前功能最强,搜索结果最齐全的blog搜索引擎,而其他的中文blog搜索引擎与它还存在不小的差距。但icerocket的高级搜索不支持仅在中文blog或其他特定语言中搜索,这方面Yahoo的功能最强,如果Yahoo的RSS搜索正式推出,是否会成为Blog搜索的王者呢?那么Google呢?百度又是否会意识到对blog搜索的需求而尽早进入这一领域呢?

    Update:看来偷懒是不行D,加了比较结果表
    æ¯?è¾?ç»?æ??

    Yahoo MyWeb是否网摘站的终结者

    Yahoo今年以来的确创新不断,为我们带来的新应用一点都不弱于Google,最新推出测试的Yahoo Myweb2.0就是一个将社会化网络与搜索结合在一起的新服务,WebLeon已经对这项新服务作了介绍

    看到MyWeb2.0这样的画面,你不难联想到现在大行其道的各种网摘服务。MyWeb2.0最突出的功能在于,你可以为你所保存的网页,加上tag以及标注,并与你的社会性网络中的联络人分享,而在你进行搜索的时候,也可以通过你的联络人的网页分享进行搜索,依赖这种你所信赖的人力筛选机制,无疑用户更可能找到自己想要得结果。MyWeb2.0也提供了RSS功能以及开放API。

    这看起来的确与美味书签或者其他的网摘服务很类似,而且与现行的网摘服务比起来,MyWeb还有更完善的社会性网络控制权限,可以指定保存的网页是对所有人开放,仅对自己的联络人开放还是只对自己开放,而且利用Yahoo的搜索技术,在搜索时还可以实现保存的网页的全文检索,而不是美味书签那样的只能搜索标题、URL、tag与标注。此外,还有更多的社会性功能也已经列在开发日程之上

    Yahoo通过其庞大的用户群体无疑将极大地推进网摘的发展和普及,至少在美国会是如此,对于其他的网摘服务提供商将会是一个巨大的威胁。尽管仍然会有许多用户会更喜欢美味书签那样虽然简陋但实用的界面和服务,而对Yahoo360这样庞杂的多元化服务架构不感兴趣,但广泛的用户基础与业已形成的用户搜索引擎使用习惯可能吸引不少用户转而使用Myweb2.0。所有的网摘服务提供者都需要开始认真考虑如何面对Yahoo的威胁(以及Google的潜在威胁)。

    而对于Yahoo而言,下一步的重点是如何让这项服务的使用更加简便,如何让普通用户都意识到保存网页的好处而增加对这项服务的使用,从而随着用户群体的扩大使这项服务可以为用户创造更大的价值。

    延伸阅读
    Jeremy Zawodny:My Web 2.0: Social Search
    Ross Mayfield:Yahoo Social Search, Act II
    Waxy:Yahoo Launches My Web 2.0
    Search Engine Watch:Yahoo Integrates Personal & Social Search with MyWeb 2.0

    可视化的自动类聚搜索引擎

    记得以前看到过一个日本搜索引擎的介绍,它的特点在于可以将搜索结果以可视化的方式呈现出来,让你可以更快地找到你需要的搜索结果,不过它所谓的可视化其实是将搜索结果变成网站的缩略图的方式,当时我就纳闷到底是在众多的文字搜索结果中挑出你想要得结果更容易,效率更高呢,还是眯着眼睛一个一个地看那几个缩略图。

    Grokker也是一个以可视化搜索结果为特点的搜索引擎,但它的可视化并不是简单的缩略图,更重要的是加入了自动类聚的功能,利用java applet将搜索结果进行分类汇总后再呈现出来,通过选择类聚结果的类别,让用户更方便、更精确地缩小范围挑选出自己想要的搜索结果。整个搜索结果以一个圆圈图的形式表现出来,每个圆代表一个类聚结果分类,点击圆就可以进入下一层类聚结果分类,而方块则代表搜索结果网址,将鼠标放在方块上就可以看到该网站的描述,点击方块可以进入这个搜索结果。

    而且用户还可以选择最后更新日期以及Yahoo Rank来缩小搜索结果的范围,也可以将搜索结果图与其他人进行分享。

    Grok search result

    Grokker其实早在2001年就已经成立,不过一直以来采用的是销售软件的商业模式,直到最近才开通了网络服务(客户端版本要比在线版本的功能更强),网络搜索利用了Yahoo的引擎,而且也会在搜索结果图旁显示Yahoo的广告。不过网络服务还写的只是Demo,看来Grokker仍然是想主要用软件销售的模式。

    将搜索结果以图形化的形式呈现出来的确是一件挺酷的事,不过如果与Vivisimo的类聚搜索引擎相比,我觉得还是后者那种以文字形式呈现的结果更有效率,也更方便。不过如果用Grokker的技术结合用户搜索历史记录,怎么整合成一个用户搜索的脑图,可能会产生一些有趣的结果。