Yandex的Spectrum如何工作?
How does Yandex’s Spectrum work?techcrunch 2010.12.15号的文章Ilya Segalovich, yandex首席技术官,联合创始人Yandex分析海量的搜索记录(500亿次查询)来寻找查询中的“对象”,将它们分为60个类别,并根据对象的分类把每个查询分别映射为几种可能的“用户意图”的一种,然后计算用户在每种意图下寻找对象的(可能性的)百分比,然后通过NP-hard最优化问题,最大化用户对相关的常用模糊查询的满意概率。
例如,对[jaguar]和[beethoven],显示分类结果为car/animal/drink和movie/composer,然而对于产品搜索,结果将是关于buy’, ‘reviews’ 和 ‘feedback’意图的。
参见 http://company.yandex.com/genera… Spectrum 部分, 以及俄语资料 http://habrahabr.ru/company/yand…
and http://plakhov.livejournal.com/1…
微软:kumo to bing
好几天没有上网,也没有关注消息,昨晚突然在电视里听到微软发布搜索引擎bing的小时,这才意识到,kumo被正式易名了。这个月对搜索届似乎有太多的消息,知识计算型引擎Wolfram Alpha之前被视为google杀手,结果却可能 更大的影响wikipedia,google也不失时机的推出百宝箱,给用户更多的搜索体验,而月尾微软也宣布了livesearch的后继者bing,和此前的传言相同,是bing而不是kumo。
Bing要在6.3号才正式对大众开放,不过现在已经有许多邀请体验的测评文章。如1,2. 看兴趣的可以先睹为快。
ps:今天一看,很多访问都来自关键字being+微软,其实,微软的新搜索叫bing~~ hoho 现在微软有bing,有powerset,看下一步怎么优势整合和google竞争
了~
[ZZ]网络新时代:Web3.0、关联数据和语义网
读写网zz又一篇,原文。
Growthroute Ventures公司创始人Greg Boutin最近撰写了三篇系列文章。这些文章试图把基于结构化数据的三大趋势结合到一起:1) 羽翼渐丰的 “Web 3.0″ , 2) 结构化网络中的黑马关联数据(Linked Data),3) 以及由来已久的传奇:语义网(Semantic Web)。 以下对其进行简单介绍:
Web 3.0: Web 2.0之后轮到谁?
Boutin的第一篇文章认为Web 3.0无法解决信息超载问题。至少现在还不行,因为有很多基础工作要做。尤其是现在网上到处都是非结构化数据,需要很长的时间才能将这些数据结构化。
去年Boutin将Web 3.0宽泛定义为“一个开放网络。Web 3.0可以打破旧藩篱,让所有人随时随地地联系在一起,让整个网络更加智能。”
至少我认为,如果说Web 2.0意味着Youtube和维基百科等UGC和社交网络,那么Web 3.0则意味着开放和结构化数据,让网络更加“聪明”。
Continue reading »
Wolfram Alpha计算型知识引擎
关于Wolfram Alpha的报道,随着最终发布日期的到来(5.18),越来越多,大家对这个新一代搜索引擎也充满了期待。本来想写一下相关内容,又觉得不是那么容易@@。。。幸好读写网中文版遵循共创原则,这里就直接拿来主义了,中文链接1,2,英文原文链接1,2。读写网不错,IT同胞们可以关注下,嘿嘿。总的来说,和现有的流行搜索引擎很不一样,也不同于当前的语义搜索引擎,属于知识搜索的范畴,通过用户的提问根据计算直接给出相关的答案,在查询处理和信息检索基础上的问答式系统。
Continue reading »
google, semantics

Did Google Just Expose Semantic Data in Search Results? ReedWriteWeb的Marshall Kirkpatrick,6号写了一篇这样的文章,立刻收到了极大的关注。他通过对google search的Q&A查询的反馈结果,猜想google可能采用了查询的结构化处理。这与以往google采用的PageRank以及流行度的分析等方法哟明显的不同,现在Yahoo,PowerSet,ASK,Hikia的语义检索大张旗鼓的进行,google的这一点的尝试和修改,无论是对竞争对手还是普通用户都是一个信号。因此,在这篇文章的提示下,有了许多文章。Yes, Google Is Doing Semantic Search ,里说google已经加入了语义搜索的聚会,并表示google的这项技术早在05年就开始了,有一篇官方的blog为佐。arnold在读了这篇文章后也认为这是一个有价值的无责任实验,一个重要的信号。
当然,技术并不是人而且还不是成熟的,它还是要基于许多无法考证的资料来推理总结以试图给予用户确切答案。Daniel Nations发现一个可笑的错误,根据google的结果,基督是出生在1963年的。。。我在尝试相同的查询时,已经没有了答案,而且那片文章中下午还存在图片晚上也不见了,难道也被rivercrab掉了?
ps:上图是我用google.com查询who is the president of the USA?的结果。查vice president以及who will be the president of the USA?都不会有结果提示了。。。但是把the USA改成China,主席和副主席都能直接给答案了 呵呵 :rolleyes:
news digest

●Semantic Sense for the Desktop
A project brings Semantic Web technology to personal documents.
这篇是对Nepomuk Project的介绍,讲了语义桌面的出发点,之前的研究,此项目的的一些特点和方法,最后的有给出下载链接,不过安装不是一步到位的,需要些前期步骤。感兴趣的可以下载试试。
Continue reading »
微软新搜索引擎—>kumo.com?
Updated: 微软最新搜索引擎定名为:bing (查看)

几天前,某关注微软Live动向的独立网站的一篇文章,让许多对微软搜索引擎的传言也更加流行起来。文章指出微软在近期收购了一个新的域名kumo.com,并将它指向了live search的部分服务器,当前供员工内部测试使用。kumo在日语中是云或者蜘蛛的意思,在结合当前云计算的热潮以及微软之前的动向(上周四微软确认雅虎搜索执行官将成为微软硅谷搜索技术中心的总经理,收购语义检索公司Powerset),真的让人会有所期待了。live大张旗鼓进军google的地盘,没有撼动google的位置,现在微软在收购yahoo无期的情况下,动作拼出,看来势必在搜索上会有一番表现了。当然,微软官方对此次民间的传言保持沉默中ing
到底kumo.com会有何用我们还不能知,文章说在未来6-12个月内就会有明确答案了,语义?云计算?新的live search?
ps:搞了个日语,估计某国又要举国欢腾了,不是说奥巴马竞选成功就有某市因为其名与未来美国总统发音类似而提前过了个年~ 当然,要是那天google改名yun.com我也很高兴 哈哈
其他相关连接:
http://news.cnet.com/8301-10805_3-10106314-75.html
http://www.guardian.co.uk/technology/blog/2008/nov/24/microsoft-live-kumo
http://www.theregister.co.uk/2008/11/24/kumo_windows_live_search/
http://tinycomb.com/2008/11/23/kumo-microsofts-new-search-engine/
http://www.efluxmedia.com/news_Kumo_The_new_name_Of_Microsoft_Live_Search_29731.html
google开始走向语义检索?(updated)
最近几天没有关注Google Alert 的内容,今天一看,有这么一条消息:Google launches its SearchWiki semantics plug-in。前一段时间Semanti Corp. 发布消息,自己的语义检索插件SemantiFind支持yahoo, msn, google的搜索引擎。而微软买了Powerset(这个试了下没什么感觉,用过的评价下?)后,也有了语义检索引擎,ask也开始尝试语义的东西,而yahoo早在3月份就宣布进军语义网,看来当今检索大佬google也坐不住了,现在自己也加入了一些新变化。记得是一年之内的一次校园招聘里面(或者会议?),微软还是google的管理层被问到语义检索的时候,还是一脸的怀疑,并声称没有这方面的打算,可现在大家却都纷纷着手做了起来。语义,看来真的是下一个网络时代的潮流,真的会变成web3.0了,当前语义的效果确实不尽如人意,但是如果成功的话,影响将是不可忽视的。IBM,微软,google,不同时代的代表,下一个会是谁?大家争先恐后。
言归正传,说说google的SearchWiki,思想上借鉴了wiki的东西,允许用户对检索的结果进行提升,删除和评论,但是每个用户的改变只影响自己的检索结果,不过可以看到大家对检索结果的编辑情况。其实,google当前的变化还很简单,算不上语义,只能算是个性化订制的一点扩展,感觉比SemantiFind还要简单,不过也算是对用户意图的改进了。刚刚在google上找了一下,也没看到这个插件,却发现了这样片文章:Google SearchWiki Vanishes (Updated),打开一看,写道google说这是因为有bug,正在恢复中。。。 更新:现在可以用了,不过要上http://www.google.com/并登陆账号才可以~ 我晕了
,一会能用,一会不能用,估计测试中。。。
提供一个youtube上google对SearchWiki介绍的视频,感兴趣的可以了解下:
其他相关链接:
http://www.betanews.com/article/Askcom_v_11_tries_new_search_technologies/1223316977
http://www.betanews.com/article/New_Google_tools_sift_and_sort_search_results/1225353991
http://news.bbc.co.uk/1/hi/technology/7296056.stm
http://www.betanews.com/article/Semantic_search_plugin_comes_to_Google_Yahoo_MSN/1225720138
http://googleblog.blogspot.com/2008/11/searchwiki-make-search-your-own.html
http://searchengineland.com/google-searchwiki-101-an-illustrated-guide-15580.php
http://googlesystem.blogspot.com/2008/11/google-searchwiki-launched.html
豆瓣电台
链接表
近期评论
- hbn 发表在《骑车》
- zhaozz 发表在《走跑骑爬打,运动多样化》
- hbn 发表在《走跑骑爬打,运动多样化》
- 刘苏 发表在《hello, 2010》
- Bony 发表在《hello, 2010》

yandex是俄罗斯第一大搜索引擎,在俄罗斯拥有




