Yandex的Spectrum如何工作?

yandex是俄罗斯第一大搜索引擎,在俄罗斯拥有64.9%的市场占有率(数据为liveinternet.ru最近3月平均值,google为21.6%),TechCrunch 2010.12.15日的文章指出当日yandex在搜索引擎中开始键入新的技术spectrum以改善用户体验。根据TechCrunch的文章和yandex的官方技术介绍,spectrum融合语义技术和机器学习对用户的模糊查询推理,挖掘用户潜在的查询意图,消除查询语义的模糊。其实对spectrum的简单介绍,官方技术介绍比较容易理解的。在quora上有人问这个问题,yandex的CTO的回答如下:
How does Yandex’s Spectrum work?
techcrunch 2010.12.15号的文章
Ilya Segalovich, yandex首席技术官,联合创始人

Yandex分析海量的搜索记录(500亿次查询)来寻找查询中的“对象”,将它们分为60个类别,并根据对象的分类把每个查询分别映射为几种可能的“用户意图”的一种,然后计算用户在每种意图下寻找对象的(可能性的)百分比,然后通过NP-hard最优化问题,最大化用户对相关的常用模糊查询的满意概率。

例如,对[jaguar]和[beethoven],显示分类结果为car/animal/drink和movie/composer,然而对于产品搜索,结果将是关于buy’, ‘reviews’ 和 ‘feedback’意图的。
参见 http://company.yandex.com/genera… Spectrum 部分, 以及俄语资料 http://habrahabr.ru/company/yand…
and http://plakhov.livejournal.com/1…





发表评论

电子邮件地址不会被公开。 必填项已用 * 标注

*

您可以使用这些 HTML 标签和属性: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>