<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>可乐福的家园 &#187; semantic search</title>
	<atom:link href="http://clfour.com/tag/semantic-search/feed/" rel="self" type="application/rss+xml" />
	<link>http://clfour.com</link>
	<description>fun being me</description>
	<lastBuildDate>Sat, 31 Dec 2011 14:36:38 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.3.1</generator>
		<item>
		<title>Yandex的Spectrum如何工作？</title>
		<link>http://clfour.com/2011/04/how-does-yandexs-spectrum-work/</link>
		<comments>http://clfour.com/2011/04/how-does-yandexs-spectrum-work/#comments</comments>
		<pubDate>Fri, 08 Apr 2011 11:23:51 +0000</pubDate>
		<dc:creator>Fred</dc:creator>
				<category><![CDATA[折腾]]></category>
		<category><![CDATA[资讯]]></category>
		<category><![CDATA[IT]]></category>
		<category><![CDATA[quora]]></category>
		<category><![CDATA[search]]></category>
		<category><![CDATA[semantic search]]></category>
		<category><![CDATA[翻译]]></category>

		<guid isPermaLink="false">http://clfour.com/?p=1834</guid>
		<description><![CDATA[yandex是俄罗斯第一大搜索引擎，在俄罗斯拥有64.9%的市场占有率（数据为liveinternet.ru最近3月平均值，google为21.6%），TechCrunch 2010.12.15日的文章指出当日yandex在搜索引擎中开始键入新的技术spectrum以改善用户体验。根据TechCrunch的文章和yandex的官方技术介绍，spectrum融合语义技术和机器学习对用户的模糊查询推理，挖掘用户潜在的查询意图，消除查询语义的模糊。其实对spectrum的简单介绍，官方技术介绍比较容易理解的。在quora上有人问这个问题，yandex的CTO的回答如下： How does Yandex&#8217;s Spectrum work? techcrunch 2010.12.15号的文章 Ilya Segalovich, yandex首席技术官，联合创始人 Yandex分析海量的搜索记录（500亿次查询）来寻找查询中的“对象”，将它们分为60个类别，并根据对象的分类把每个查询分别映射为几种可能的“用户意图”的一种，然后计算用户在每种意图下寻找对象的（可能性的）百分比，然后通过NP-hard最优化问题，最大化用户对相关的常用模糊查询的满意概率。 例如，对[jaguar]和[beethoven]，显示分类结果为car/animal/drink和movie/composer，然而对于产品搜索，结果将是关于buy’, ‘reviews’ 和 ‘feedback’意图的。 参见 http://company.yandex.com/genera&#8230; Spectrum 部分, 以及俄语资料 http://habrahabr.ru/company/yand&#8230; and http://plakhov.livejournal.com/1&#8230;]]></description>
			<content:encoded><![CDATA[<div>
<div>
<div id="ld_Qt4lfJ_3236">
<div>
<div id="__w2_grsGNDa_buttons"><a id="__w2_grsGNDa_answer_vote_up_link" href="http://www.quora.com/How-does-Yandexs-Spectrum-work#"> </a><a id="__w2_grsGNDa_answer_vote_down_link" href="http://www.quora.com/How-does-Yandexs-Spectrum-work#"> </a><img class="aligncenter" title="yandex" src="http://s1.homezz.com/201104/3169_o.png" alt="" width="400" height="300" />yandex是俄罗斯第一大搜索引擎，在俄罗斯拥有<span>64.9%的市场占有率（数据为</span>liveinternet.ru最近3月平均值，google为21.6%<span>），TechCrunch 2010.12.15日的<a href="http://eu.techcrunch.com/2010/12/15/russian-search-engine-yandex-gets-a-semantic-injection/" target="_blank">文章</a>指出当日yandex在搜索引擎中开始键入新的技术spectrum以改善用户体验。根据TechCrunch的文章和yandex的官方技术<a href="http://company.yandex.com/technologies/spectrum.xml" target="_blank">介绍</a></span>，spectrum融合语义技术和机器学习对用户的模糊查询推理，挖掘用户潜在的查询意图，消除查询语义的模糊。其实对spectrum的简单介绍，官方技术<a href="http://company.yandex.com/technologies/spectrum.xml" target="_blank">介绍</a>比较容易理解的。在quora上有人问这个问题，yandex的CTO的回答如下：</div>
</div>
</div>
</div>
</div>
<blockquote>
<div>How does Yandex&#8217;s Spectrum work?</div>
<div>techcrunch 2010.12.15号的<a href="http://eu.techcrunch.com/2010/12/15/russian-search-engine-yandex-gets-a-semantic-injection/" target="_blank">文章</a></div>
<div><a href="http://www.quora.com/Ilya-Segalovich">Ilya Segalovich</a>, yandex首席技术官，联合创始人</div>
<p>Yandex分析海量的搜索记录（500亿次查询）来寻找查询中的“对象”，将它们分为60个类别，并根据对象的分类把每个查询分别映射为几种可能的“用户意图”的一种，然后计算用户在每种意图下寻找对象的（可能性的）百分比，然后通过NP-hard最优化问题，最大化用户对相关的常用模糊查询的满意概率。</p>
<p>例如，对[jaguar]和[beethoven]，显示分类结果为car/animal/drink和movie/composer，然而对于产品搜索，结果将是关于buy’,  ‘reviews’ 和 ‘feedback’意图的。<br />
参见 <a rel="nofollow" href="http://company.yandex.com/general_info/technologies.xml" target="_blank">http://company.yandex.com/genera&#8230;</a> Spectrum 部分, 以及俄语资料 <a rel="nofollow" href="http://habrahabr.ru/company/yandex/blog/110059/" target="_blank">http://habrahabr.ru/company/yand&#8230;</a><br />
and <a rel="nofollow" href="http://plakhov.livejournal.com/150737.html" target="_blank">http://plakhov.livejournal.com/1&#8230;</a></p></blockquote>
]]></content:encoded>
			<wfw:commentRss>http://clfour.com/2011/04/how-does-yandexs-spectrum-work/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>微软:kumo to bing</title>
		<link>http://clfour.com/2009/05/ms-kumo-to-bing/</link>
		<comments>http://clfour.com/2009/05/ms-kumo-to-bing/#comments</comments>
		<pubDate>Sat, 30 May 2009 15:20:16 +0000</pubDate>
		<dc:creator>Fred</dc:creator>
				<category><![CDATA[折腾]]></category>
		<category><![CDATA[资讯]]></category>
		<category><![CDATA[bing]]></category>
		<category><![CDATA[IT]]></category>
		<category><![CDATA[kumo]]></category>
		<category><![CDATA[ms]]></category>
		<category><![CDATA[semantic search]]></category>

		<guid isPermaLink="false">http://www.clfour.com/?p=837</guid>
		<description><![CDATA[好几天没有上网，也没有关注消息，昨晚突然在电视里听到微软发布搜索引擎bing的小时，这才意识到，kumo被正式易名了。这个月对搜索届似乎有太多的消息，知识计算型引擎Wolfram Alpha之前被视为google杀手，结果却可能 更大的影响wikipedia，google也不失时机的推出百宝箱，给用户更多的搜索体验，而月尾微软也宣布了livesearch的后继者bing，和此前的传言相同，是bing而不是kumo。 Bing要在6.3号才正式对大众开放，不过现在已经有许多邀请体验的测评文章。如1，2. 看兴趣的可以先睹为快。 ps：今天一看，很多访问都来自关键字being+微软，其实，微软的新搜索叫bing~~ hoho  现在微软有bing，有powerset，看下一步怎么优势整合和google竞争 了~]]></description>
			<content:encoded><![CDATA[<p><img title="bing" src="http://clfour.com/wp-content/uploads/2009/05/bing2.png" alt="bing" width="150" height="59" align="left" />好几天没有上网，也没有关注消息，昨晚突然在电视里听到微软发布搜索引擎bing的小时，这才意识到，kumo被正式易名了。这个月对搜索届似乎有太多的消息，知识计算型引擎Wolfram Alpha之前被视为google杀手，结果却可能 更大的影响wikipedia，google也不失时机的推出百宝箱，给用户更多的搜索体验，而月尾微软也宣布了livesearch的后继者bing，和此前的传言相同，是bing而不是kumo。</p>
<p>Bing要在6.3号才正式对大众开放，不过现在已经有许多邀请体验的测评文章。如<a href="http://blog.it.sohu.com/readwriteweb/archives/2640" target="_blank">1</a>，<a href="http://livesino.net/archives/2068.live" target="_blank">2</a>. 看兴趣的可以先睹为快。</p>
<p>ps：今天一看，很多访问都来自关键字being+微软，其实，微软的新搜索叫bing~~ hoho  现在微软有bing，有powerset，看下一步怎么优势整合和google竞争 <img src='http://clfour.com/wp-includes/images/smilies/icon_razz.gif' alt=':razz:' class='wp-smiley' />  了~</p>
]]></content:encoded>
			<wfw:commentRss>http://clfour.com/2009/05/ms-kumo-to-bing/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>[ZZ]网络新时代：Web3.0、关联数据和语义网</title>
		<link>http://clfour.com/2009/05/zz-web-30-linked-data-semantic-web/</link>
		<comments>http://clfour.com/2009/05/zz-web-30-linked-data-semantic-web/#comments</comments>
		<pubDate>Fri, 15 May 2009 08:42:27 +0000</pubDate>
		<dc:creator>Fred</dc:creator>
				<category><![CDATA[折腾]]></category>
		<category><![CDATA[资讯]]></category>
		<category><![CDATA[google]]></category>
		<category><![CDATA[IT]]></category>
		<category><![CDATA[semantic search]]></category>
		<category><![CDATA[ZZ]]></category>
		<category><![CDATA[语义]]></category>

		<guid isPermaLink="false">http://www.clfour.com/?p=772</guid>
		<description><![CDATA[读写网zz又一篇，原文。 Growthroute Ventures公司创始人Greg Boutin最近撰写了三篇系列文章。这些文章试图把基于结构化数据的三大趋势结合到一起：1) 羽翼渐丰的 “Web 3.0″ ， 2) 结构化网络中的黑马关联数据（Linked Data），3) 以及由来已久的传奇：语义网（Semantic Web）。 以下对其进行简单介绍： Web 3.0: Web 2.0之后轮到谁？ Boutin的第一篇文章认为Web 3.0无法解决信息超载问题。至少现在还不行，因为有很多基础工作要做。尤其是现在网上到处都是非结构化数据，需要很长的时间才能将这些数据结构化。 去年Boutin将Web 3.0宽泛定义为“一个开放网络。Web 3.0可以打破旧藩篱，让所有人随时随地地联系在一起，让整个网络更加智能。” 至少我认为，如果说Web 2.0意味着Youtube和维基百科等UGC和社交网络，那么Web 3.0则意味着开放和结构化数据，让网络更加“聪明”。 关联数据（Linked Data）: 结构化数据，但不一定是语义数据 Greg [...]]]></description>
			<content:encoded><![CDATA[<p>读写网zz又<a href="http://blog.it.sohu.com/readwriteweb/archives/2182">一篇</a>，<a href="http://www.readwriteweb.com/archives/understanding_the_new_web_era_web_30_linked_data_s.php">原文</a>。<br />
<a href="http://blog.it.sohu.com/readwriteweb/files/2009/05/linked_data_may09.jpg"><img src="http://blog.it.sohu.com/readwriteweb/files/2009/05/linked_data_may09.jpg" alt="" width="150" height="150" align="left" /></a><a href="http://www.growthroute.com/">Growthroute Ventures</a>公司创始人Greg Boutin最近撰写了三篇系列文章。这些文章试图把基于结构化数据的三大趋势结合到一起：1) 羽翼渐丰的 <strong>“Web 3.0″</strong> ， 2) 结构化网络中的黑马关联数据（<strong>Linked Data<span style="font-weight: normal;">），3) 以及由来已久的传奇：<a class="bodytag" href="http://www.yeeyan.com/articles/tag/%E8%AF%AD%E4%B9%89%E7%BD%91" target="_blank">语义网</a>（<strong>Semantic Web</strong>）。 以下对其进行简单介绍：</span></strong></p>
<h4>Web 3.0: Web 2.0之后轮到谁？</h4>
<p>Boutin的第一篇文章认为Web 3.0无法解决信息超载问题。至少现在还不行，因为有很多基础工作要做。尤其是现在网上到处都是非结构化数据，需要很长的时间才能将这些数据结构化。</p>
<p>去年Boutin将Web 3.0宽泛定义为“一个开放网络。Web 3.0可以打破旧藩篱，让所有人随时随地地联系在一起，让整个网络更加智能。”</p>
<p>至少我认为，如果说Web 2.0意味着Youtube和维基百科等UGC和社交网络，那么Web 3.0则意味着开放和结构化数据，让网络更加“聪明”。<br />
<span id="more-772"></span><br />
<h4><a class="bodytag" href="http://www.yeeyan.com/articles/tag/%E5%85%B3%E8%81%94%E6%95%B0%E6%8D%AE" target="_blank">关联数据</a>（Linked Data）: 结构化数据，但不一定是语义数据</h4>
<p>Greg Boutin第二篇文章谈到了<a class="bodytag" href="http://www.yeeyan.com/articles/tag/%E5%85%B3%E8%81%94%E6%95%B0%E6%8D%AE" target="_blank">关联数据</a>。他认为关联数据提供了关联结构化数据的新媒介，可以让机器更好地读取这些数据。但是，关联数据本身不会给信息增加任何语义含义，而是更好地携带语义数据，供用户访问。所以，关联数据虽然本身并不具备语义特征，但它可以在数据层面建立关联，为真正的语义网铺平道路。</p>
<p><a class="bodytag" href="http://www.yeeyan.com/articles/tag/%E5%85%B3%E8%81%94%E6%95%B0%E6%8D%AE" target="_blank">关联数据</a>这个概念来自W3C,该组织有一个关联开放数据（LOD）项目。以下图表列出了参与该项目的数据集。其中包括著名的Thomson Reuters的<a href="http://www.readwriteweb.com/archives/calais_4_linked_data.php">Open Calais项目 </a>, <a href="http://www.readwriteweb.com/archives/freebase_overview.php">Freebase</a>, 和<a href="http://www.readwriteweb.com/archives/where_to_find_open_data_on_the.php">DBpedia</a>。这些数据集是在现有本体论（ontologies）基础之上建立的，如<a href="http://www.w3.org/TR/wordnet-rdf/">WordNet</a>,<a href="http://www.foaf-project.org/">FOAF</a>, 和<a href="http://www.w3.org/TR/skos-reference/">SKOS</a>，然后在它们之间建立关联。</p>
<p><img src="http://www.readwriteweb.com/images/web_data_apr09b.png" alt="" width="610" height="465" /></p>
<p>Greg Boutin在其第三篇文章中写道，<a class="bodytag" href="http://www.yeeyan.com/articles/tag/%E5%85%B3%E8%81%94%E6%95%B0%E6%8D%AE" target="_blank">关联数据</a>格式不会创建智能数据，仅仅是支持。他建议人们集中精力开发把非结构化数据进行结构化的技术。他还建议创业者应该考虑把关联数据和其它技术进行混搭。</p>
<h4><a class="bodytag" href="http://www.yeeyan.com/articles/tag/%E8%AF%AD%E4%B9%89%E7%BD%91" target="_blank">语义网</a>：Google唱主角</h4>
<p><img src="http://farm1.static.flickr.com/147/398950215_8444feeb8e_m.jpg" alt="" align="right" />那些以上这些趋势会如何影响<a class="bodytag" href="http://www.yeeyan.com/articles/tag/%E8%AF%AD%E4%B9%89%E7%BD%91" target="_blank">语义网</a>呢？Tim Berners-Lee 认为语义网可以用于商业目的，但现实却是，目前使用资源描述框架（RDF）的实际应用寥寥无几。</p>
<p>但是 <a href="http://www.w3.org/TR/xhtml-rdfa-primer/">RDFa</a>（允许发布者把RDF嵌入到HTML）带来了一线希望。 Google本周宣布将在其“富媒体代码”中支持RDFa，而雅虎早在去年就大胆地推出了搜索猴子（<a href="http://www.readwriteweb.com/archives/yahoo_searchmonkey_launches.php">Search Monkey </a>），达到了同样的目的。</p>
<p>Google将在<a class="bodytag" href="http://www.yeeyan.com/articles/tag/%E8%AF%AD%E4%B9%89%E7%BD%91" target="_blank">语义网</a>主流化过程中扮演重要角色。Google目前正在从半结构化和非结构化数据中解析语义结构数据。有人称Google算法远非统计方法论那么简单，它早就在研发语义技术了。</p>
<p>Google也并非没有竞争对手。除了雅虎，微软去年夏天收购 <a href="http://www.readwriteweb.com/archives/does_microsoft_powerset_beat_google.php">Powerset</a>也是瞄准了这个市场。</p>
<p><img src="http://www.readwriteweb.com/images/searchmonkey-example.jpg" alt="" /></p>
<h4>结论</h4>
<p>Web 3.0是一个没有统一定义的词语，或者根本不应该这么称呼。但是很显然，结构化数据时代已经到来。我们从当前的<a class="bodytag" href="http://www.yeeyan.com/articles/tag/%E5%85%B3%E8%81%94%E6%95%B0%E6%8D%AE" target="_blank">关联数据</a>热潮中就可以看到它的影子，并且得到了Google和雅虎瞪大公司的支持。谁知道呢，或许语义网也就在隔壁不远处。</p>
<p>（编译：pestwave）</p>
]]></content:encoded>
			<wfw:commentRss>http://clfour.com/2009/05/zz-web-30-linked-data-semantic-web/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Wolfram Alpha计算型知识引擎</title>
		<link>http://clfour.com/2009/05/wolfram-alpha-computational-knowledge-engine/</link>
		<comments>http://clfour.com/2009/05/wolfram-alpha-computational-knowledge-engine/#comments</comments>
		<pubDate>Thu, 14 May 2009 17:44:44 +0000</pubDate>
		<dc:creator>Fred</dc:creator>
				<category><![CDATA[折腾]]></category>
		<category><![CDATA[资讯]]></category>
		<category><![CDATA[IT]]></category>
		<category><![CDATA[mine]]></category>
		<category><![CDATA[search]]></category>
		<category><![CDATA[semantic search]]></category>
		<category><![CDATA[ZZ]]></category>

		<guid isPermaLink="false">http://www.clfour.com/?p=766</guid>
		<description><![CDATA[关于Wolfram Alpha的报道，随着最终发布日期的到来(5.18)，越来越多，大家对这个新一代搜索引擎也充满了期待。本来想写一下相关内容，又觉得不是那么容易@@。。。幸好读写网中文版遵循共创原则，这里就直接拿来主义了，中文链接1，2，英文原文链接1，2。读写网不错，IT同胞们可以关注下，嘿嘿。总的来说，和现有的流行搜索引擎很不一样，也不同于当前的语义搜索引擎，属于知识搜索的范畴，通过用户的提问根据计算直接给出相关的答案，在查询处理和信息检索基础上的问答式系统。 1. Wolfram&#124;Alpha：Google 终结者？ Wolfram&#124;Alpha，号称“Google 终结者”，这个由计算机科学家 Stephen Wolfram 创建的搜索引擎，在过去一段时间，一直在被大家热炒；5 月份将推出正式版。 它所谓的终结者称号，不过是他人慷慨的馈赠，事实上，创始人更愿意将其称为计算型知识引擎。与提供链接的 Google 搜索不同，对于这个知识搜索引擎，你提交一个问题，可得到相应的答案。 Alpha 不是搜索网络获取信息，而是通过公共和授权资源获取大量的经过组织的数据，并利用高级的自然语言处理算法进行计算，得出结果。 在产品演示中，Stephen Wolfram 搜索了“internet users in europe”，当然你也可以使用 Google 或其他搜索引擎来获得这个问题的结果。 但 Alpha 不同在于，它如何显示搜索结果。比如上述搜索，Alpha 不仅返回互联网用户数量，而且还提供了每个国家的用户数量和各种图表（从结果中我们得知，梵蒂冈只有 93 个网民）。 [...]]]></description>
			<content:encoded><![CDATA[<p>关于Wolfram Alpha的报道，随着最终发布日期的到来(5.18)，越来越多，大家对这个新一代搜索引擎也充满了期待。本来想写一下相关内容，又觉得不是那么容易@@。。。幸好<a href="http://blog.it.sohu.com/readwriteweb/" target="_blank">读写网中文版</a>遵循<a href="http://creativecommons.org/licenses/by-nc-sa/2.5/" target="_blank">共创原则</a>，这里就直接拿来主义了，中文链接<a href="http://blog.it.sohu.com/readwriteweb/archives/1774" target="_blank">1</a>，<a href="http://blog.it.sohu.com/readwriteweb/archives/2067" target="_blank">2</a>，英文原文链接<a href="http://www.readwriteweb.com/archives/wolframalpha_our_first_impressions.php" target="_blank">1</a>，<a href="http://www.readwriteweb.com/archives/see_wolfram_alpha_in_action_-_video_and_screenshots.php" target="_blank">2</a>。读写网不错，IT同胞们可以关注下，嘿嘿。总的来说，和现有的流行搜索引擎很不一样，也不同于当前的语义搜索引擎，属于知识搜索的范畴，通过用户的提问根据计算直接给出相关的答案，在查询处理和信息检索基础上的问答式系统。<br />
<span id="more-766"></span></p>
<p><strong>1.</strong><br />
<strong>Wolfram|Alpha：Google 终结者？</strong></p>
<div class="entry-meta"><a title="作者: 译言" href="http://blog.it.sohu.com/readwriteweb/archives/author/yeeyan/"></a></div>
<div class="entry-body">
<p><img src="http://www.readwriteweb.com/images/alpha_logo_apr09.png" alt="alpha_logo_apr09.png" /><a href="http://www.wolframalpha.com/">Wolfram|Alpha</a>，号称“Google 终结者”，这个由计算机科学家  <a href="http://www.crunchbase.com/person/stephen-wolfram">Stephen Wolfram</a> 创建的搜索引擎，在过去一段时间，一直在被大家热炒；5 月份将推出正式版。</p>
<div style="text-align: left;"><img style="width: 586px; height: 130px;" src="https://docs.google.com/File?id=dc8k7fhp_174d7swzpf2_b" alt="" /></div>
<p>它所谓的终结者称号，不过是他人慷慨的馈赠，事实上，创始人更愿意将其称为计算型知识引擎。与提供链接的 Google 搜索不同，对于这个知识搜索引擎，你提交一个问题，可得到相应的答案。</p>
<p>Alpha 不是搜索网络获取信息，而是通过公共和授权资源获取大量的经过组织的数据，并利用高级的自然语言处理算法进行计算，得出结果。</p>
<p>在产品演示中，Stephen Wolfram 搜索了“internet users in europe”，当然你也可以使用 Google 或其他搜索引擎来获得这个问题的结果。</p>
<p>但 Alpha 不同在于，它如何显示搜索结果。比如上述搜索，Alpha 不仅返回互联网用户数量，而且还提供了每个国家的用户数量和各种图表（从结果中我们得知，梵蒂冈只有 93 个网民）。</p>
<p>如果使用 Google 搜索“uncle’s uncle’s brother’s son（堂叔的舅父的哥哥的儿子）”，你会得到这样一个<a title="结果" href="http://www.google.com/search?q=uncle%27s+uncle%27s+brother%27s+son&amp;ie=utf-8&amp;oe=utf-8&amp;aq=t&amp;rls=org.mozilla:en-GB:official&amp;client=firefox-a">结果</a>，很明显，Google 不懂基本的血缘关系。而 Alpha 可提供一份家谱，包括血缘关系系数等信息。对于该示例，该值为 3.125%。</p>
<p>对于 Alpha 与 <a href="http://www.wolfram.com/products/mathematica/index.html">Mathematica</a> 之间的关系，Stephen Wolfram 并没有遮遮掩掩。根据他的说法，Alpha 利用了 500 百万行 Mathematica 代码，而后者当前使用了大约 1 万颗 CPU。为了 Alpha 的正式推出，他再在扩建服务器农场。</p>
<p>Alpha 可以处理很多 Mathematica 能够计算的数学问题，Mathematica 也将是 Alpha API 的第一个使用者，因此，Mathematica 用户将能够访问 Alpha 的数据。</p>
<p><strong>专业版</strong></p>
<p>Alpha 将以免费方式推出，当同时提供付费版，它将为用户提供数据下载和上传。对于专业用户，将不仅能够查看图表，还可以下载生成这些图表的数据，并可以在用户的电脑上或 Mathematica 中使用。</p>
<p><strong>嵌入和通知</strong></p>
<p>很明显，Wolfram 非常了解互联网的游戏规则。用户将不仅可以在自己的页面上嵌入 Wolfram|Alpha 搜索框，还将能够在网站上嵌入搜索结果以及定制的 Alpha 的接口。此外，结果变化时，用户还可以收到电邮通知。</p>
<p><strong>有关该搜索引擎的注释</strong></p>
<blockquote>
<ul>
<li>Alpha 的每个搜索结果页面提供计算结果所用的资源链接</li>
<li>如果结果存在争论，Alpha 将在脚注中提供说明</li>
<li>目前 Alpha 仅提供英文版</li>
<li>资金：Alpha 将在侧边栏中显示广告，并与其他公司合作，其中包括其他搜索引擎</li>
<li>Wolfram 将发布  FF 和 IE 工具栏，以及 <a href="http://www.ieaddons.com/en/accelerators/">IE8 accelerator</a></li>
<li>Alpha 还将显示来自传统搜索引擎的搜索结果（Google、Live、Yahoo），并提供相关的维基百科链接</li>
</ul>
</blockquote>
<p><strong>它是 Google 终结者？</strong></p>
<p>不是！Wolfram|Alpha 将会一个令人惊奇的产品，但它与 Google 和其他搜索引擎很不同。事实上，将其称为搜索引擎都是一个误解，Wolfram 更乐意“computational knowledge engine”这个名称。如果你想知道去纽约要看哪些景点，据我们了解，对此 Alpha 并不是一个有用的工具。</p>
<p>如果不是查看那些基本的百科式信息，用户可以求助于 Alpha，它会直接给出问题的答案，并提供一系列的图片和相关信息。</p>
<p>在精心准备的演示中，每个产品都会看起来很不错。5 月份推出的正式版 Alpha 将如何面对用户真刀实枪的拷问，让我们拭目以待…</p>
<p><strong>2.</strong><br />
<strong>Alpha首测结果：喜忧参半</strong></p>
<div class="entry-meta"><a title="作者: 译言" href="http://blog.it.sohu.com/readwriteweb/archives/author/yeeyan/"></a></div>
<div class="entry-body">
<p style="font-size: 10.5pt;"><a href="http://blog.it.sohu.com/readwriteweb/files/2009/05/wolfram_alpha_logo_may09.png"><img class="alignleft size-medium wp-image-2065" src="http://blog.it.sohu.com/readwriteweb/files/2009/05/wolfram_alpha_logo_may09.png" alt="" width="150" height="29" /></a>Wolfram Alpha这款被视为“谷歌杀手”的搜索引擎将会在5月18日正式发布（<a title="link" href="http://blog.wolframalpha.com/2009/05/08/so-much-for-a-quiet-launch/">link</a>）。但是我们今天可以提前访问这项服务，因此也就有机会测试一下这款搜索引擎的表现</p>
<p style="font-size: 10.5pt;">我们就不罗嗦了：Wolfram Alpha不是针对主流互联网用户的，对于这类人群而言，谷歌就已经够用了。当然，将Alpha与谷歌做比较有些不妥，但是多数用户还是会把它当成谷歌来 对待，然后这其中的多数可能会极其失望的离开。然而，从目前来看，Alpha会成为学生，工程师和学者们手中的得力工具。任何需要快速获得数据并知道相应 解释的人都会将Alpha视为好的帮手。学会如何最佳的使用Alpha需要花点时间，它还有些瑕疵，但是总来说，它给我们的印象非常深刻，不过，偶尔我们 也有些失望。</p>
<p style="font-size: 10.5pt;">正如我们所设想的那样，Alpha表现出色的领域是数学，工程，化学，物理以及生命科学。但是当涉及人文科学时，Alpha给的结果就不那么有意思了。当你输入作者名称时，你会得到一个基本的履历资料，而非作者的书目列表。</p>
<p style="font-size: 10.5pt;">用户需要记住的是Alpha只会给你数据，但是不会提供数据背后的意义。用户需要自己解读数据。</p>
<p><strong>试用结果：Alpha某些领域非常出色——其他一些领域难有作为。</strong></p>
<p><a href="http://blog.it.sohu.com/readwriteweb/files/2009/05/alpha_span_germany_gdp.png"><img class="alignright size-medium wp-image-2066" src="http://blog.it.sohu.com/readwriteweb/files/2009/05/alpha_span_germany_gdp-254x300.png" alt="" width="254" height="300" /></a></p>
<p style="font-size: 10.5pt;">有时，Alpha的数据集并不是很规整。比如，你 可以得到国家的失业人数数据，但是如果你想得到特定城市的数据，Alpha就无能为力。Alpha也可以回答一些杂七杂八的问题，像“B-29超级空中堡 垒轰炸机的翼展是多少”，美国有多少药剂师？（以及他们的平均薪水是多少？），以及《星际迷航2：可汗的愤怒》的票房收入是多少？（系统会自动将 7，891万美元转换成日元，英镑和欧元。）</p>
<p style="font-size: 10.5pt;">它也可以做一些非常出色的计算（虽然我们做的一些 复杂查询出现超时情况），像画谢尔宾斯基三角形（Sierpinski gasket）（译者注：一个分形），以及告诉25岁时，人锻炼时的安全心率是多少。但是虽然它知道1984年的德国总统是谁，但是它却拒绝告诉我们那年 的德国总理是谁。而且有关第一， 二次世界大战的信息都是一些基本的数据，不过与此同时，Alpha也会告诉我们今天德国每一分钟期间有多少人死去(1.698个)，并将其与当前的出生率 做比较。Alpha也可以给你提供营养方面的数据，然而你没办法计算得到不同体重下的数据。</p>
<p><strong>一些幽默诙谐的地方</strong></p>
<p style="font-size: 10.5pt;">有时，你会在结果中看到一些幽默诙谐的闪光点。比 如，当我们搜索”5千克“时，Alpha会提供你一个基本的单位转换关系。但是它也会在结果里告诉你5千克大约等于两本《新新科学》（ A New Kind of Science）（此书的作者是： Stephen Wolfram）的重量。</p>
<p><strong>局限性</strong></p>
<p style="font-size: 10.5pt;">毫无疑问，Alpha数据集存在空白的地方。而这 些空白的地方都是属于非技术领域，从许多方面来看，这是可以理解的，因为让Wolfram Alpha这样的系统理解此类信息非常难（不过Alpha对字谜非常在行），每个结果页面的Alpha广告所连接的都是维基百科上的相关文章。</p>
<p><strong>缺乏互动性</strong></p>
<p style="font-size: 10.5pt;">Alpha也缺乏互动性，这点很快让人有些沮丧。 Alpha上的所有图片都是静态图像，你无法放大或缩小，或者当你搜索人物的生平资料，结果中没有任何链接，因此你无法通过简单点击这个人的出生地链接以 获得更多信息。这意味着深入挖掘某个主题下的信息可能很难，因为你必须持续不断地进行新的查询。</p>
<p><strong>有关大写的问题</strong></p>
<p><a href="http://blog.it.sohu.com/readwriteweb/files/2009/05/khan_wolfram_small.png"><img class="alignright size-medium wp-image-2068" src="http://blog.it.sohu.com/readwriteweb/files/2009/05/khan_wolfram_small-248x300.png" alt="" width="248" height="300" /></a></p>
<p style="font-size: 10.5pt;">Alpha对查询词的要求有些过于苛刻。当你输入 ”pdx“时，aplha不知道如何处理，但是你将它大写后，它会返回Pursuit Dynamics公司的信息（公司的商标是pdx），以及一个有关波兰国际机场的信息选项（而这是我们所要查找的东西）。而谷歌则是完全忽视掉字母的大 写，Alpha对此是做区分的。</p>
<p style="font-size: 10.5pt;">Alpha也会为新用户提供许多搜索实例。这些实例对于你如何规范的查询是非常有帮助的，而这种规范则可以帮助你从Alpha上获得更多有用信息。</p>
<p><strong>开发者和Alpha</strong></p>
<p style="font-size: 10.5pt;">Alpha将会为第三方开发者提供丰富的API。 我们对于开发文档只做了一个快速的浏览，但是从我们看到的内容来讲，开发者可以完全访问Wolfram Alpha的数据集。但是对于开发者们如何将这一数据源与其他Alpha并不擅长领域里的数据源混搭使用，想必我们会看到一些有意思的创新。</p>
<p><strong>这一款不错的工具——但并不适合所有人</strong></p>
<p style="font-size: 10.5pt;">最后，Wolfram Alpha是一款工具，你需要花些时间来学习，但是它也可以成为一款非常强大的工具。许多媒体将Alpha与谷歌做比较，我们认为这是一个毫无意义的比 较。Alpha并不想成为谷歌杀手，而且以它目前的形式来看，它是无法从谷歌手中抢去很多市场份额的。正如我们一周前在有关Alpha的报道中所说的那 样，Alpha会从维基百科手中抢走一些用户，因为它可以让用户快速便捷的获得各种数据。</p>
<p style="font-size: 10.5pt;">但是目前Alpha最大的问题就是对搜索查询词的解释执行，通常查询词的一个小小改动就会导致无法找到结果或者十分精确的找到你想找的内容。</p>
<p style="font-size: 10.5pt;">我们也希望Wolfram能找到一个把其他更多数据和搜索结果连接起来的方法。当你在搜索结果中找到一些感兴趣的内容，但是却不得不手动输入进行一次查询时，我们感觉相当的失望。Alpha在结果页面只要加一个简单的链接就可以解决的。</p>
<p><strong>对于工程师而言非常棒——但是主流群体可能不会这么觉得</strong></p>
<p style="font-size: 10.5pt;">到目前为止，我们还是觉得Alpha仍然是一个小众的参与者。对于一小部分潜在用户，它是一个价值极高的工具。不过，希望随着时间的推移，开发团队会添加更多更好的数据集，这样Alpha对于主流群体也会变得更加实用。</p>
<p style="font-size: 10.5pt;"><strong>注意</strong>：读者如果想查看更多截图，可以前去这个页面（<a href="http://www.readwriteweb.com/archives/see_wolfram_alpha_in_action_-_video_and_screenshots.php" target="_self">link</a>）</p>
<p style="font-size: 10.5pt;">
<p style="font-size: 10.5pt;">（译者：Moon.Wong）</p>
</div>
<p>（译者：     <a href="http://www.yeeyan.com/space/show/ITAQ">挨踢狂人</a>）</div>
]]></content:encoded>
			<wfw:commentRss>http://clfour.com/2009/05/wolfram-alpha-computational-knowledge-engine/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>掀起kumo的盖头来</title>
		<link>http://clfour.com/2009/03/a-sneak-peek-at-kumo/</link>
		<comments>http://clfour.com/2009/03/a-sneak-peek-at-kumo/#comments</comments>
		<pubDate>Tue, 17 Mar 2009 13:11:44 +0000</pubDate>
		<dc:creator>Fred</dc:creator>
				<category><![CDATA[折腾]]></category>
		<category><![CDATA[资讯]]></category>
		<category><![CDATA[IT]]></category>
		<category><![CDATA[kumo]]></category>
		<category><![CDATA[mine]]></category>
		<category><![CDATA[ms]]></category>
		<category><![CDATA[search]]></category>
		<category><![CDATA[semantic search]]></category>

		<guid isPermaLink="false">http://www.clfour.com/?p=591</guid>
		<description><![CDATA[3月初，微软语义搜索引擎kumo在公司内部测试并希望全体员工积极反馈意见。微软搜索部门主管在给员工的信件中如是说： From: Satya Nadella Sent: Monday, March 02, 2009 4:18 PM To: Microsoft–All Employees (QBDG) Subject: Announcement: Internal Search Test Experience The Search team needs you. We’ve been working hard [...]]]></description>
			<content:encoded><![CDATA[<p><a title="kumo screenshot" href="http://2.bp.blogspot.com/_FuHc5SqNMxA/Sb-gnnZCwzI/AAAAAAAAAMM/ZNpFoVEAemY/s1600-h/kumo.jpg" target="_blank"><img id="BLOGGER_PHOTO_ID_5314142687769838386" style="display: block; margin: 0px auto 10px; text-align: center; cursor: hand; width: 400px; height: 225px;" src="http://2.bp.blogspot.com/_FuHc5SqNMxA/Sb-gnnZCwzI/AAAAAAAAAMM/ZNpFoVEAemY/s400/kumo.jpg" border="0" alt="" /></a><br />
3月初，微软语义搜索引擎kumo在公司内部测试并希望全体员工积极反馈意见。微软搜索部门主管在给员工的信件中如是说：</p>
<p><span id="more-591"></span></p>
<blockquote><p>From: Satya Nadella</p>
<p>Sent: Monday, March 02, 2009 4:18 PM<br />
To: Microsoft–All Employees (QBDG)<br />
Subject: Announcement: Internal Search Test Experience</p>
<p>The Search team needs you. We’ve been working hard to improve our search service and want to share the progress we are making with you. We are launching a new test program called kumo.com for employees to try and provide feedback. Kumo.com exists only inside the corporate network, and in order to get enough feedback we will be redirecting internal live.com traffic over to the test site in the coming days. Kumo is the codename we have chosen for the internal test.</p>
<p>In spite of the progress made by search engines, 40% of queries go unanswered; half of queries are about searchers returning to previous tasks; and 46% of search sessions are longer than 20 minutes. These and many other learnings suggest that customers often don’t find what they need from search today.</p>
<p>We believe we can provide a better and more useful search experience that helps you not just search but accomplish tasks. During the test, features will vary by country, but you’ll see results organized in a way that saves you more time. An explorer pane on the left side of results pages will give you access to tools that help you with your tasks. Other features like single session history and hover preview help accomplish more in search sessions.</p>
<p>Your Next Search…</p>
<p>To get started, visit kumo.com or click one of the samples below to see how it’s possible to find the right results more easily:</p>
<p>· Audi S8<br />
· Taylor Swift<br />
. Bose Lifestyle 48</p>
<p>You can also set your search defaults to test site using the instructions here.</p>
<p>Your Feedback is Critical</p>
<p>As employees, you are some of our most informed users and our toughest critics, and we highly value your input and feedback to help us build a better service. You have been an important voice in our efforts, and the feedback you’ve sent us since the company meeting has been amazing.</p>
<p>When you visit kumo.com, at the bottom right corner of the each page you’ll see a feedback badge. We ask that each time you use the test site, click the feedback badge and take a moment to answer four quick and simple questions. Feel free to reach out to give us extra feedback directly on our blog and by mailing sfeed. For answers to common questions make sure to see our FAQ.</p>
<p>We are committed to rapid innovation and improvement. Please give the test site a try, rate the results and let us know what you think.</p>
<p>Satya</p></blockquote>
<p><a title="点击看大图" href="http://3.bp.blogspot.com/_FuHc5SqNMxA/Sb-g76d6XkI/AAAAAAAAAMk/ix-YsEnIi6I/s1600-h/kumo1.gif" target="_blank"><img id="BLOGGER_PHOTO_ID_5314143036487917122" style="cursor: hand; width: 86px; height: 200px;" src="http://3.bp.blogspot.com/_FuHc5SqNMxA/Sb-g76d6XkI/AAAAAAAAAMk/ix-YsEnIi6I/s200/kumo1.gif" border="0" alt="" /></a><a title="点击看大图" href="http://4.bp.blogspot.com/_FuHc5SqNMxA/Sb-g7t9InCI/AAAAAAAAAMc/lqKr4n6oC94/s1600-h/kumo2.gif" target="_blank"><img id="BLOGGER_PHOTO_ID_5314143033129212962" style="cursor: hand; width: 72px; height: 200px;" src="http://4.bp.blogspot.com/_FuHc5SqNMxA/Sb-g7t9InCI/AAAAAAAAAMc/lqKr4n6oC94/s200/kumo2.gif" border="0" alt="" /></a><a title="点击看大图" href="http://3.bp.blogspot.com/_FuHc5SqNMxA/Sb-g7W2ofQI/AAAAAAAAAMU/BuLTMYiX2ZQ/s1600-h/kumo3.gif" target="_blank"><img id="BLOGGER_PHOTO_ID_5314143026927926530" style="cursor: hand; width: 80px; height: 200px;" src="http://3.bp.blogspot.com/_FuHc5SqNMxA/Sb-g7W2ofQI/AAAAAAAAAMU/BuLTMYiX2ZQ/s200/kumo3.gif" border="0" alt="" /></a></p>
<p>在几张截图中，我们可以看到语义检索的特征非常明显，根据关键字做结果分类和查询导航，左下角的your history不知道会不会是实时的兴趣分析之用，期待kumo的正式推出，拭目以待吧。<br />
据分析说kumo会有基于图像相似度的图片检索出现，不知真伪了。</p>
<p>来源 <a href="http://kara.allthingsd.com/20090302/a-sneak-peek-look-at-microsofts-new-kumo/" target="_blank">1</a> , <a href="http://www.technewsworld.com/story/Will-Microsofts-Kumo-Bring-New-Visual-Dimension-to-Search-66366.html?wlc=1237288154" target="_blank">2</a></p>
]]></content:encoded>
			<wfw:commentRss>http://clfour.com/2009/03/a-sneak-peek-at-kumo/feed/</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
		<item>
		<title>google, semantics</title>
		<link>http://clfour.com/2009/01/google-semantics/</link>
		<comments>http://clfour.com/2009/01/google-semantics/#comments</comments>
		<pubDate>Sun, 11 Jan 2009 02:06:23 +0000</pubDate>
		<dc:creator>Fred</dc:creator>
				<category><![CDATA[资讯]]></category>
		<category><![CDATA[google]]></category>
		<category><![CDATA[IT]]></category>
		<category><![CDATA[search]]></category>
		<category><![CDATA[semantic search]]></category>

		<guid isPermaLink="false">http://www.clfour.com/?p=508</guid>
		<description><![CDATA[Did Google Just Expose Semantic Data in Search Results? ReedWriteWeb的Marshall Kirkpatrick，6号写了一篇这样的文章，立刻收到了极大的关注。他通过对google search的Q&#38;A查询的反馈结果，猜想google可能采用了查询的结构化处理。这与以往google采用的PageRank以及流行度的分析等方法哟明显的不同，现在Yahoo，PowerSet，ASK，Hikia的语义检索大张旗鼓的进行，google的这一点的尝试和修改，无论是对竞争对手还是普通用户都是一个信号。因此，在这篇文章的提示下，有了许多文章。Yes, Google Is Doing Semantic Search ，里说google已经加入了语义搜索的聚会，并表示google的这项技术早在05年就开始了，有一篇官方的blog为佐。arnold在读了这篇文章后也认为这是一个有价值的无责任实验，一个重要的信号。 当然，技术并不是人而且还不是成熟的，它还是要基于许多无法考证的资料来推理总结以试图给予用户确切答案。Daniel Nations发现一个可笑的错误，根据google的结果，基督是出生在1963年的。。。我在尝试相同的查询时，已经没有了答案，而且那片文章中下午还存在图片晚上也不见了，难道也被rivercrab掉了？ ps：上图是我用google.com查询who is the president of the USA?的结果。查vice president以及who will be [...]]]></description>
			<content:encoded><![CDATA[<p><img id="BLOGGER_PHOTO_ID_5289727156455360482" style="width: 320px; cursor: hand; height: 210px;" src="http://3.bp.blogspot.com/_FuHc5SqNMxA/SWji0pdCR-I/AAAAAAAAAJU/619UrmQF1As/s320/googlesearch080111.jpg" border="0" alt="" /></p>
<p><a href="http://www.readwriteweb.com/archives/google_semantic_data.php" target="_blank">Did Google Just Expose Semantic Data in Search Results?</a> ReedWriteWeb的Marshall Kirkpatrick，6号写了一篇这样的文章，立刻收到了极大的关注。他通过对google search的Q&amp;A查询的反馈结果，猜想google可能采用了查询的结构化处理。这与以往google采用的PageRank以及流行度的分析等方法哟明显的不同，现在Yahoo，PowerSet，ASK，Hikia的语义检索大张旗鼓的进行，google的这一点的尝试和修改，无论是对竞争对手还是普通用户都是一个信号。因此，在这篇文章的提示下，有了许多文章。<a href="http://googlewatch.eweek.com/content/google_search/yes_google_is_doing_semantic_search.html" target="_blank">Yes, Google Is Doing Semantic Search</a> ，里说google已经加入了语义搜索的聚会，并表示google的这项技术早在05年就开始了，有一篇<a href="http://googleblog.blogspot.com/2005/04/just-facts-fast.html" target="_blank">官方的blog</a>为佐。<a href="http://arnoldit.com/wordpress/2009/01/08/google-semantics-surfacing/" target="_blank">arnold</a>在读了这篇文章后也认为这是一个有价值的无责任实验，一个重要的信号。</p>
<p>当然，技术并不是人而且还不是成熟的，它还是要基于许多无法考证的资料来推理总结以试图给予用户确切答案。<a href="http://webtrends.about.com/b/2009/01/07/google-claims-jesus-born-in-1963.htm" target="_blank">Daniel Nations</a>发现一个可笑的错误，根据google的结果，基督是出生在1963年的。。。我在尝试相同的查询时，已经没有了答案，而且那片文章中下午还存在图片晚上也不见了，难道也被rivercrab掉了？</p>
<p>ps：上图是我用google.com查询who is the president of the USA?的结果。查vice president以及who will be the president of the USA?都不会有结果提示了。。。但是把the USA改成China，主席和副主席都能直接给答案了 呵呵 :rolleyes:</p>
]]></content:encoded>
			<wfw:commentRss>http://clfour.com/2009/01/google-semantics/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>news digest</title>
		<link>http://clfour.com/2008/12/digest-of-semantic-search-news/</link>
		<comments>http://clfour.com/2008/12/digest-of-semantic-search-news/#comments</comments>
		<pubDate>Sat, 20 Dec 2008 08:21:12 +0000</pubDate>
		<dc:creator>Fred</dc:creator>
				<category><![CDATA[干活]]></category>
		<category><![CDATA[折腾]]></category>
		<category><![CDATA[资讯]]></category>
		<category><![CDATA[IT]]></category>
		<category><![CDATA[search]]></category>
		<category><![CDATA[semantic search]]></category>
		<category><![CDATA[Study]]></category>

		<guid isPermaLink="false">http://www.clfour.com/?p=429</guid>
		<description><![CDATA[●Semantic Sense for the Desktop A project brings Semantic Web technology to personal documents. 这篇是对Nepomuk Project的介绍，讲了语义桌面的出发点，之前的研究，此项目的的一些特点和方法，最后的有给出下载链接，不过安装不是一步到位的，需要些前期步骤。感兴趣的可以下载试试。 ●Powerset Gives Microsoft Semantic Search Tools 结合Scott Prevost, general manager and product director at [...]]]></description>
			<content:encoded><![CDATA[<p><img id="BLOGGER_PHOTO_ID_5281433389404450514" style="float: left; margin: 0px 10px 10px 0px; width: 200px; cursor: hand; height: 95px;" src="http://3.bp.blogspot.com/_FuHc5SqNMxA/SUtrr3hW7tI/AAAAAAAAAE4/xY2IcLfWA7k/s200/nepomuk-logo.320.png" border="0" alt="" /></p>
<p>●<a href="http://www.technologyreview.com/web/21840/page1/" target="_blank">Semantic Sense for the Desktop<br />
</a>A project brings Semantic Web technology to personal documents.</p>
<p>这篇是对Nepomuk Project的介绍，讲了语义桌面的出发点，之前的研究，此项目的的一些特点和方法，最后的有给出下载链接，不过安装不是一步到位的，需要些前期步骤。感兴趣的可以<a href="http://dev.nepomuk.semanticdesktop.org/wiki/UsingNepomuk" target="_blank">下载</a>试试。<br />
<span id="more-429"></span></p>
<p><img id="BLOGGER_PHOTO_ID_5281434193085408370" style="float: left; margin: 0px 10px 10px 0px; width: 200px; cursor: hand; height: 72px;" src="http://1.bp.blogspot.com/_FuHc5SqNMxA/SUtsapd1JHI/AAAAAAAAAFI/iYtqg1gRYZg/s200/web3.0.png" border="0" alt="" />●<a href="http://reddevnews.com//news/devnews/article.aspx?editorialsid=1205" target="_blank">Powerset Gives Microsoft Semantic Search Tools<br />
</a>结合Scott Prevost, general manager and product director at Powerset和Gartner Inc. analyst Rita Knox的观点的一篇文章。<br />
After its Powerset acquisition, Microsoft is pushing semantic search as the replacement for traditional keyword search.<br />
对语义检索和基于关键字检索的比较：”Current search technology just doesn&#8217;t leverage all of the affordances of Web 3.0-semantic Web, structured data, interoperability, collaborative filtering,” says Scott Prevost, general manager and product director at Powerset. “Keyword search just doesn&#8217;t address these things.” “Everything today is about the keywords,” Prevost told attendees. “And there are a lot of casualties in this keyword economy.”<br />
对与powerset中NLP技术的来源：<br />
Roots from PARC<br />
Powerset relies on very deep natural language processing (NLP), technology that has been in the lab for 30 years but has only recently become computationally feasible because of high-performance computing technologies. Powerset&#8217;s semantic search app uses this technology-which the company licenses from Palo Alto Research Center (PARC)-to extract meaning from documents one at a time and encode that meaning into its index. Meaning and intent are extracted from queries at runtime. Matching the meaning of those queries with the meaning in the index renders better search results, he says.<br />
Rita Knox 将语义搜索定义为利用基于用户寻找信息所包含的，而机器自身不能掌握的微妙的语义为线索的搜索。<br />
Gartner Inc. analyst Rita Knox defines semantic searches as those that use clues about the information users are seeking based on semantic subtleties that machines have yet to master on their own.</p>
<p>“When pieces of information are labeled, computers can see what they mean; but most information is not labeled-it&#8217;s unstructured,” Knox says. “Without the labels or tags, computers are at a loss to make a human kind of sense out of things like text. The promise of semantic search is that it will provide that understanding to the machines, and that will result in more meaningful and relevant search results.”</p>
<p>另外，Open APIs Coming??</p>
]]></content:encoded>
			<wfw:commentRss>http://clfour.com/2008/12/digest-of-semantic-search-news/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>微软新搜索引擎—&gt;kumo.com?</title>
		<link>http://clfour.com/2008/11/kumo-to-be-live-search-new-brand/</link>
		<comments>http://clfour.com/2008/11/kumo-to-be-live-search-new-brand/#comments</comments>
		<pubDate>Mon, 24 Nov 2008 14:39:01 +0000</pubDate>
		<dc:creator>Fred</dc:creator>
				<category><![CDATA[干活]]></category>
		<category><![CDATA[资讯]]></category>
		<category><![CDATA[IT]]></category>
		<category><![CDATA[kumo]]></category>
		<category><![CDATA[ms]]></category>
		<category><![CDATA[search]]></category>
		<category><![CDATA[semantic search]]></category>

		<guid isPermaLink="false">http://www.clfour.com/?p=300</guid>
		<description><![CDATA[Updated: 微软最新搜索引擎定名为：bing (查看) 几天前，某关注微软Live动向的独立网站的一篇文章，让许多对微软搜索引擎的传言也更加流行起来。文章指出微软在近期收购了一个新的域名kumo.com，并将它指向了live search的部分服务器，当前供员工内部测试使用。kumo在日语中是云或者蜘蛛的意思，在结合当前云计算的热潮以及微软之前的动向（上周四微软确认雅虎搜索执行官将成为微软硅谷搜索技术中心的总经理，收购语义检索公司Powerset），真的让人会有所期待了。live大张旗鼓进军google的地盘，没有撼动google的位置，现在微软在收购yahoo无期的情况下，动作拼出，看来势必在搜索上会有一番表现了。当然，微软官方对此次民间的传言保持沉默中ing 到底kumo.com会有何用我们还不能知，文章说在未来6－12个月内就会有明确答案了，语义？云计算？新的live search？ ps：搞了个日语，估计某国又要举国欢腾了，不是说奥巴马竞选成功就有某市因为其名与未来美国总统发音类似而提前过了个年~ 当然，要是那天google改名yun.com我也很高兴 哈哈 其他相关连接： http://news.cnet.com/8301-10805_3-10106314-75.html http://www.guardian.co.uk/technology/blog/2008/nov/24/microsoft-live-kumo http://www.theregister.co.uk/2008/11/24/kumo_windows_live_search/ http://tinycomb.com/2008/11/23/kumo-microsofts-new-search-engine/ http://www.efluxmedia.com/news_Kumo_The_new_name_Of_Microsoft_Live_Search_29731.html]]></description>
			<content:encoded><![CDATA[<h3>
<p style="text-align: left;"><strong><span style="color: #0000ff;">Updated: 微软最新搜索引擎定名为：bing (<span style="color: #ffff00;"><a href="http://http://www.clfour.com/2009/05/ms-kumo-to-be/" target="_blank">查看</a></span>)</span></strong></p>
</h3>
<p style="text-align: left;"><img title="bing" src="http://clfour.com/wp-content/uploads/2009/05/bing2.png" alt="bing" width="150" height="59" align="left" /></p>
<p><a href="http://2.bp.blogspot.com/_FuHc5SqNMxA/SSq7K4nu3UI/AAAAAAAAAC8/L5APEcS6ct4/s1600-h/Live_Search_Logo.jpg" onblur="function onblur() { try {parent.deselectBloggerImageGracefully();} catch(e) {} }"><img id="BLOGGER_PHOTO_ID_5272232109462707522" style="width: 140px; height: 45px; cursor: pointer;" src="http://2.bp.blogspot.com/_FuHc5SqNMxA/SSq7K4nu3UI/AAAAAAAAAC8/L5APEcS6ct4/s200/Live_Search_Logo.jpg" border="0" alt="" /></a><a href="http://4.bp.blogspot.com/_FuHc5SqNMxA/SSq7LfVCIMI/AAAAAAAAADE/gDxcpzR-Yd8/s1600-h/kumo1.jpg" onblur="function onblur() { try {parent.deselectBloggerImageGracefully();} catch(e) {} }"><img id="BLOGGER_PHOTO_ID_5272232119853260994" style="width: 105px; height: 70px; cursor: pointer;" src="http://4.bp.blogspot.com/_FuHc5SqNMxA/SSq7LfVCIMI/AAAAAAAAADE/gDxcpzR-Yd8/s200/kumo1.jpg" border="0" alt="" /></a></p>
<p><a href="http://4.bp.blogspot.com/_FuHc5SqNMxA/SSq7LfVCIMI/AAAAAAAAADE/gDxcpzR-Yd8/s1600-h/kumo1.jpg"></a></p>
<p>几天前，某关注微软Live动向的独立网站的一篇<a href="http://www.liveside.net/main/archive/2008/11/23/microsoft-takes-control-of-kumo-com-domain-watch-out-for-the-live-search-rebrand.aspx" target="_blank">文章</a>，让许多对微软搜索引擎的传言也更加流行起来。文章指出微软在近期收购了一个新的域名kumo.com，并将它指向了live search的部分服务器，当前供员工内部测试使用。kumo在日语中是云或者蜘蛛的意思，在结合当前云计算的热潮以及微软之前的动向（上周四微软确认雅虎搜索执行官将成为微软硅谷搜索技术中心的总经理，收购语义检索公司P<span id="intelliTXT">owerset</span>），真的让人会有所期待了。live大张旗鼓进军google的地盘，没有撼动google的位置，现在微软在收购yahoo无期的情况下，动作拼出，看来势必在搜索上会有一番表现了。当然，微软官方对此次民间的传言保持沉默中ing</p>
<p>到底kumo.com会有何用我们还不能知，文章说在未来6－12个月内就会有明确答案了，语义？云计算？新的live search？</p>
<p>ps：搞了个日语，估计某国又要举国欢腾了，不是说奥巴马竞选成功就有某市因为其名与未来美国总统发音类似而提前过了个年~ 当然，要是那天google改名yun.com我也很高兴 哈哈</p>
<p>其他相关连接：</p>
<p>http://news.cnet.com/8301-10805_3-10106314-75.html</p>
<p>http://www.guardian.co.uk/technology/blog/2008/nov/24/microsoft-live-kumo</p>
<p>http://www.theregister.co.uk/2008/11/24/kumo_windows_live_search/</p>
<p>http://tinycomb.com/2008/11/23/kumo-microsofts-new-search-engine/</p>
<p>http://www.efluxmedia.com/news_Kumo_The_new_name_Of_Microsoft_Live_Search_29731.html</p>
]]></content:encoded>
			<wfw:commentRss>http://clfour.com/2008/11/kumo-to-be-live-search-new-brand/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>google开始走向语义检索？(updated)</title>
		<link>http://clfour.com/2008/11/will-google-move-towards-semantic-search/</link>
		<comments>http://clfour.com/2008/11/will-google-move-towards-semantic-search/#comments</comments>
		<pubDate>Sun, 23 Nov 2008 11:56:14 +0000</pubDate>
		<dc:creator>Fred</dc:creator>
				<category><![CDATA[干活]]></category>
		<category><![CDATA[资讯]]></category>
		<category><![CDATA[google]]></category>
		<category><![CDATA[IT]]></category>
		<category><![CDATA[search]]></category>
		<category><![CDATA[semantic search]]></category>
		<category><![CDATA[Study]]></category>

		<guid isPermaLink="false">http://www.clfour.com/?p=289</guid>
		<description><![CDATA[  最近几天没有关注Google Alert 的内容，今天一看，有这么一条消息：Google launches its SearchWiki semantics plug-in。前一段时间Semanti Corp. 发布消息，自己的语义检索插件SemantiFind支持yahoo, msn, google的搜索引擎。而微软买了Powerset（这个试了下没什么感觉，用过的评价下？）后，也有了语义检索引擎，ask也开始尝试语义的东西，而yahoo早在3月份就宣布进军语义网，看来当今检索大佬google也坐不住了，现在自己也加入了一些新变化。记得是一年之内的一次校园招聘里面（或者会议？），微软还是google的管理层被问到语义检索的时候，还是一脸的怀疑，并声称没有这方面的打算，可现在大家却都纷纷着手做了起来。语义，看来真的是下一个网络时代的潮流，真的会变成web3.0了，当前语义的效果确实不尽如人意，但是如果成功的话，影响将是不可忽视的。IBM，微软，google，不同时代的代表，下一个会是谁？大家争先恐后。 言归正传，说说google的SearchWiki，思想上借鉴了wiki的东西，允许用户对检索的结果进行提升，删除和评论，但是每个用户的改变只影响自己的检索结果，不过可以看到大家对检索结果的编辑情况。其实，google当前的变化还很简单，算不上语义，只能算是个性化订制的一点扩展，感觉比SemantiFind还要简单，不过也算是对用户意图的改进了。刚刚在google上找了一下，也没看到这个插件，却发现了这样片文章：Google SearchWiki Vanishes (Updated)，打开一看，写道google说这是因为有bug，正在恢复中。。。  更新：现在可以用了，不过要上http://www.google.com/并登陆账号才可以~   我晕了 ，一会能用，一会不能用，估计测试中。。。 提供一个youtube上google对SearchWiki介绍的视频，感兴趣的可以了解下： 其他相关链接： http://www.betanews.com/article/Askcom_v_11_tries_new_search_technologies/1223316977 http://www.betanews.com/article/New_Google_tools_sift_and_sort_search_results/1225353991 http://news.bbc.co.uk/1/hi/technology/7296056.stm http://www.betanews.com/article/Semantic_search_plugin_comes_to_Google_Yahoo_MSN/1225720138 http://googleblog.blogspot.com/2008/11/searchwiki-make-search-your-own.html http://searchengineland.com/google-searchwiki-101-an-illustrated-guide-15580.php http://googlesystem.blogspot.com/2008/11/google-searchwiki-launched.html]]></description>
			<content:encoded><![CDATA[<p><a href="http://2.bp.blogspot.com/_FuHc5SqNMxA/SSlCEAVqcuI/AAAAAAAAAC0/Jr3VgenP9vk/s1600-h/google-searchwiki-weather.png"><img id="BLOGGER_PHOTO_ID_5271817475391648482" style="width: 200px; cursor: hand; height: 186px;" src="http://2.bp.blogspot.com/_FuHc5SqNMxA/SSlCEAVqcuI/AAAAAAAAAC0/Jr3VgenP9vk/s200/google-searchwiki-weather.png" border="0" alt="" align="top" /></a>  <a href="http://1.bp.blogspot.com/_FuHc5SqNMxA/SSlB2ARdFtI/AAAAAAAAACs/q_iol5tkno4/s1600-h/google-searchwiki-notes.png"><img id="BLOGGER_PHOTO_ID_5271817234855827154" style="width: 200px; cursor: hand; height: 138px;" src="http://1.bp.blogspot.com/_FuHc5SqNMxA/SSlB2ARdFtI/AAAAAAAAACs/q_iol5tkno4/s200/google-searchwiki-notes.png" border="0" alt="" align="top" /></a></p>
<p>最近几天没有关注Google Alert 的内容，今天一看，有这么一条消息：<a href="http://www.betanews.com/article/Google_launches_its_SearchWiki_semantics_plugin/1227300323" target="_blank">Google launches its SearchWiki semantics plug-in</a>。前一段时间<a href="www.semantifind.com/ " target="_blank">Semanti Corp. </a>发布消息，自己的语义检索插件<a title="点击下载~谁能下载？国内好像打不开" href="http://www.semantifind.com/getStarted.jsp" target="_blank">SemantiFind</a>支持yahoo, msn, google的搜索引擎。而微软买了<a href="http://www.powerset.com/" target="_blank">Powerset</a>（这个试了下没什么感觉，用过的评价下？）后，也有了语义检索引擎，ask也开始尝试语义的东西，而yahoo早在3月份就宣布进军语义网，看来当今检索大佬google也坐不住了，现在自己也加入了一些新变化。记得是一年之内的一次校园招聘里面（或者会议？），微软还是google的管理层被问到语义检索的时候，还是一脸的怀疑，并声称没有这方面的打算，可现在大家却都纷纷着手做了起来。语义，看来真的是下一个网络时代的潮流，真的会变成web3.0了，当前语义的效果确实不尽如人意，但是如果成功的话，影响将是不可忽视的。IBM，微软，google，不同时代的代表，下一个会是谁？大家争先恐后。</p>
<p>言归正传，说说google的SearchWiki，思想上借鉴了wiki的东西，允许用户对检索的结果进行提升，删除和评论，但是每个用户的改变只影响自己的检索结果，不过可以看到大家对检索结果的编辑情况。其实，google当前的变化还很简单，算不上语义，只能算是个性化订制的一点扩展，感觉比SemantiFind还要简单，不过也算是对用户意图的改进了。<span style="text-decoration: line-through;">刚刚在google上找了一下，也没看到这个插件，却发现了这样片文章：</span><a href="http://www.techcrunch.com/2008/11/22/google-searchwiki-vanishes/" target="_blank"><span style="text-decoration: line-through;">Google SearchWiki Vanishes (Updated)</span></a><span style="text-decoration: line-through;">，打开一看，写道google说这是因为有bug，正在恢复中。。。</span>  <span style="text-decoration: line-through;">更新：现在可以用了，不过要上</span><a href="http://www.google.com/"><span style="text-decoration: line-through;">http://www.google.com/</span></a><span style="text-decoration: line-through;">并登陆账号才可以~</span>   我晕了 <img src='http://clfour.com/wp-includes/images/smilies/icon_surprised.gif' alt=':eek:' class='wp-smiley' />  ，一会能用，一会不能用，估计测试中。。。</p>
<p>提供一个youtube上google对SearchWiki介绍的视频，感兴趣的可以了解下：<br />
<object classid="clsid:d27cdb6e-ae6d-11cf-96b8-444553540000" width="425" height="344" codebase="http://download.macromedia.com/pub/shockwave/cabs/flash/swflash.cab#version=6,0,40,0"><param name="allowFullScreen" value="true" /><param name="allowscriptaccess" value="always" /><param name="src" value="http://www.youtube.com/v/t8Pl1H0dIXE&amp;hl=en&amp;fs=1" /><embed type="application/x-shockwave-flash" width="425" height="344" src="http://www.youtube.com/v/t8Pl1H0dIXE&amp;hl=en&amp;fs=1" allowfullscreen="true" allowscriptaccess="always"></embed></object></p>
<p>其他相关链接：</p>
<p><a href="http://www.betanews.com/article/Askcom_v_11_tries_new_search_technologies/1223316977">http://www.betanews.com/article/Askcom_v_11_tries_new_search_technologies/1223316977</a><br />
<a href="http://www.betanews.com/article/New_Google_tools_sift_and_sort_search_results/1225353991">http://www.betanews.com/article/New_Google_tools_sift_and_sort_search_results/1225353991</a><br />
<a href="http://news.bbc.co.uk/1/hi/technology/7296056.stm">http://news.bbc.co.uk/1/hi/technology/7296056.stm</a><br />
<a href="http://www.betanews.com/article/Semantic_search_plugin_comes_to_Google_Yahoo_MSN/1225720138">http://www.betanews.com/article/Semantic_search_plugin_comes_to_Google_Yahoo_MSN/1225720138</a><br />
<a href="http://googleblog.blogspot.com/2008/11/searchwiki-make-search-your-own.html">http://googleblog.blogspot.com/2008/11/searchwiki-make-search-your-own.html</a><br />
<a href="http://searchengineland.com/google-searchwiki-101-an-illustrated-guide-15580.php">http://searchengineland.com/google-searchwiki-101-an-illustrated-guide-15580.php</a><br />
<a href="http://googlesystem.blogspot.com/2008/11/google-searchwiki-launched.html">http://googlesystem.blogspot.com/2008/11/google-searchwiki-launched.html</a></p>
]]></content:encoded>
			<wfw:commentRss>http://clfour.com/2008/11/will-google-move-towards-semantic-search/feed/</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
	</channel>
</rss>

