<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>可乐福的家园 &#187; 干活</title>
	<atom:link href="http://clfour.com/category/workwork/feed/" rel="self" type="application/rss+xml" />
	<link>http://clfour.com</link>
	<description>fun being me</description>
	<lastBuildDate>Sat, 31 Dec 2011 14:36:38 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.3.1</generator>
		<item>
		<title>[ZZ]机器学习（Machine Learning）大家</title>
		<link>http://clfour.com/2009/04/machine-learning-big-master/</link>
		<comments>http://clfour.com/2009/04/machine-learning-big-master/#comments</comments>
		<pubDate>Fri, 03 Apr 2009 15:57:09 +0000</pubDate>
		<dc:creator>Fred</dc:creator>
				<category><![CDATA[FunFun]]></category>
		<category><![CDATA[干活]]></category>
		<category><![CDATA[IT]]></category>
		<category><![CDATA[Study]]></category>
		<category><![CDATA[ZZ]]></category>

		<guid isPermaLink="false">http://www.clfour.com/?p=650</guid>
		<description><![CDATA[据说是N年前南大小百合上的帖子，不过风格挺好的，转来仰慕下吧。不知牛人们现在干啥了都。 闲着无事，想写点一些我所了解的machine learning大家。由于学识浅薄，见识有限，并且仅局限于某些领域，一些在NLP及最近很热的生物信息领域活跃的学者我就浅陋无知，所以不对的地方大家仅当一笑。 Machine Learning 大家(1)：M. I. Jordan 在我的眼里，M Jordan无疑是武林中的泰山北斗。他师出MIT，现在在berkeley坐镇一方，在附近的两所名校（加stanford）中都可以说无出其右者，stanford的Daphne Koller虽然也声名遐迩，但是和Jordan比还是有一段距离。 Jordan身兼stat和cs两个系的教授，从他身上可以看出Stat和ML的融合。 Jordan 最先专注于mixtures of experts，并迅速奠定了自己的地位，我们哈尔滨工业大学的校友徐雷跟他做博后期间，也在这个方向上沾光不少。Jordan和他的弟子在很多方面作出了开创性的成果，如spectral clustering， Graphical model和nonparametric Bayesian。现在后两者在ML领域是非常炙手可热的两个方向，可以说很大程度上是Jordan的lab一手推动的。 更难能可贵的是， Jordan不仅自己武艺高强，并且揽钱有法，教育有方，手下门徒众多且很多人成了大器，隐然成为江湖大帮派。他的弟子中有10多人任教授，个人认 为他现在的弟子中最出色的是stanford的Andrew Ng，不过由于资历原因，现在还是assistant professor，不过成为大教授指日可待；另外Tommi Jaakkola和David Blei也非常厉害，其中Tommi Jaakkola在mit任教而David Blei在cmu做博后，数次获得NIPS最佳论文奖，把SVM的最大间隔方法和Markov network的structure结构结合起来，赫赫有名。还有一个博后是来自于toronto的Yee [...]]]></description>
			<content:encoded><![CDATA[<p>据说是N年前南大小百合上的帖子，不过风格挺好的，转来仰慕下吧。不知牛人们现在干啥了都。</p>
<p>闲着无事，想写点一些我所了解的machine learning大家。由于学识浅薄，见识有限，并且仅局限于某些领域，一些在NLP及最近很热的生物信息领域活跃的学者我就浅陋无知，所以不对的地方大家仅当一笑。</p>
<p>Machine Learning 大家(1)：M. I. Jordan</p>
<p>在我的眼里，M Jordan无疑是武林中的泰山北斗。他师出MIT，现在在berkeley坐镇一方，在附近的两所名校（加stanford）中都可以说无出其右者，stanford的Daphne Koller虽然也声名遐迩，但是和Jordan比还是有一段距离。</p>
<p><span id="more-650"></span> Jordan身兼stat和cs两个系的教授，从他身上可以看出Stat和ML的融合。</p>
<p>Jordan 最先专注于mixtures of experts，并迅速奠定了自己的地位，我们哈尔滨工业大学的校友徐雷跟他做博后期间，也在这个方向上沾光不少。Jordan和他的弟子在很多方面作出了开创性的成果，如spectral clustering， Graphical model和nonparametric Bayesian。现在后两者在ML领域是非常炙手可热的两个方向，可以说很大程度上是Jordan的lab一手推动的。</p>
<p>更难能可贵的是， Jordan不仅自己武艺高强，并且揽钱有法，教育有方，手下门徒众多且很多人成了大器，隐然成为江湖大帮派。他的弟子中有10多人任教授，个人认</p>
<p>为他现在的弟子中最出色的是stanford的Andrew Ng，不过由于资历原因，现在还是assistant professor，不过成为大教授指日可待；另外Tommi Jaakkola和David Blei也非常厉害，其中Tommi Jaakkola在mit任教而David Blei在cmu做博后，数次获得NIPS最佳论文奖，把SVM的最大间隔方法和Markov network的structure结构结合起来，赫赫有名。还有一个博后是来自于toronto的Yee Whye Teh，非常不错，有幸跟他打过几次交道，人非常nice。另外还有一个博后居然在做生物信息方面的东西，看来jordan在这方面也捞了钱。这方面他有一个中国学生Eric P. Xing(清华大学校友)，现在在cmu做assistant professor。</p>
<p>总的说来，我觉得 Jordan现在做的主要还是graphical model和Bayesian learning，他去年写了一本关于graphical model的书，今年由mit press出版，应该是这个领域里程碑式的著作。3月份曾经有人答应给我一本打印本看看，因为Jordan不让他传播电子版，但后来好像没放在心上（可见美国人也不是很守信的），人不熟我也不好意思问着要，可以说是一大遗憾. 另外发现一个有趣的现象就是Jordan对hierarchical情有独钟，相当多的文章都是关于hierarchical的，所以能 hierarchical大家赶快hierarchical，否则就让他给抢了。</p>
<p>用我朋友话说看jordan牛不牛，看他主页下面的Past students and postdocs就知道了。</p>
<p>Machine Learning大家（2）：D. Koller</p>
<p>D. Koller是1999年美国青年科学家总统奖(PECASE)得主，IJCAI 2001 Computers and Thought Award(IJCAI计算机与思维奖，这是国际人工智能界35岁以下青年学者的最高奖)得主，2004 World Technology Award得主。</p>
<p>最先知道D koller是因为她得了一个大奖，2001年IJCAI计算机与思维奖。Koller因她在概率推理的理论和实践、机器学习、计算博弈论等领域的重要贡献，成为继Terry Winograd、David Marr、Tom Mitchell、Rodney Brooks等人之后的第18位获奖者。说起这个奖挺有意思的，IJCAI终身成就奖（IJCAI Award for Research Excellence），是国际人工智能界的最高荣誉; IJCAI计算机与思维奖是国际人工智能界35岁以下青年学者的最高荣誉。早期AI研究将推理置于至高无上的地位; 但是1991年牛人Rodney Brooks对推理全面否定，指出机器只能独立学习而得到了IJCAI计算机与思维奖; 但是koller却因提出了Probabilistic Relational Models 而证明机器可以推理论知而又得到了这个奖，可见世事无绝对，科学有轮回。</p>
<p>D koller的Probabilistic Relational Models在nips和icml等各种牛会上活跃了相当长的一段时间，并且至少在实验室里证明了它在信息搜索上的价值，这也导致了她的很多学生进入了 google。虽然进入google可能没有在牛校当faculty名声响亮，但要知道google的很多员工现在可都是百万富翁，在全美大肆买房买车的主。</p>
<p>Koller的研究主要都集中在probabilistic graphical model，如Bayesian网络，但这玩意我没有接触过，我只看过几篇他们的markov network的文章，但看了也就看了，一点想法都没有，这滩水有点深，不是我这种非科班出身的能趟的，并且感觉难以应用到我现在这个领域中。</p>
<p>Koller 才从教10年，所以学生还没有涌现出太多的牛人，这也是她不能跟Jordan比拟的地方，并且由于在stanford的关系，很多学生直接去硅谷赚大钱去了，而没有在学术界开江湖大帮派的影响，但在stanford这可能太难以办到，因为金钱的诱惑实在太大了。不过Koller的一个学生我非常崇拜，叫 Ben Taskar，就是我在（1）中所提到的Jordan的博后，是好几个牛会的最佳论文奖，他把SVM的最大间隔方法和Markov network结合起来，可以说是对structure data处理的一种标准工具，也把最大间隔方法带入了一个新的热潮，近几年很多牛会都有这样的workshop。 我最开始上Ben Taskar的在stanford的个人网页时，正赶上他刚毕业，他的顶上有这么一句话：流言变成了现实，我终于毕业了！可见Koller是很变态的，把自己的学生关得这么郁闷，这恐怕也是大多数女faculty的通病吧，并且估计还非常的push！</p>
<p>Machine learning 大家（3）:J. D. Lafferty</p>
<p>大家都知道NIPS和ICML向来都是由大大小小的山头所割据，而John Lafferty无疑是里面相当高的一座高山，这一点可从他的publication list里的NIPS和ICML数目得到明证。虽然江湖传说计算机重镇CMU现在在走向衰落，但这无碍Lafferty拥有越来越大的影响力，翻开AI兵器谱排名第一的journal of machine learning research的很多文章，我们都能发现author或者editor中赫然有Lafferty的名字。</p>
<p>Lafferty给人留下的最大的印象似乎是他2001年的conditional random fields，这篇文章后来被疯狂引用，广泛地应用在语言和图像处理，并随之出现了很多的变体，如Kumar的discriminative random fields等。虽然大家都知道discriminative learning好，但很久没有找到好的discriminative方法去处理这些具有丰富的contextual inxxxxation的数据，直到Lafferty的出现。</p>
<p>而现在Lafferty做的东西好像很杂，semi－supervised learning， kernel learning，graphical models甚至manifold learning都有涉及，可能就是像武侠里一样只要学会了九阳神功，那么其它的武功就可以一窥而知其精髓了。这里面我最喜欢的是semi－ supervised learning，因为随着要处理的数据越来越多，进行全部label过于困难，而完全unsupervised的方法又让人不太放心，在这种情况下 semi－supervised learning就成了最好的。这没有一个比较清晰的认识，不过这也给了江湖后辈成名的可乘之机。到现在为止，我觉得cmu的semi－ supervised是做得最好的，以前是KAMAL NIGAM做了开创性的工作，而现在Lafferty和他的弟子作出了很多总结和创新。</p>
<p>Lafferty 的弟子好像不是很多，并且好像都不是很有名。不过今年毕业了一个中国人，Xiaojin Zhu(上海交通大学校友)，就是做semi－supervised的那个人，现在在wisconsin-madison做assistant professor。他做了迄今为止最全面的Semi-supervised learning literature survey，大家可以从他的个人主页中找到。这人看着很憨厚，估计是很好的陶瓷对象。另外我在（1）中所说的Jordan的牛弟子D Blei今年也投奔Lafferty做博后，就足见Lafferty的牛了。</p>
<p>Lafferty做NLP是很好的，著名的Link Grammar Parser还有很多别的应用。其中language model在IR中应用，这方面他的另一个中国学生ChengXiang Zhai(南京大学校友，2004年美国青年科学家总统奖(PECASE)得主)，现在在uiuc做assistant professor。</p>
<p>Machine learning 大家（4):Peter L. Bartlett</p>
<p>鄙人浅薄之见，Jordan比起同在berkeley的Peter Bartlett还是要差一个层次。Bartlett主要的成就都是在learning theory方面，也就是ML最本质的东西。他的几篇开创性理论分析的论文，当然还有他的书Neural Network Learning: Theoretical Foundations。</p>
<p>UC Berkeley的统计系在强手如林的北美高校中一直是top3，这就足以证明其肯定是群星荟萃，而其中，Peter L. Bartlett是相当亮的一颗星。关于他的研究，我想可以从他的一本书里得到答案：Neural Network Learning: Theoretical Foundations。也就是说，他主要做的是Theoretical Foundations。基础理论虽然没有一些直接可面向应用的算法那样引人注目，但对科学的发展实际上起着更大的作用。试想vapnik要不是在VC维的理论上辛苦了这么多年，怎么可能有SVM的问世。不过阳春白雪固是高雅，但大多数人只能听懂下里巴人，所以Bartlett的文章大多只能在做理论的那个圈子里产生影响，而不能为大多数人所广泛引用。</p>
<p>Bartlett在最近两年做了大量的Large margin classifiers方面的工作，如其convergence rate和generalization bound等。并且很多是与jordan合作，足见两人的工作有很多相通之处。不过我发现Bartlett的大多数文章都是自己为第一作者，估计是在教育上存在问题吧，没带出特别牛的学生出来。</p>
<p>Bartlett的个人主页的talk里有很多值得一看的slides,如Large Margin Classifiers: Convexity and Classification；Large Margin Methods for Structured Classification: Exponentiated Gradient Algorithms。大家有兴趣的话可以去下来看看。</p>
<p>Machine learning 大家（5): Michael Collins</p>
<p>Michael Collins (<a class="contentlink" href="http://people.csail.mit.edu/mcollins/" target="_blank">http://people.csail.mit.edu/mcollins/</a>)<br />
自然语言处理(NLP)江湖的第一高人。出身Upenn，靠一身叫做Collins Parser的武功在江湖上展露头脚。当然除了资质好之外，其出身也帮了不少忙。早年一个叫做Mitchell P. Marcus的师傅传授了他一本葵花宝典-Penn Treebank。从此，Collins整日沉迷于此，终于练成盖世神功。</p>
<p>学成之后，Collins告别师傅开始闯荡江湖，投入了一个叫AT&amp;T Labs Research的帮会，并有幸结识了Robert Schapire、Yoram Singer等众多高手。大家不要小瞧这个叫AT&amp;T Labs Research的帮会，如果谁没有听过它的大名总该知道它的同父异母的兄弟Bell Labs吧。</p>
<p>言归正传，话说Collins在这里度过了3年快乐的时光。其间也奠定了其NLP江湖老大的地位。并且练就了Discriminative Reranking， Convolution Kernels，Discriminative Training Methods for Hidden Markov Models等多种绝技。然而，世事难料，怎奈由于帮会经营不善，这帮大牛又不会为帮会拼杀，终于被一脚踢开，大家如鸟兽散了。Schapire去了 Princeton， Singer 也回老家以色列了。Collins来到了MIT，成为了武林第一大帮的六袋长老，并教授一门叫做的Machine Learning Approaches for NLP(<a class="contentlink" href="http://www.ai.mit.edu/courses/6.891-nlp/" target="_blank">http://www.ai.mit.edu/courses/6.891-nlp/</a>) 的功夫。虽然这一地位与其功力极不相符，但是这并没有打消Collins的积极性，通过其刻苦打拼，终于得到了一个叫Sloan Research Fellow的头衔，并于今年7月，光荣的升任7袋Associate Professor。</p>
<p>在其下山短短7年时间内，Collins共获得了4次世界级武道大会冠军(EMNLP2002, 2004, UAI2004, 2005)。相信年轻的他，总有一天会一统丐帮，甚至整个江湖。</p>
<p>看过Collins和别人合作的一篇文章，用conditional random fields 做object recogntion。还这么年轻，admire to death！</p>
<p>Machine learning 大家（6): Dan Roth</p>
<p>Dan Roth (<a class="contentlink" href="http://l2r.cs.uiuc.edu/~danr/" target="_blank">http://l2r.cs.uiuc.edu/~danr/</a>)<br />
统计NLP领域的众多学者后，我得出了一个惊人的结论，就是叫Daniel的牛人特别多: 大到MT领域成名已久的Prof. Dan Melamed，小到Stanford刚刚毕业的Dan Klein，</p>
<p>中间又有Dan jurafsky这种牛魔王，甚至Michael Collins的师弟Dan Bikel (IBM Research)，ISI的Dan Marcu，获得过无数次TREC QA评比冠军的Prof. Dan Moldovan (UTexas Dallas)，UC Berkeley毕业的Dan Gildea (U Rochester)。但是，在众多的Dan中，我最崇拜的还是UIUC的Associate Professor，其Cognitive Computation Group的头头Dan Roth。</p>
<p>这位老兄也是极其年轻的，Harvard博士毕业整十年，带领其团队撑起了UIUC Machine Learning以及NLP领域的一片灿烂天空。其领导开发的SNoW工具可谓是一把绝世好剑，基本达到了”又想马儿跑，又想马儿不吃草”的境界，在不损失分类精度的条件下，学习和预测速度空前。什么？你不知道SNoW？它和白雪公主有什么关系？看来我也得学学”超女”的粉丝们，来一个扫盲了: SNoW是Sparse Network of Winnows的简称，其中实现了Winnow算法，但是记住Sparse Network才是其重点，正是因为有了这块玄铁，SNoW之剑才会如此锋利。</p>
<p>近年来Roth也赶时髦，把触角伸向了Structured Data学习领域，但与其他人在学习的时候就试图加入结构化信息(典型的如CRF)不同，Roth主张在预测的最后阶段加入约束进行推理，这可以使的学习效率极大的提高，同时在某些应用上，还取得了更好的结果。还有就是什么Kernel学习，估计他也是学生太多，安排不下了，所以只好开疆扩土。</p>
<p>Harvard出身的Roth，理论功底也极其深厚，好多涉及统计学习理论的工作就不是我这种学工科的人关心的了。</p>
<p>个人补充一点：南京大学的一个Machine Learning的牛人网名也叫Daniel是不是跟文中的叙述有关呢，呵呵～</p>
]]></content:encoded>
			<wfw:commentRss>http://clfour.com/2009/04/machine-learning-big-master/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>[zz] wikiCFP</title>
		<link>http://clfour.com/2009/02/zz-wikicfp/</link>
		<comments>http://clfour.com/2009/02/zz-wikicfp/#comments</comments>
		<pubDate>Mon, 23 Feb 2009 14:27:30 +0000</pubDate>
		<dc:creator>Fred</dc:creator>
				<category><![CDATA[干活]]></category>
		<category><![CDATA[资讯]]></category>
		<category><![CDATA[IT]]></category>
		<category><![CDATA[search]]></category>
		<category><![CDATA[Study]]></category>
		<category><![CDATA[ZZ]]></category>

		<guid isPermaLink="false">http://www.clfour.com/?p=556</guid>
		<description><![CDATA[在ICTExtr9的专栏上看到的，这个wiki在google alert里经常出现，这次又发现有人介绍，而且是做检索相关研究的，就直接copy过来了。在此感谢原搜集者，希望对大家有用！ 1. 推荐一个查找近期会议的网站-wikicfp Wikicfp http://www.wikicfp.com/ 有很多人把各种会议的call for paper发到这个网站上。 可以管理自己关注的会议列表并按照多种方式排序，比如，按deadline排序 2. 相关会议列表 在wikicfp上维护了一个信息抽取相关会议的列表： http://www.wikicfp.com/cfp/servlet/event.showlist?lownerid=2907&#60;ype=w&#038;page=1&#038;sortby=0 还有一些更广泛的，与web mining相关的会议： AAAI: American Association for Artificial Intelligence IJCAI: International Joint Conference on Artificial Intelligence ICML: International [...]]]></description>
			<content:encoded><![CDATA[<p>在<a href="http://blog.csdn.net/ictextr9" target="_blank">ICTExtr9</a>的专栏上看到的，这个wiki在google alert里经常出现，这次又发现有人介绍，而且是做检索相关研究的，就直接copy过来了。在此感谢<a href="http://blog.csdn.net/ictextr9" target="_blank">原搜集者</a>，希望对大家有用！</p>
<p>1. <a href="http://blog.csdn.net/ICTExtr9/archive/2009/01/08/3732544.aspx"><span style="color: #336699;">推荐一个查找近期会议的网站-wikicfp</span></a><br />
Wikicfp</p>
<p>http://www.wikicfp.com/</p>
<p>有很多人把各种会议的call for paper发到这个网站上。<br />
可以管理自己关注的会议列表并按照多种方式排序，比如，按deadline排序</p>
<p>2. <a href="http://blog.csdn.net/ICTExtr9/archive/2009/01/06/3721781.aspx"><span style="color: #336699;">相关会议列表</span></a><br />
在wikicfp上维护了一个信息抽取相关会议的列表：</p>
<p>http://www.wikicfp.com/cfp/servlet/event.showlist?lownerid=2907&lt;ype=w&#038;page=1&#038;sortby=0</p>
<p><span id="more-556"></span>还有一些更广泛的，与web mining相关的会议：<br />
AAAI: American Association for Artificial Intelligence<br />
IJCAI: International Joint Conference on Artificial Intelligence<br />
ICML: International Conference on Machine Learning<br />
SIGMOD: ACM SIGMOD Conf on Management of Data<br />
VLDB: The ACM International Conference on Very Large Data Bases<br />
WWW: The ACM International World Wide Web Conference<br />
SIGIR: The ACM Conference on Research and Development in Information Retrieval<br />
SIGKDD: The ACM Conference on Knowledge Discovery in Databases and Data Mining<br />
ICDE: IEEE International Conference on Data Engineering<br />
PODS: ACM Symposium on Principles of Database Systems<br />
ACL: The Association for Computational Linguistics<br />
CIKM: ACM International Conference on Information and Knowledge Management<br />
ICDM: IEEE International Conference on Data Mining<br />
PKDD: Conference on Principles and Practice of Knowledge Discovery in Databases<br />
CPM: Combinatorial Pattern Matching Symposium<br />
SDM: SIAM International Conference on Data Mining<br />
EMNLP:Conference on Empirical Methods in Natural Language Processing<br />
IEEE/WIC/ACM International Conference on Web Intelligence<br />
ICPR: International Conference on Pattern Recognition<br />
SPIRE: The IEEE International Symposium on String Processing and Information Retrieval<br />
ECML:European Conference on Machine Learning<br />
APWEB: Asia Pacific Web Conference<br />
Intelligence and Security Informatics<br />
ECIR:European Conference on Information Retrieval<br />
SAC: ACM/SIGAPP Symposium on Applied Computing<br />
PAKDD: Pacific-Asia Conference on Knowledge Discovery and Data Mining<br />
IJCNLP: International Joint Conference on Natural Language Processing<br />
AIRS:Asia Information Retrieval Symposium</p>
]]></content:encoded>
			<wfw:commentRss>http://clfour.com/2009/02/zz-wikicfp/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>[ZZ]哈工大中文信息处理人物谱</title>
		<link>http://clfour.com/2009/01/zz-hit-irers/</link>
		<comments>http://clfour.com/2009/01/zz-hit-irers/#comments</comments>
		<pubDate>Tue, 13 Jan 2009 03:11:42 +0000</pubDate>
		<dc:creator>Fred</dc:creator>
				<category><![CDATA[干活]]></category>
		<category><![CDATA[资讯]]></category>
		<category><![CDATA[IT]]></category>
		<category><![CDATA[mine]]></category>
		<category><![CDATA[search]]></category>
		<category><![CDATA[Study]]></category>
		<category><![CDATA[ZZ]]></category>

		<guid isPermaLink="false">http://www.clfour.com/?p=520</guid>
		<description><![CDATA[zz from here，根据第一位前辈的年龄，这篇应该是06年的数据 了，以备参考 王开铸教授，1932年出生，74岁，80年代从事俄汉机器翻译、固定段落理解与问答系统的研究，90年代开始进行自动文摘、自动校对的研究。曾任哈工大计算机系系主任8年，已退休多年。 李生教授，1943年出生，63岁，原哈工大党委书记，目前哈工大中文信息处理方向的带头人，现任语言语音教育部微软重点实验室主任，重点实验室包括智能技术与自然语言处理、机器智能与翻译、信息检索和语音处理四个研究室。中国中文信息学会常务理事，大陆最早的汉英机器翻译系统研制者，主要从事汉英双向机器翻译的研究，近年来同时开展信息检索方面的研究，培养了大批博士、硕士研究生。 王晓龙教授，1955年出生，51岁，77年上大学。语言语音教育部微软重点实验室副主任，智能技术与自然语言处理研究室主任，中国中文信息学会理事。以语句级智能输入法（微软拼音）发明人著称，目前把智能输入法应用于手机输入，同时研究智能搜索引擎，主持国际自然科学基金重点项目“问答式信息检索检索技术理论与方法”。多年来培养了大批博士硕士研究生。89年博士毕业，导师为王开铸教授。 赵铁军教授，1962年出生，44岁，语言语音教育部微软重点实验室副主任，机器智能与翻译研究室主任，主要从事机器翻译、跨语言检索以及文景转换的研究。导师为李生教授。 刘挺教授，1972年出生，34岁，语言语音教育部微软重点实验室副主任，信息检索研究室主任，主要从事信息检索、信息抽取和语言分析方面的研究。1998年博士毕业，导师为王开铸教授。 关毅副教授，博士，智能技术与自然语言处理实验室，导师王晓龙教授，研究方向：语言理解、问答系统。 徐志明副教授，博士，智能技术与自然语言处理实验室，导师王晓龙教授，研究方向：企业搜索。 刘秉权副教授，博士，智能技术与自然语言处理实验室，导师王晓龙教授，研究方向：智能手机输入法、移动搜索。 张宇副教授，博士，信息检索研究室，研究生期间的研究课题为软件容错。目前的研究方向：文本检索与过滤。 秦兵副教授，博士，信息检索研究室，导师李生，研究方向：多文档文摘、信息抽取、文本分类聚类。 杨沐昀副教授，博士，机器智能与翻译研究室，导师李生，研究方向：基于实例的机器翻译，汉英机器翻译。 林磊，博士，智能技术与自然语言处理实验室，导师王晓龙教授，研究方向：生物信息学。 李晗静，讲师，在职博士生，机器智能与翻译研究室，导师李生、赵铁军，研究方向：文景转换。 刘远超，讲师，在职博士生，智能技术与自然语言处理实验室，导师王晓龙教授，研究方向：自动文摘等。 车万翔，助教，在职博士生，信息检索研究室，导师李生、刘挺，研究方向：浅层语义分析。微软学者奖学金获得者。 王轩，博士，副教授，哈工大深圳研究生院计算机学部主任，导师王晓龙，研究方向：手语识别等。 陈清才，博士，哈工大深圳研究生院，导师王晓龙，研究方向：搜索引擎。 &#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8211; &#60;校友系列&#62; 周明，微软亚洲研究院自然语言组组长，导师李生，研究方向：自然语言处理、机器翻译 张民，新加坡I2R研究所，导师李生，研究方向：信息抽取 王海峰，东芝中国研发中心，99年博士毕业，副所长，导师李生，研究方向：机器翻译 于浩，富士通中国研发中心部门负责人，98年博士毕业，博士研究方向为电气工程，博士后导师为李生教授。 荀恩东，北京语言大学，99年毕业，导师李生，研究方向：汉语辅助教学等 付国宏，香港大学荣誉助理教授，导师王晓龙，研究方向：自然语言处理 吕雅娟，中科院计算所，导师李生，研究方向：机器翻译、句法分析 [...]]]></description>
			<content:encoded><![CDATA[<p>zz from <a href="http://zyj4538.blog.163.com/blog/static/27657532200811250594155" target="_blank">here</a>，根据第一位前辈的年龄，这篇应该是06年的数据 了，以备参考</p>
<p>王开铸教授，1932年出生，74岁，80年代从事俄汉机器翻译、固定段落理解与问答系统的研究，90年代开始进行自动文摘、自动校对的研究。曾任哈工大计算机系系主任8年，已退休多年。</p>
<p><span id="more-520"></span></p>
<p>李生教授，1943年出生，63岁，原哈工大党委书记，目前哈工大中文信息处理方向的带头人，现任语言语音教育部微软重点实验室主任，重点实验室包括智能技术与自然语言处理、机器智能与翻译、信息检索和语音处理四个研究室。中国中文信息学会常务理事，大陆最早的汉英机器翻译系统研制者，主要从事汉英双向机器翻译的研究，近年来同时开展信息检索方面的研究，培养了大批博士、硕士研究生。</p>
<p>王晓龙教授，1955年出生，51岁，77年上大学。语言语音教育部微软重点实验室副主任，智能技术与自然语言处理研究室主任，中国中文信息学会理事。以语句级智能输入法（微软拼音）发明人著称，目前把智能输入法应用于手机输入，同时研究智能搜索引擎，主持国际自然科学基金重点项目“问答式信息检索检索技术理论与方法”。多年来培养了大批博士硕士研究生。89年博士毕业，导师为王开铸教授。</p>
<p>赵铁军教授，1962年出生，44岁，语言语音教育部微软重点实验室副主任，机器智能与翻译研究室主任，主要从事机器翻译、跨语言检索以及文景转换的研究。导师为李生教授。</p>
<p>刘挺教授，1972年出生，34岁，语言语音教育部微软重点实验室副主任，信息检索研究室主任，主要从事信息检索、信息抽取和语言分析方面的研究。1998年博士毕业，导师为王开铸教授。</p>
<p>关毅副教授，博士，智能技术与自然语言处理实验室，导师王晓龙教授，研究方向：语言理解、问答系统。</p>
<p>徐志明副教授，博士，智能技术与自然语言处理实验室，导师王晓龙教授，研究方向：企业搜索。</p>
<p>刘秉权副教授，博士，智能技术与自然语言处理实验室，导师王晓龙教授，研究方向：智能手机输入法、移动搜索。</p>
<p>张宇副教授，博士，信息检索研究室，研究生期间的研究课题为软件容错。目前的研究方向：文本检索与过滤。</p>
<p>秦兵副教授，博士，信息检索研究室，导师李生，研究方向：多文档文摘、信息抽取、文本分类聚类。</p>
<p>杨沐昀副教授，博士，机器智能与翻译研究室，导师李生，研究方向：基于实例的机器翻译，汉英机器翻译。</p>
<p>林磊，博士，智能技术与自然语言处理实验室，导师王晓龙教授，研究方向：生物信息学。</p>
<p>李晗静，讲师，在职博士生，机器智能与翻译研究室，导师李生、赵铁军，研究方向：文景转换。</p>
<p>刘远超，讲师，在职博士生，智能技术与自然语言处理实验室，导师王晓龙教授，研究方向：自动文摘等。</p>
<p>车万翔，助教，在职博士生，信息检索研究室，导师李生、刘挺，研究方向：浅层语义分析。微软学者奖学金获得者。</p>
<p>王轩，博士，副教授，哈工大深圳研究生院计算机学部主任，导师王晓龙，研究方向：手语识别等。</p>
<p>陈清才，博士，哈工大深圳研究生院，导师王晓龙，研究方向：搜索引擎。</p>
<p>&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8211;</p>
<p>&lt;校友系列&gt;</p>
<p>周明，微软亚洲研究院自然语言组组长，导师李生，研究方向：自然语言处理、机器翻译</p>
<p>张民，新加坡I2R研究所，导师李生，研究方向：信息抽取</p>
<p>王海峰，东芝中国研发中心，99年博士毕业，副所长，导师李生，研究方向：机器翻译</p>
<p>于浩，富士通中国研发中心部门负责人，98年博士毕业，博士研究方向为电气工程，博士后导师为李生教授。</p>
<p>荀恩东，北京语言大学，99年毕业，导师李生，研究方向：汉语辅助教学等</p>
<p>付国宏，香港大学荣誉助理教授，导师王晓龙，研究方向：自然语言处理</p>
<p>吕雅娟，中科院计算所，导师李生，研究方向：机器翻译、句法分析</p>
<p>孟遥，富士通中国研发中心，导师李生，研究方向：句法分析</p>
<p>姚建民，苏州大学计算机系，导师李生，研究方向：机器翻译评价</p>
<p>方高林，富士通中国研发中心，硕士导师李生、赵铁军</p>
<p>郑德权副教授，博士，2005年毕业，哈尔滨商业大学，导师李生，研究方向：跨语言信息检索</p>
<p>卢志茂副教授，在职博士生，哈尔滨工程大学，导师李生、刘挺，研究方向：词义消歧</p>
<p>张刚，中科院计算所在职博士生，硕士导师李生、刘挺，博士导师李国杰院士，研究方向：分布式搜索引擎</p>
<p>还有很多毕业生也活跃在中文信息处理领域，孰不一一列举。</p>
<p>&#8212;&#8212;&#8212;&#8212;&#8211;</p>
<p>&lt;学生系列&gt;</p>
<p>曹海龙，机器翻译与智能研究室，导师李生，研究方向：汉语句法分析</p>
<p>齐浩亮，机器翻译与智能研究室，导师李生，研究方向：检索模型</p>
<p>王强，智能技术与自然语言处理研究室，导师王晓龙，研究方向：文本分类，两次863评测第一名。</p>
<p>马金山，信息检索研究室，2003级博士生，导师李生、刘挺、研究方向：句法分析</p>
<p>孙广路，智能技术与自然语言处理研究室，导师王晓龙，研究方向：组块分析</p>
<p>孙承杰，智能技术与自然语言处理研究室，导师王晓龙，研究方向：信息抽取</p>
<p>肖镜辉，智能技术与自然语言处理研究室，导师王晓龙，研究方向：语言模型</p>
<p>董启文，智能技术与自然语言处理研究室，导师王晓龙，研究方向：生物信息学，在《中国科学》，Bioinformatics等发表论文</p>
<p>张志昌，信息检索研究室，2004级博士生，导师李生、刘挺、研究方向：问答系统</p>
<p>郎君，信息检索研究室，2004级硕博连读生，导师李生、刘挺，研究方向：语言技术平台、指代消解</p>
<p>赵世奇，信息检索研究室，2004级硕博连读生，导师李生、刘挺，研究方向：复述技术</p>
<p>仅列举几名最活跃的学生，目前哈工大中文信息处理方向的博士生、硕士生合计130以上。</p>
<p>&#8212;&#8212;&#8212;&#8212;-</p>
<p>&lt;语音、文字系列&gt;</p>
<p>舒文豪教授，中国汉字识别的开创者之一，已退休。</p>
<p>王承发教授，博导，原哈工大计算机学院副院长，研究方向：语音识别，已故。</p>
<p>徐近沛教授，研究方向：语音识别。</p>
<p>韩纪庆教授，博导，哈工大计算机学院党委书记、常务副院长，智能人机接口研究中心副主任，语音处理研究室主任，研究方向：数字媒体、语音识别与合成。博士导师徐近沛。</p>
<p>唐降龙教授，博导，哈工大模式识别研究中心主任，研究方向：汉字识别、指纹识别等，博士导师舒文豪。</p>
<p>李海峰教授，博导，哈工大软件学院副院长，语音处理研究室，研究方向：模式识别。在法国巴黎六大获得博士学位。</p>
<p>黄剑华副教授，博士，哈工大模式识别研究中心，研究方向：视频汉字识别，博士导师舒文豪。</p>
<p>刘家峰副教授，博士，哈工大模式识别研究中心，研究方向：汉字识别、模式识别，博士导师舒文豪。</p>
<p>郑铁然，讲师，在职博士生，语音处理研究室，研究方向：音频/语音检索，博士导师韩纪庆。</p>
]]></content:encoded>
			<wfw:commentRss>http://clfour.com/2009/01/zz-hit-irers/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>国内搜索相关的实验室+news digest</title>
		<link>http://clfour.com/2008/12/edu-cn-labs-on-search-technology-and-news-digest/</link>
		<comments>http://clfour.com/2008/12/edu-cn-labs-on-search-technology-and-news-digest/#comments</comments>
		<pubDate>Mon, 29 Dec 2008 04:50:30 +0000</pubDate>
		<dc:creator>Fred</dc:creator>
				<category><![CDATA[干活]]></category>
		<category><![CDATA[IT]]></category>
		<category><![CDATA[mine]]></category>
		<category><![CDATA[search]]></category>
		<category><![CDATA[Study]]></category>

		<guid isPermaLink="false">http://www.clfour.com/?p=468</guid>
		<description><![CDATA[1. 哈尔滨工业大学信息检索研究室  语言技术网 2. 复旦大学媒体计算与WEB智能实验室信息检索和自然语言处理组 3. 北京大学计算机网络于分布式系统实验室 4. 清华大学智能技术与系统国家重点实验室信息检索组 5. 山东大学信息检索实验室 6. 上海交通大学APEX数据和知识管理实验室 另外，翻了一下最近的google alerts，下面这几个还可以关注下。 这两个是讨论企业搜索的和网页搜索的，前一个是对后一个的讨论。不过他们讨论的搜索是普遍企业环境的，也包括人力管理，部门管理，结构组织等资源。 Recommind used a technique called Probabilistic Latent Semantic Analysis, which are statistical models that [...]]]></description>
			<content:encoded><![CDATA[<p>1. <a href="http://ir.hit.edu.cn/" target="_blank">哈尔滨工业大学信息检索研究室</a>  <a href="http://www.langtech.org.cn/html/bbs.html" target="_blank">语言技术网</a><br />
2. <a href="http://www.cs.fudan.edu.cn/mcwil/irnlp/" target="_blank">复旦大学媒体计算与WEB智能实验室信息检索和自然语言处理组<br />
</a>3. <a href="http://net.pku.edu.cn/" target="_blank">北京大学计算机网络于分布式系统实验室</a><br />
4. <a href="http://www.thuir.cn/cms/" target="_blank">清华大学智能技术与系统国家重点实验室信息检索组</a><br />
5. <a href="http://ir.sdu.edu.cn/index.htm" target="_blank">山东大学信息检索实验室</a><br />
6. <a href="http://www.apexlab.org/apex_wiki/FrontPage" target="_blank">上海交通大学APEX数据和知识管理实验室</a></p>
<p><span id="more-468"></span></p>
<p>另外，翻了一下最近的google alerts，下面这几个还可以关注下。</p>
<p>这两个是讨论企业搜索的和网页搜索的，前一个是对后一个的讨论。不过他们讨论的搜索是普遍企业环境的，也包括人力管理，部门管理，结构组织等资源。<br />
Recommind used a technique called Probabilistic Latent Semantic Analysis, which are statistical models that the system builds from your documents.<br />
“It will look at the language and derive meanings, themes and concepts from within content, then relate them to similar concepts in a different batch of documents,” says Carpenter.<br />
Autonomy uses Bayesian statistical models, similar to those used to filter spam, to determine the categories of documents. FAST uses a semantic index that can restrict the scope of a concept to a sentence or paragraph to get a more accurate answer. For example, a document might talk about both orange (the fruit) and orange (the colour) but a paragraph is more likely to be about one or the other. It also extracts ‘entities’ like names, phone numbers, addresses and companies.<br />
<a href="http://arnoldit.com/wordpress/2008/12/28/enterprise-search-is-not-web-search-a-revelation/" target="_blank">Enterprise Search Is Not Web Search — A Revelation</a> <br />
<a href="http://www.itpro.co.uk/608925/why-enterprise-search-is-not-internet-search" target="_blank">We explain why you can’t always get the best search results for your business from Google</a></p>
<p>这篇paper用基于主题地图的本体改善信息检索的性能，有40个参与者参加测试。还没找到可以下载的资源。<br />
<a href="http://cat.inist.fr/?aModele=afficheN&amp;cpsidt=20686497" target="_blank">Information Organization and Retrieval Using a Topic Maps-Based Ontology : Results of a Task-Based Evaluation</a></p>
<p>这一篇里面的链接有几篇Google查询扩展专利(08.12.25)相关的论文，并简单描述了概率机器翻译和环境图的方法寻找同义词。<br />
<a href="http://www.seobythesea.com/?p=1163" target="_blank">How a Search Engine Might Find Synonyms to Use to Expand Search Queries</a></p>
<p><a href="http://www.itpro.co.uk/608925/why-enterprise-search-is-not-internet-search" target="_blank"></a></p>
<p><a href="http://www.langtech.org.cn/html/bbs.html" target="_blank"></a></p>
]]></content:encoded>
			<wfw:commentRss>http://clfour.com/2008/12/edu-cn-labs-on-search-technology-and-news-digest/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>news digest</title>
		<link>http://clfour.com/2008/12/digest-of-semantic-search-news/</link>
		<comments>http://clfour.com/2008/12/digest-of-semantic-search-news/#comments</comments>
		<pubDate>Sat, 20 Dec 2008 08:21:12 +0000</pubDate>
		<dc:creator>Fred</dc:creator>
				<category><![CDATA[干活]]></category>
		<category><![CDATA[折腾]]></category>
		<category><![CDATA[资讯]]></category>
		<category><![CDATA[IT]]></category>
		<category><![CDATA[search]]></category>
		<category><![CDATA[semantic search]]></category>
		<category><![CDATA[Study]]></category>

		<guid isPermaLink="false">http://www.clfour.com/?p=429</guid>
		<description><![CDATA[●Semantic Sense for the Desktop A project brings Semantic Web technology to personal documents. 这篇是对Nepomuk Project的介绍，讲了语义桌面的出发点，之前的研究，此项目的的一些特点和方法，最后的有给出下载链接，不过安装不是一步到位的，需要些前期步骤。感兴趣的可以下载试试。 ●Powerset Gives Microsoft Semantic Search Tools 结合Scott Prevost, general manager and product director at [...]]]></description>
			<content:encoded><![CDATA[<p><img id="BLOGGER_PHOTO_ID_5281433389404450514" style="float: left; margin: 0px 10px 10px 0px; width: 200px; cursor: hand; height: 95px;" src="http://3.bp.blogspot.com/_FuHc5SqNMxA/SUtrr3hW7tI/AAAAAAAAAE4/xY2IcLfWA7k/s200/nepomuk-logo.320.png" border="0" alt="" /></p>
<p>●<a href="http://www.technologyreview.com/web/21840/page1/" target="_blank">Semantic Sense for the Desktop<br />
</a>A project brings Semantic Web technology to personal documents.</p>
<p>这篇是对Nepomuk Project的介绍，讲了语义桌面的出发点，之前的研究，此项目的的一些特点和方法，最后的有给出下载链接，不过安装不是一步到位的，需要些前期步骤。感兴趣的可以<a href="http://dev.nepomuk.semanticdesktop.org/wiki/UsingNepomuk" target="_blank">下载</a>试试。<br />
<span id="more-429"></span></p>
<p><img id="BLOGGER_PHOTO_ID_5281434193085408370" style="float: left; margin: 0px 10px 10px 0px; width: 200px; cursor: hand; height: 72px;" src="http://1.bp.blogspot.com/_FuHc5SqNMxA/SUtsapd1JHI/AAAAAAAAAFI/iYtqg1gRYZg/s200/web3.0.png" border="0" alt="" />●<a href="http://reddevnews.com//news/devnews/article.aspx?editorialsid=1205" target="_blank">Powerset Gives Microsoft Semantic Search Tools<br />
</a>结合Scott Prevost, general manager and product director at Powerset和Gartner Inc. analyst Rita Knox的观点的一篇文章。<br />
After its Powerset acquisition, Microsoft is pushing semantic search as the replacement for traditional keyword search.<br />
对语义检索和基于关键字检索的比较：”Current search technology just doesn&#8217;t leverage all of the affordances of Web 3.0-semantic Web, structured data, interoperability, collaborative filtering,” says Scott Prevost, general manager and product director at Powerset. “Keyword search just doesn&#8217;t address these things.” “Everything today is about the keywords,” Prevost told attendees. “And there are a lot of casualties in this keyword economy.”<br />
对与powerset中NLP技术的来源：<br />
Roots from PARC<br />
Powerset relies on very deep natural language processing (NLP), technology that has been in the lab for 30 years but has only recently become computationally feasible because of high-performance computing technologies. Powerset&#8217;s semantic search app uses this technology-which the company licenses from Palo Alto Research Center (PARC)-to extract meaning from documents one at a time and encode that meaning into its index. Meaning and intent are extracted from queries at runtime. Matching the meaning of those queries with the meaning in the index renders better search results, he says.<br />
Rita Knox 将语义搜索定义为利用基于用户寻找信息所包含的，而机器自身不能掌握的微妙的语义为线索的搜索。<br />
Gartner Inc. analyst Rita Knox defines semantic searches as those that use clues about the information users are seeking based on semantic subtleties that machines have yet to master on their own.</p>
<p>“When pieces of information are labeled, computers can see what they mean; but most information is not labeled-it&#8217;s unstructured,” Knox says. “Without the labels or tags, computers are at a loss to make a human kind of sense out of things like text. The promise of semantic search is that it will provide that understanding to the machines, and that will result in more meaningful and relevant search results.”</p>
<p>另外，Open APIs Coming??</p>
]]></content:encoded>
			<wfw:commentRss>http://clfour.com/2008/12/digest-of-semantic-search-news/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>微软新搜索引擎—&gt;kumo.com?</title>
		<link>http://clfour.com/2008/11/kumo-to-be-live-search-new-brand/</link>
		<comments>http://clfour.com/2008/11/kumo-to-be-live-search-new-brand/#comments</comments>
		<pubDate>Mon, 24 Nov 2008 14:39:01 +0000</pubDate>
		<dc:creator>Fred</dc:creator>
				<category><![CDATA[干活]]></category>
		<category><![CDATA[资讯]]></category>
		<category><![CDATA[IT]]></category>
		<category><![CDATA[kumo]]></category>
		<category><![CDATA[ms]]></category>
		<category><![CDATA[search]]></category>
		<category><![CDATA[semantic search]]></category>

		<guid isPermaLink="false">http://www.clfour.com/?p=300</guid>
		<description><![CDATA[Updated: 微软最新搜索引擎定名为：bing (查看) 几天前，某关注微软Live动向的独立网站的一篇文章，让许多对微软搜索引擎的传言也更加流行起来。文章指出微软在近期收购了一个新的域名kumo.com，并将它指向了live search的部分服务器，当前供员工内部测试使用。kumo在日语中是云或者蜘蛛的意思，在结合当前云计算的热潮以及微软之前的动向（上周四微软确认雅虎搜索执行官将成为微软硅谷搜索技术中心的总经理，收购语义检索公司Powerset），真的让人会有所期待了。live大张旗鼓进军google的地盘，没有撼动google的位置，现在微软在收购yahoo无期的情况下，动作拼出，看来势必在搜索上会有一番表现了。当然，微软官方对此次民间的传言保持沉默中ing 到底kumo.com会有何用我们还不能知，文章说在未来6－12个月内就会有明确答案了，语义？云计算？新的live search？ ps：搞了个日语，估计某国又要举国欢腾了，不是说奥巴马竞选成功就有某市因为其名与未来美国总统发音类似而提前过了个年~ 当然，要是那天google改名yun.com我也很高兴 哈哈 其他相关连接： http://news.cnet.com/8301-10805_3-10106314-75.html http://www.guardian.co.uk/technology/blog/2008/nov/24/microsoft-live-kumo http://www.theregister.co.uk/2008/11/24/kumo_windows_live_search/ http://tinycomb.com/2008/11/23/kumo-microsofts-new-search-engine/ http://www.efluxmedia.com/news_Kumo_The_new_name_Of_Microsoft_Live_Search_29731.html]]></description>
			<content:encoded><![CDATA[<h3>
<p style="text-align: left;"><strong><span style="color: #0000ff;">Updated: 微软最新搜索引擎定名为：bing (<span style="color: #ffff00;"><a href="http://http://www.clfour.com/2009/05/ms-kumo-to-be/" target="_blank">查看</a></span>)</span></strong></p>
</h3>
<p style="text-align: left;"><img title="bing" src="http://clfour.com/wp-content/uploads/2009/05/bing2.png" alt="bing" width="150" height="59" align="left" /></p>
<p><a href="http://2.bp.blogspot.com/_FuHc5SqNMxA/SSq7K4nu3UI/AAAAAAAAAC8/L5APEcS6ct4/s1600-h/Live_Search_Logo.jpg" onblur="function onblur() { try {parent.deselectBloggerImageGracefully();} catch(e) {} }"><img id="BLOGGER_PHOTO_ID_5272232109462707522" style="width: 140px; height: 45px; cursor: pointer;" src="http://2.bp.blogspot.com/_FuHc5SqNMxA/SSq7K4nu3UI/AAAAAAAAAC8/L5APEcS6ct4/s200/Live_Search_Logo.jpg" border="0" alt="" /></a><a href="http://4.bp.blogspot.com/_FuHc5SqNMxA/SSq7LfVCIMI/AAAAAAAAADE/gDxcpzR-Yd8/s1600-h/kumo1.jpg" onblur="function onblur() { try {parent.deselectBloggerImageGracefully();} catch(e) {} }"><img id="BLOGGER_PHOTO_ID_5272232119853260994" style="width: 105px; height: 70px; cursor: pointer;" src="http://4.bp.blogspot.com/_FuHc5SqNMxA/SSq7LfVCIMI/AAAAAAAAADE/gDxcpzR-Yd8/s200/kumo1.jpg" border="0" alt="" /></a></p>
<p><a href="http://4.bp.blogspot.com/_FuHc5SqNMxA/SSq7LfVCIMI/AAAAAAAAADE/gDxcpzR-Yd8/s1600-h/kumo1.jpg"></a></p>
<p>几天前，某关注微软Live动向的独立网站的一篇<a href="http://www.liveside.net/main/archive/2008/11/23/microsoft-takes-control-of-kumo-com-domain-watch-out-for-the-live-search-rebrand.aspx" target="_blank">文章</a>，让许多对微软搜索引擎的传言也更加流行起来。文章指出微软在近期收购了一个新的域名kumo.com，并将它指向了live search的部分服务器，当前供员工内部测试使用。kumo在日语中是云或者蜘蛛的意思，在结合当前云计算的热潮以及微软之前的动向（上周四微软确认雅虎搜索执行官将成为微软硅谷搜索技术中心的总经理，收购语义检索公司P<span id="intelliTXT">owerset</span>），真的让人会有所期待了。live大张旗鼓进军google的地盘，没有撼动google的位置，现在微软在收购yahoo无期的情况下，动作拼出，看来势必在搜索上会有一番表现了。当然，微软官方对此次民间的传言保持沉默中ing</p>
<p>到底kumo.com会有何用我们还不能知，文章说在未来6－12个月内就会有明确答案了，语义？云计算？新的live search？</p>
<p>ps：搞了个日语，估计某国又要举国欢腾了，不是说奥巴马竞选成功就有某市因为其名与未来美国总统发音类似而提前过了个年~ 当然，要是那天google改名yun.com我也很高兴 哈哈</p>
<p>其他相关连接：</p>
<p>http://news.cnet.com/8301-10805_3-10106314-75.html</p>
<p>http://www.guardian.co.uk/technology/blog/2008/nov/24/microsoft-live-kumo</p>
<p>http://www.theregister.co.uk/2008/11/24/kumo_windows_live_search/</p>
<p>http://tinycomb.com/2008/11/23/kumo-microsofts-new-search-engine/</p>
<p>http://www.efluxmedia.com/news_Kumo_The_new_name_Of_Microsoft_Live_Search_29731.html</p>
]]></content:encoded>
			<wfw:commentRss>http://clfour.com/2008/11/kumo-to-be-live-search-new-brand/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>google开始走向语义检索？(updated)</title>
		<link>http://clfour.com/2008/11/will-google-move-towards-semantic-search/</link>
		<comments>http://clfour.com/2008/11/will-google-move-towards-semantic-search/#comments</comments>
		<pubDate>Sun, 23 Nov 2008 11:56:14 +0000</pubDate>
		<dc:creator>Fred</dc:creator>
				<category><![CDATA[干活]]></category>
		<category><![CDATA[资讯]]></category>
		<category><![CDATA[google]]></category>
		<category><![CDATA[IT]]></category>
		<category><![CDATA[search]]></category>
		<category><![CDATA[semantic search]]></category>
		<category><![CDATA[Study]]></category>

		<guid isPermaLink="false">http://www.clfour.com/?p=289</guid>
		<description><![CDATA[  最近几天没有关注Google Alert 的内容，今天一看，有这么一条消息：Google launches its SearchWiki semantics plug-in。前一段时间Semanti Corp. 发布消息，自己的语义检索插件SemantiFind支持yahoo, msn, google的搜索引擎。而微软买了Powerset（这个试了下没什么感觉，用过的评价下？）后，也有了语义检索引擎，ask也开始尝试语义的东西，而yahoo早在3月份就宣布进军语义网，看来当今检索大佬google也坐不住了，现在自己也加入了一些新变化。记得是一年之内的一次校园招聘里面（或者会议？），微软还是google的管理层被问到语义检索的时候，还是一脸的怀疑，并声称没有这方面的打算，可现在大家却都纷纷着手做了起来。语义，看来真的是下一个网络时代的潮流，真的会变成web3.0了，当前语义的效果确实不尽如人意，但是如果成功的话，影响将是不可忽视的。IBM，微软，google，不同时代的代表，下一个会是谁？大家争先恐后。 言归正传，说说google的SearchWiki，思想上借鉴了wiki的东西，允许用户对检索的结果进行提升，删除和评论，但是每个用户的改变只影响自己的检索结果，不过可以看到大家对检索结果的编辑情况。其实，google当前的变化还很简单，算不上语义，只能算是个性化订制的一点扩展，感觉比SemantiFind还要简单，不过也算是对用户意图的改进了。刚刚在google上找了一下，也没看到这个插件，却发现了这样片文章：Google SearchWiki Vanishes (Updated)，打开一看，写道google说这是因为有bug，正在恢复中。。。  更新：现在可以用了，不过要上http://www.google.com/并登陆账号才可以~   我晕了 ，一会能用，一会不能用，估计测试中。。。 提供一个youtube上google对SearchWiki介绍的视频，感兴趣的可以了解下： 其他相关链接： http://www.betanews.com/article/Askcom_v_11_tries_new_search_technologies/1223316977 http://www.betanews.com/article/New_Google_tools_sift_and_sort_search_results/1225353991 http://news.bbc.co.uk/1/hi/technology/7296056.stm http://www.betanews.com/article/Semantic_search_plugin_comes_to_Google_Yahoo_MSN/1225720138 http://googleblog.blogspot.com/2008/11/searchwiki-make-search-your-own.html http://searchengineland.com/google-searchwiki-101-an-illustrated-guide-15580.php http://googlesystem.blogspot.com/2008/11/google-searchwiki-launched.html]]></description>
			<content:encoded><![CDATA[<p><a href="http://2.bp.blogspot.com/_FuHc5SqNMxA/SSlCEAVqcuI/AAAAAAAAAC0/Jr3VgenP9vk/s1600-h/google-searchwiki-weather.png"><img id="BLOGGER_PHOTO_ID_5271817475391648482" style="width: 200px; cursor: hand; height: 186px;" src="http://2.bp.blogspot.com/_FuHc5SqNMxA/SSlCEAVqcuI/AAAAAAAAAC0/Jr3VgenP9vk/s200/google-searchwiki-weather.png" border="0" alt="" align="top" /></a>  <a href="http://1.bp.blogspot.com/_FuHc5SqNMxA/SSlB2ARdFtI/AAAAAAAAACs/q_iol5tkno4/s1600-h/google-searchwiki-notes.png"><img id="BLOGGER_PHOTO_ID_5271817234855827154" style="width: 200px; cursor: hand; height: 138px;" src="http://1.bp.blogspot.com/_FuHc5SqNMxA/SSlB2ARdFtI/AAAAAAAAACs/q_iol5tkno4/s200/google-searchwiki-notes.png" border="0" alt="" align="top" /></a></p>
<p>最近几天没有关注Google Alert 的内容，今天一看，有这么一条消息：<a href="http://www.betanews.com/article/Google_launches_its_SearchWiki_semantics_plugin/1227300323" target="_blank">Google launches its SearchWiki semantics plug-in</a>。前一段时间<a href="www.semantifind.com/ " target="_blank">Semanti Corp. </a>发布消息，自己的语义检索插件<a title="点击下载~谁能下载？国内好像打不开" href="http://www.semantifind.com/getStarted.jsp" target="_blank">SemantiFind</a>支持yahoo, msn, google的搜索引擎。而微软买了<a href="http://www.powerset.com/" target="_blank">Powerset</a>（这个试了下没什么感觉，用过的评价下？）后，也有了语义检索引擎，ask也开始尝试语义的东西，而yahoo早在3月份就宣布进军语义网，看来当今检索大佬google也坐不住了，现在自己也加入了一些新变化。记得是一年之内的一次校园招聘里面（或者会议？），微软还是google的管理层被问到语义检索的时候，还是一脸的怀疑，并声称没有这方面的打算，可现在大家却都纷纷着手做了起来。语义，看来真的是下一个网络时代的潮流，真的会变成web3.0了，当前语义的效果确实不尽如人意，但是如果成功的话，影响将是不可忽视的。IBM，微软，google，不同时代的代表，下一个会是谁？大家争先恐后。</p>
<p>言归正传，说说google的SearchWiki，思想上借鉴了wiki的东西，允许用户对检索的结果进行提升，删除和评论，但是每个用户的改变只影响自己的检索结果，不过可以看到大家对检索结果的编辑情况。其实，google当前的变化还很简单，算不上语义，只能算是个性化订制的一点扩展，感觉比SemantiFind还要简单，不过也算是对用户意图的改进了。<span style="text-decoration: line-through;">刚刚在google上找了一下，也没看到这个插件，却发现了这样片文章：</span><a href="http://www.techcrunch.com/2008/11/22/google-searchwiki-vanishes/" target="_blank"><span style="text-decoration: line-through;">Google SearchWiki Vanishes (Updated)</span></a><span style="text-decoration: line-through;">，打开一看，写道google说这是因为有bug，正在恢复中。。。</span>  <span style="text-decoration: line-through;">更新：现在可以用了，不过要上</span><a href="http://www.google.com/"><span style="text-decoration: line-through;">http://www.google.com/</span></a><span style="text-decoration: line-through;">并登陆账号才可以~</span>   我晕了 <img src='http://clfour.com/wp-includes/images/smilies/icon_surprised.gif' alt=':eek:' class='wp-smiley' />  ，一会能用，一会不能用，估计测试中。。。</p>
<p>提供一个youtube上google对SearchWiki介绍的视频，感兴趣的可以了解下：<br />
<object classid="clsid:d27cdb6e-ae6d-11cf-96b8-444553540000" width="425" height="344" codebase="http://download.macromedia.com/pub/shockwave/cabs/flash/swflash.cab#version=6,0,40,0"><param name="allowFullScreen" value="true" /><param name="allowscriptaccess" value="always" /><param name="src" value="http://www.youtube.com/v/t8Pl1H0dIXE&amp;hl=en&amp;fs=1" /><embed type="application/x-shockwave-flash" width="425" height="344" src="http://www.youtube.com/v/t8Pl1H0dIXE&amp;hl=en&amp;fs=1" allowfullscreen="true" allowscriptaccess="always"></embed></object></p>
<p>其他相关链接：</p>
<p><a href="http://www.betanews.com/article/Askcom_v_11_tries_new_search_technologies/1223316977">http://www.betanews.com/article/Askcom_v_11_tries_new_search_technologies/1223316977</a><br />
<a href="http://www.betanews.com/article/New_Google_tools_sift_and_sort_search_results/1225353991">http://www.betanews.com/article/New_Google_tools_sift_and_sort_search_results/1225353991</a><br />
<a href="http://news.bbc.co.uk/1/hi/technology/7296056.stm">http://news.bbc.co.uk/1/hi/technology/7296056.stm</a><br />
<a href="http://www.betanews.com/article/Semantic_search_plugin_comes_to_Google_Yahoo_MSN/1225720138">http://www.betanews.com/article/Semantic_search_plugin_comes_to_Google_Yahoo_MSN/1225720138</a><br />
<a href="http://googleblog.blogspot.com/2008/11/searchwiki-make-search-your-own.html">http://googleblog.blogspot.com/2008/11/searchwiki-make-search-your-own.html</a><br />
<a href="http://searchengineland.com/google-searchwiki-101-an-illustrated-guide-15580.php">http://searchengineland.com/google-searchwiki-101-an-illustrated-guide-15580.php</a><br />
<a href="http://googlesystem.blogspot.com/2008/11/google-searchwiki-launched.html">http://googlesystem.blogspot.com/2008/11/google-searchwiki-launched.html</a></p>
]]></content:encoded>
			<wfw:commentRss>http://clfour.com/2008/11/will-google-move-towards-semantic-search/feed/</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
		<item>
		<title>XP and ubuntu双系统默认启动</title>
		<link>http://clfour.com/2008/10/xp-and-ubuntu-defaut-boot/</link>
		<comments>http://clfour.com/2008/10/xp-and-ubuntu-defaut-boot/#comments</comments>
		<pubDate>Sat, 04 Oct 2008 18:23:00 +0000</pubDate>
		<dc:creator>Fred</dc:creator>
				<category><![CDATA[干活]]></category>
		<category><![CDATA[IT]]></category>
		<category><![CDATA[os]]></category>
		<category><![CDATA[Study]]></category>
		<category><![CDATA[ubuntu]]></category>
		<category><![CDATA[XP]]></category>

		<guid isPermaLink="false">http://clfour.com/2008/10/xp-and-ubuntu-defaut-boot/</guid>
		<description><![CDATA[这个很久之前看过，不过很快就忘了具体是哪个文件了，这脑子。。。 电脑的情况：现状的XP，后来有通过硬盘安装的ubuntu，用的是grup，现在在c盘根目录还有这些文件。在安装ubuntu之后，电脑默认的开机启动就是ubuntu系统了，这个时候如果像要更改默认设置，需要在ubuntu下运行以下语句： sudo gedit /boot/grub/menu.lst 对弹出的文档进行修改保存，在里面找到类似的语句：default 0，0是开机启动时默认的启动系统所在的行，从第0行开始，开机的时候煮一下xp是第几行（0开始），然后改过来保存重启。另外，附近还有一个delay之类的好像，那是修改默认的选择时间的（秒）。 注意：ubuntu升级后，会出现位置变化的情况，我的默认就成了mentest了。一看原来是xp所在的行变了。]]></description>
			<content:encoded><![CDATA[<p><a href="http://lh5.ggpht.com/yest835/R74uvRyBGPI/AAAAAAAAAuc/fHFNYlq6xMM/s512/P1000090.JPG"><img style="float: left; margin: 0px 10px 10px 0px; width: 200px; cursor: hand;" src="http://lh5.ggpht.com/yest835/R74uvRyBGPI/AAAAAAAAAuc/fHFNYlq6xMM/s512/P1000090.JPG" border="0" alt="" /></a>这个很久之前看过，不过很快就忘了具体是哪个文件了，这脑子。。。<br />
电脑的情况：现状的XP，后来有通过硬盘安装的ubuntu，用的是grup，现在在c盘根目录还有这些文件。在安装ubuntu之后，电脑默认的开机启动就是ubuntu系统了，这个时候如果像要更改默认设置，需要在ubuntu下运行以下语句：<br />
sudo gedit /boot/grub/menu.lst<br />
对弹出的文档进行修改保存，在里面找到类似的语句：default 0，0是开机启动时默认的启动系统所在的行，从第0行开始，开机的时候煮一下xp是第几行（0开始），然后改过来保存重启。另外，附近还有一个delay之类的好像，那是修改默认的选择时间的（秒）。<br />
注意：ubuntu升级后，会出现位置变化的情况，我的默认就成了mentest了。一看原来是xp所在的行变了。</p>
]]></content:encoded>
			<wfw:commentRss>http://clfour.com/2008/10/xp-and-ubuntu-defaut-boot/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>ubuntu下lucene和nutch的配置</title>
		<link>http://clfour.com/2008/10/ubuntu-blucene-nutch/</link>
		<comments>http://clfour.com/2008/10/ubuntu-blucene-nutch/#comments</comments>
		<pubDate>Wed, 01 Oct 2008 09:34:00 +0000</pubDate>
		<dc:creator>Fred</dc:creator>
				<category><![CDATA[干活]]></category>
		<category><![CDATA[IT]]></category>
		<category><![CDATA[lucene]]></category>
		<category><![CDATA[nutch]]></category>
		<category><![CDATA[Study]]></category>
		<category><![CDATA[ubuntu]]></category>

		<guid isPermaLink="false">http://clfour.com/2008/10/ubuntu-blucene-nutch/</guid>
		<description><![CDATA[这篇是对上面配置的继续 1.安装lucene wget http://apache.mirror.phpchina.com/lucene/java/lucene-2.3.2.tar.gz 不是lucene-2.3.2-src.tar.gz哦，这个无lucene-demos-2.3.2.jar 在目录下： tar zxvf lucene-2.3.2.tar.gz mv lucene-2.3.2 /usr/share 查看解压文件里面的build.txt里面有lucene配置的的基本步骤，根据提示，ant是必须的，我们现在要把ant的安装补上（eclipse下有ant，如果在eclipse下调试的话好像不需要再安装了就。具体的不太清楚也） ##CONTINUE## 2.安装ant http://ant.apache.org/bindownload.cgi ant是一个基于JAVA的自动化脚本引擎，脚本格式为XML。除了做JAVA编译相关任务外，ANT还可以通过插件实现很多应用的调用，比make脚本来说还要好维护一些。 wget http://apache.mirror.phpchina.com/ant/binaries/apache-ant-1.7.1-bin.tar.gz 在对应目录下： tar zxvf apache-ant-1.7.1-bin.tar.gz mv apache-ant-1.7.0 /usr/share/ gedit /etc/profile 加上 ANT_HOME=/usr/share/apache-ant-1.7.1 [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://lh4.ggpht.com/yest835/SJHuJshEwDI/AAAAAAAACAg/b7sk6qSIsUk/s288/%E7%94%B5%E5%BD%B1%E6%B5%B7%E6%8A%A5a.jpg" onblur="try {parent.deselectBloggerImageGracefully();} catch(e) {}"><img style="float: left; margin: 0pt 10px 10px 0pt; width: 200px; cursor: pointer;" src="http://lh4.ggpht.com/yest835/SJHuJshEwDI/AAAAAAAACAg/b7sk6qSIsUk/s288/%E7%94%B5%E5%BD%B1%E6%B5%B7%E6%8A%A5a.jpg" border="0" alt="" /></a>这篇是对上面配置的继续<br />
1.安装lucene<br />
wget http://apache.mirror.phpchina.com/lucene/java/lucene-2.3.2.tar.gz<br />
不是lucene-2.3.2-src.tar.gz哦，这个无lucene-demos-2.3.2.jar<br />
在目录下：<br />
tar zxvf lucene-2.3.2.tar.gz<br />
mv lucene-2.3.2 /usr/share</p>
<p>查看解压文件里面的build.txt里面有lucene配置的的基本步骤，根据提示，ant是必须的，我们现在要把ant的安装补上（eclipse下有ant，如果在eclipse下调试的话好像不需要再安装了就。具体的不太清楚也）<br />
##CONTINUE##<br />
2.安装ant</p>
<p>http://ant.apache.org/bindownload.cgi</p>
<p>ant是一个基于JAVA的自动化脚本引擎，脚本格式为XML。除了做JAVA编译相关任务外，ANT还可以通过插件实现很多应用的调用，比make脚本来说还要好维护一些。</p>
<p>wget http://apache.mirror.phpchina.com/ant/binaries/apache-ant-1.7.1-bin.tar.gz</p>
<p>在对应目录下：<br />
tar zxvf apache-ant-1.7.1-bin.tar.gz</p>
<p>mv apache-ant-1.7.0 /usr/share/</p>
<p>gedit /etc/profile</p>
<p>加上<br />
ANT_HOME=/usr/share/apache-ant-1.7.1<br />
export ANT_HOME<br />
编辑<br />
PATH=$PATH:$JAVA_HOME/bin:$ANT_HOME/bin</p>
<p>3 继续设置lucene<br />
再修改profile<br />
gedit /etc/profile<br />
增加<br />
LUCENE_HOME=/usr/share/lucene-2.3.2<br />
CLASSPATH=.:${JAVA_HOME}/lib/dt.jar:${JAVA_HOME}/lib/tools.jar:${LUCENE_HOME}/lucene-core-2.3.2.jar:${LUCENE_HOME}/lucene-demos-2.3.2.jar</p>
<p>4.测试lucene demo<br />
在lucene目录下，<br />
cd ./src/demo<br />
java org.apache.lucene.demo.IndexFiles /usr/share/lucene-2.3.2/docs</p>
<p>如果路径正确会出现如下：<br />
。<br />
。<br />
。<br />
adding /usr/share/lucene-2.3.2/docs/demo.pdf<br />
adding /usr/share/lucene-2.3.2/docs/demo2.html<br />
adding /usr/share/lucene-2.3.2/docs/gettingstarted.html<br />
adding /usr/share/lucene-2.3.2/docs/fileformats.pdf<br />
adding /usr/share/lucene-2.3.2/docs/scoring.html<br />
adding /usr/share/lucene-2.3.2/docs/linkmap.html<br />
adding /usr/share/lucene-2.3.2/docs/lucene-sandbox/index.html<br />
adding /usr/share/lucene-2.3.2/docs/lucene-sandbox/index.pdf<br />
adding /usr/share/lucene-2.3.2/docs/queryparsersyntax.pdf<br />
adding /usr/share/lucene-2.3.2/docs/linkmap.pdf<br />
adding /usr/share/lucene-2.3.2/docs/demo4.html<br />
adding /usr/share/lucene-2.3.2/docs/benchmarktemplate.xml<br />
adding /usr/share/lucene-2.3.2/docs/index.pdf<br />
Optimizing&#8230;<br />
17869 total milliseconds<br />
并生成index文件夹。<br />
然后就可以搜索了，<br />
输入以下命令就会出现搜索提示符。<br />
java org.apache.lucene.demo.SearchFiles<br />
按提示输入即可。</p>
<p>如果要在tomcat下测试lucene demo可按如下操作：<br />
4.1.将lucene目录下的/src/jsp目录复制到tomcat的webapps目录下，该名为luceneweb<br />
4.2.复制lucene-core-2.3.2.jar和lucene-demos-2.3.2.jar到luceneweb/WEB_INF/lib目录下<span style="text-decoration: line-through;">（或将luceneweb.war复制到tomcat的webapps目录下）没仔细试，好像不行<br />
</span><br />
4.3.将index目录复制到luceneweb目录下<br />
4.4.编辑luceneweb下的configuration.jsp,设置String indexLocation = “/usr/share/tomcat6/webapps/luceneweb/index”;String appfooter也可以自行设置<br />
4.5.重启tomcat，访问http://localhost:8080/luceneweb/，就可以看到lucene demo的界面了，可以试着搜索下看看～</p>
<p>5.安装Nutch<br />
可以去Apache的官方网页http://www.apache.org/dyn/closer.cgi/lucene/nutch/ 下载最新版的Nutch，目前最新版是nutch-0.9<br />
解压缩到目标文件夹即可。<br />
Nutch和tomcat，eclipse的是接下来要做的工作了</p>
]]></content:encoded>
			<wfw:commentRss>http://clfour.com/2008/10/ubuntu-blucene-nutch/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>ubuntu下jdk＋eclipse＋tomcat的配置</title>
		<link>http://clfour.com/2008/10/ubuntu-jdk-eclipse-tomcat/</link>
		<comments>http://clfour.com/2008/10/ubuntu-jdk-eclipse-tomcat/#comments</comments>
		<pubDate>Tue, 30 Sep 2008 17:24:00 +0000</pubDate>
		<dc:creator>Fred</dc:creator>
				<category><![CDATA[干活]]></category>
		<category><![CDATA[eclipse]]></category>
		<category><![CDATA[IT]]></category>
		<category><![CDATA[jdk]]></category>
		<category><![CDATA[Study]]></category>
		<category><![CDATA[tomcat]]></category>
		<category><![CDATA[ubuntu]]></category>

		<guid isPermaLink="false">http://clfour.com/2008/10/ubuntu-jdk-eclipse-tomcat/</guid>
		<description><![CDATA[前几天把ubuntu下的一些工具配置了一下，真的是够费事的，现在写写具体的过程，给自己做个参照 ，也希望能给有需要的提供下信息吧。目前，我把开发环境搭建如下：ubuntu8.04 +jdk1.6.0_06 +Eclipse3.2.2 +Tomcat6.0.18 +Lucene2.3.2 +Nutch0.9，不过昨天把ubuntu升级了一下，现在发现jdk已经升级到1.6.0_07了，现在不知道会不会有影响。。。 现说说jdk，eclipse，tomcat的配置情况吧。基本上是参考这两篇：[原创]Ubuntu 7.10 J2EE开发环境lomboz+eclipse3.2.1+tomcat5.5.25+mysql5.ubuntu 8.04 J2EE 开发环境 eclipse 3.4汉化+tomcat+mysql+oracle+三大框架 ##CONTINUE## //***************************************// 1. jdk 首先安装JDK，sudo apt-get install sun-java6-jre sun-java6-jdk sun-java6-demo sun-java6-doc sun-java6-source sun-java6-plugin sun-java6-fonts libmyodbc [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://lh6.ggpht.com/yest835/SJHuKRwH4lI/AAAAAAAACAo/8CIKBwhmR8k/s288/%E7%94%B5%E5%BD%B1%E6%B5%B7%E6%8A%A5b.jpg" onblur="try {parent.deselectBloggerImageGracefully();} catch(e) {}"><img style="float: left; margin: 0pt 10px 10px 0pt; width: 200px; cursor: pointer;" src="http://lh6.ggpht.com/yest835/SJHuKRwH4lI/AAAAAAAACAo/8CIKBwhmR8k/s288/%E7%94%B5%E5%BD%B1%E6%B5%B7%E6%8A%A5b.jpg" border="0" alt="" /></a>前几天把ubuntu下的一些工具配置了一下，真的是够费事的，现在写写具体的过程，给自己做个参照 ，也希望能给有需要的提供下信息吧。目前，我把开发环境搭建如下：ubuntu8.04 +jdk1.6.0_06 +Eclipse3.2.2 +Tomcat6.0.18 +Lucene2.3.2 +Nutch0.9，不过昨天把ubuntu升级了一下，现在发现jdk已经升级到1.6.0_07了，现在不知道会不会有影响。。。<br />
现说说jdk，eclipse，tomcat的配置情况吧。基本上是参考<span style="font-weight: normal;">这两篇：</span><a href="http://forum.ubuntu.org.cn/viewtopic.php?p=768033&amp;highlight=#768033">[原创]Ubuntu 7.10 J2EE开发环境lomboz+eclipse3.2.1+tomcat5.5.25+mysql5.</a><a class="titles" href="http://forum.ubuntu.org.cn/viewtopic.php?f=43&amp;t=135794&amp;start=0&amp;st=0&amp;sk=t&amp;sd=a">ubuntu 8.04 J2EE 开发环境 eclipse 3.4汉化+tomcat+mysql+oracle+三大框架</a><br />
##CONTINUE##<br />
//***************************************//<br />
1. jdk<br />
首先安装JDK，sudo apt-get install sun-java6-jre sun-java6-jdk sun-java6-demo sun-java6-doc sun-java6-source sun-java6-plugin sun-java6-fonts libmyodbc tdsodb<br />
此将JAVA环境安装全，包括实例和API文档，需要说明的是API文档需要另下载,照提示把API文档放到/tmp目录下，需要提醒的是，在安装过程会有一个确定，按TAB键，选择确定 （doc去官网上下就可以了）<br />
下面是关键的步骤：</p>
<p>环境变量的设置：<br />
sudo gedit /etc/profile //这个配制文件就是一个纯文本的东西，用什么工具自己选择vi、vim、gvim、emacs什么的都可以，只要是你机器里有的文本编辑工具就可以<br />
JAVA_HOME=/usr/lib/jvm/java-6-sun<br />
CLASSPATH=.:/usr/lib/jvm/java-6-sun/lib<br />
JRE_HOME=/usr/lib/jvm/java-6-sun/jre<br />
export JRE_HOME<br />
export CLASSPATH<br />
export JAVA_HOME<br />
要特别注意位置是文章未尾umask 022之前</p>
<p>sudo gedit /etc/environment<br />
JAVA_HOME=/usr/lib/jvm/java-6-sun<br />
CLASSPATH=.:/usr/lib/jvm/java-6-sun/lib<br />
提示：如果要让它立刻生效可以在终端里输入： . /etc/environment<br />
一般情况可以不做设置，因为在这些安装完成后，机器必须得重启下，所没必要设置，但如果只是设置一下<br />
环境变量就要用它的话，就可以采用这种方法。</p>
<p>sudo gedit /etc/jvm<br />
在文件顶部添加<br />
/usr/lib/jvm/java-6-sun<br />
提示：这一步是在设置JDK的优先级</p>
<p>sudo gedit ~/.bashrc<br />
在文件的末尾，添加如下两行<br />
export JAVA_HOME=/usr/lib/jvm/java-6-sun<br />
export PATH=$PATH:$JAVA_HOME/bin<br />
提示：这是在设置用户变量</p>
<p>如果您的机器里装着多个JDK用下面的方法来选择JDK版本（8.04默认是没有安装JDK的，上面的安装只安装了一个版本的JDK，可以不设置）<br />
sudo update-alternatives &#8211;config java</p>
<p>更新当前系统的JDK版本<br />
sudo update-java-alternatives -s java-6-sun</p>
<p>clfour:因为ubuntu刚装的时候已经配置了一些，所以第一步相对简单了许多，只是又去下了一下文档。<br />
//***************************************//<br />
2.eclipse的安装：<br />
eclipse的安装，您可以自己选择，可以用ubuntu提供的版本，也可以自己到eclipse官方网站下载<br />
sudo atp-get install eclipse //ubuntu提供的版本<br />
http://www.eclipse.org 自行下载的版本（当前是3.4）</p>
<p>sudo atp-get install eclipse<br />
设置eclipse<br />
sudo gedit /etc/eclipse/java_home<br />
在文件顶部添加<br />
/usr/lib/jvm/java-6-sun<br />
这样eclipse就可以找到jre环境了</p>
<p>clfour:eclipse之前也已经装过了，是ubuntu提供的3.2版本，也没有在换。</p>
<p>//***************************************//<br />
3.tomcat 安装：<br />
到http://tomcat.apache.org/下载tomcat6.0.18,解压放到/usr/share/目录下。<br />
到http://www.eclipsetotale.com/下载tomcat插件，解压放到eclipse目录下的plugins目录下，在eclipse就能看到小猫了</p>
<p>说明：下载的tomcat6.0.18也可以放到别的目录下，自己选择好了，我给/usr单独进行了分区，所以我的软件全装到了这个目录下，我将包改了名，叫tomcat6.0,您可以不改，<br />
在下面的环境变量用您的包名就可以了</p>
<p>配置环境变量 ：<br />
sudo gedit /etc/profile<br />
输入<br />
CATALINA_HOME=/usr/share/tomcat6.0<br />
export CATALINA_HOME</p>
<p>重启</p>
<p>运行 tomcat<br />
运行 前先输入http://localhost:8080/<br />
看看tomcat是否已经启动</p>
<p>进入tomcat的目录下面<br />
sudo ./catalina.sh run</p>
<p>打开浏览器在地址栏里输入：http://localhost:8080/<br />
看到那只小猫就OK了</p>
<p>关闭tomcat</p>
<p>//***************************************//<br />
eclipse+tomcat<br />
打开eclipse,windows－preferences－tomcat－选择version tomcat6.x,下面设置tomcat home 为tomcat所在目录，OK可以试试了<br />
从eclipse的工具栏按钮中启动tomcat。<br />
如果得到如下提示：<br />
org.apache.catalina.startup.Catalina load<br />
warning: Can&#8217;t load server.xml from /usr/share/tomcat6/conf/server.xml<br />
查看$CATLINA_HOME/conf/server.xml，root用户具有读写权限，其他用户无任何权限，chmod o+r server.xml，添加读权限。</p>
<p>clfour:最后eclipse+tomcat，这一部分感觉还有点问题</p>
]]></content:encoded>
			<wfw:commentRss>http://clfour.com/2008/10/ubuntu-jdk-eclipse-tomcat/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>

