<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>可乐福的家园 &#187; lucene</title>
	<atom:link href="http://clfour.com/tag/lucene/feed/" rel="self" type="application/rss+xml" />
	<link>http://clfour.com</link>
	<description>fun being me</description>
	<lastBuildDate>Sat, 31 Dec 2011 14:36:38 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.3.1</generator>
		<item>
		<title>ubuntu下lucene和nutch的配置</title>
		<link>http://clfour.com/2008/10/ubuntu-blucene-nutch/</link>
		<comments>http://clfour.com/2008/10/ubuntu-blucene-nutch/#comments</comments>
		<pubDate>Wed, 01 Oct 2008 09:34:00 +0000</pubDate>
		<dc:creator>Fred</dc:creator>
				<category><![CDATA[干活]]></category>
		<category><![CDATA[IT]]></category>
		<category><![CDATA[lucene]]></category>
		<category><![CDATA[nutch]]></category>
		<category><![CDATA[Study]]></category>
		<category><![CDATA[ubuntu]]></category>

		<guid isPermaLink="false">http://clfour.com/2008/10/ubuntu-blucene-nutch/</guid>
		<description><![CDATA[这篇是对上面配置的继续 1.安装lucene wget http://apache.mirror.phpchina.com/lucene/java/lucene-2.3.2.tar.gz 不是lucene-2.3.2-src.tar.gz哦，这个无lucene-demos-2.3.2.jar 在目录下： tar zxvf lucene-2.3.2.tar.gz mv lucene-2.3.2 /usr/share 查看解压文件里面的build.txt里面有lucene配置的的基本步骤，根据提示，ant是必须的，我们现在要把ant的安装补上（eclipse下有ant，如果在eclipse下调试的话好像不需要再安装了就。具体的不太清楚也） ##CONTINUE## 2.安装ant http://ant.apache.org/bindownload.cgi ant是一个基于JAVA的自动化脚本引擎，脚本格式为XML。除了做JAVA编译相关任务外，ANT还可以通过插件实现很多应用的调用，比make脚本来说还要好维护一些。 wget http://apache.mirror.phpchina.com/ant/binaries/apache-ant-1.7.1-bin.tar.gz 在对应目录下： tar zxvf apache-ant-1.7.1-bin.tar.gz mv apache-ant-1.7.0 /usr/share/ gedit /etc/profile 加上 ANT_HOME=/usr/share/apache-ant-1.7.1 [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://lh4.ggpht.com/yest835/SJHuJshEwDI/AAAAAAAACAg/b7sk6qSIsUk/s288/%E7%94%B5%E5%BD%B1%E6%B5%B7%E6%8A%A5a.jpg" onblur="try {parent.deselectBloggerImageGracefully();} catch(e) {}"><img style="float: left; margin: 0pt 10px 10px 0pt; width: 200px; cursor: pointer;" src="http://lh4.ggpht.com/yest835/SJHuJshEwDI/AAAAAAAACAg/b7sk6qSIsUk/s288/%E7%94%B5%E5%BD%B1%E6%B5%B7%E6%8A%A5a.jpg" border="0" alt="" /></a>这篇是对上面配置的继续<br />
1.安装lucene<br />
wget http://apache.mirror.phpchina.com/lucene/java/lucene-2.3.2.tar.gz<br />
不是lucene-2.3.2-src.tar.gz哦，这个无lucene-demos-2.3.2.jar<br />
在目录下：<br />
tar zxvf lucene-2.3.2.tar.gz<br />
mv lucene-2.3.2 /usr/share</p>
<p>查看解压文件里面的build.txt里面有lucene配置的的基本步骤，根据提示，ant是必须的，我们现在要把ant的安装补上（eclipse下有ant，如果在eclipse下调试的话好像不需要再安装了就。具体的不太清楚也）<br />
##CONTINUE##<br />
2.安装ant</p>
<p>http://ant.apache.org/bindownload.cgi</p>
<p>ant是一个基于JAVA的自动化脚本引擎，脚本格式为XML。除了做JAVA编译相关任务外，ANT还可以通过插件实现很多应用的调用，比make脚本来说还要好维护一些。</p>
<p>wget http://apache.mirror.phpchina.com/ant/binaries/apache-ant-1.7.1-bin.tar.gz</p>
<p>在对应目录下：<br />
tar zxvf apache-ant-1.7.1-bin.tar.gz</p>
<p>mv apache-ant-1.7.0 /usr/share/</p>
<p>gedit /etc/profile</p>
<p>加上<br />
ANT_HOME=/usr/share/apache-ant-1.7.1<br />
export ANT_HOME<br />
编辑<br />
PATH=$PATH:$JAVA_HOME/bin:$ANT_HOME/bin</p>
<p>3 继续设置lucene<br />
再修改profile<br />
gedit /etc/profile<br />
增加<br />
LUCENE_HOME=/usr/share/lucene-2.3.2<br />
CLASSPATH=.:${JAVA_HOME}/lib/dt.jar:${JAVA_HOME}/lib/tools.jar:${LUCENE_HOME}/lucene-core-2.3.2.jar:${LUCENE_HOME}/lucene-demos-2.3.2.jar</p>
<p>4.测试lucene demo<br />
在lucene目录下，<br />
cd ./src/demo<br />
java org.apache.lucene.demo.IndexFiles /usr/share/lucene-2.3.2/docs</p>
<p>如果路径正确会出现如下：<br />
。<br />
。<br />
。<br />
adding /usr/share/lucene-2.3.2/docs/demo.pdf<br />
adding /usr/share/lucene-2.3.2/docs/demo2.html<br />
adding /usr/share/lucene-2.3.2/docs/gettingstarted.html<br />
adding /usr/share/lucene-2.3.2/docs/fileformats.pdf<br />
adding /usr/share/lucene-2.3.2/docs/scoring.html<br />
adding /usr/share/lucene-2.3.2/docs/linkmap.html<br />
adding /usr/share/lucene-2.3.2/docs/lucene-sandbox/index.html<br />
adding /usr/share/lucene-2.3.2/docs/lucene-sandbox/index.pdf<br />
adding /usr/share/lucene-2.3.2/docs/queryparsersyntax.pdf<br />
adding /usr/share/lucene-2.3.2/docs/linkmap.pdf<br />
adding /usr/share/lucene-2.3.2/docs/demo4.html<br />
adding /usr/share/lucene-2.3.2/docs/benchmarktemplate.xml<br />
adding /usr/share/lucene-2.3.2/docs/index.pdf<br />
Optimizing&#8230;<br />
17869 total milliseconds<br />
并生成index文件夹。<br />
然后就可以搜索了，<br />
输入以下命令就会出现搜索提示符。<br />
java org.apache.lucene.demo.SearchFiles<br />
按提示输入即可。</p>
<p>如果要在tomcat下测试lucene demo可按如下操作：<br />
4.1.将lucene目录下的/src/jsp目录复制到tomcat的webapps目录下，该名为luceneweb<br />
4.2.复制lucene-core-2.3.2.jar和lucene-demos-2.3.2.jar到luceneweb/WEB_INF/lib目录下<span style="text-decoration: line-through;">（或将luceneweb.war复制到tomcat的webapps目录下）没仔细试，好像不行<br />
</span><br />
4.3.将index目录复制到luceneweb目录下<br />
4.4.编辑luceneweb下的configuration.jsp,设置String indexLocation = “/usr/share/tomcat6/webapps/luceneweb/index”;String appfooter也可以自行设置<br />
4.5.重启tomcat，访问http://localhost:8080/luceneweb/，就可以看到lucene demo的界面了，可以试着搜索下看看～</p>
<p>5.安装Nutch<br />
可以去Apache的官方网页http://www.apache.org/dyn/closer.cgi/lucene/nutch/ 下载最新版的Nutch，目前最新版是nutch-0.9<br />
解压缩到目标文件夹即可。<br />
Nutch和tomcat，eclipse的是接下来要做的工作了</p>
]]></content:encoded>
			<wfw:commentRss>http://clfour.com/2008/10/ubuntu-blucene-nutch/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Lucene：基于Java的全文检索引擎简介</title>
		<link>http://clfour.com/2008/09/lucene-introduction/</link>
		<comments>http://clfour.com/2008/09/lucene-introduction/#comments</comments>
		<pubDate>Fri, 19 Sep 2008 09:23:00 +0000</pubDate>
		<dc:creator>Fred</dc:creator>
				<category><![CDATA[干活]]></category>
		<category><![CDATA[IT]]></category>
		<category><![CDATA[java]]></category>
		<category><![CDATA[lucene]]></category>
		<category><![CDATA[Study]]></category>
		<category><![CDATA[ZZ]]></category>

		<guid isPermaLink="false">http://clfour.com/2008/09/lucene-introduction/</guid>
		<description><![CDATA[Lucene：基于Java的全文检索引擎简介 请点击查看原文。##CONTINUE## Lucene是一个基于Java的全文索引工具包。 基于Java的全文索引引擎Lucene简介：关于作者和Lucene的历史 全文检索的实现：Luene全文索引和数据库索引的比较 中文切分词机制简介：基于词库和自动切分词算法的比较 具体的安装和使用简介：系统结构介绍和演示 Hacking Lucene：简化的查询分析器，删除的实现，定制的排序，应用接口的扩展 从Lucene我们还可以学到什么 参考资料： Apache: Lucene Project http://jakarta.apache.org/lucene/ Lucene开发/用户邮件列表归档 http://www.mail-archive.com/lucene-dev@jakarta.apache.org/ http://www.mail-archive.com/lucene-user@jakarta.apache.org/ The Lucene search engine: Powerful, flexible, and free http://www.javaworld.com/javaworld/jw-09-2000/jw-0915-Lucene_p.html Lucene Tutorial http://www.darksleep.com/puff/lucene/lucene.html [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.chedong.com/tech/lucene.html">Lucene：基于Java的全文检索引擎简介</a><br />
请点击查看原文。##CONTINUE##</p>
<p>Lucene是一个基于Java的全文索引工具包。<br />
<a href="http://www.chedong.com/tech/lucene.html#intro">基于Java的全文索引引擎Lucene简介：关于作者和Lucene的历史</a><br />
<a href="http://www.chedong.com/tech/lucene.html#compare">全文检索的实现：Luene全文索引和数据库索引的比较</a><br />
<a href="http://www.chedong.com/tech/lucene.html#segment">中文切分词机制简介：基于词库和自动切分词算法的比较</a><br />
<a href="http://www.chedong.com/tech/lucene.html#demo">具体的安装和使用简介：系统结构介绍和演示</a><br />
<a href="http://www.chedong.com/tech/lucene.html#hacking">Hacking Lucene：简化的查询分析器，删除的实现，定制的排序，应用接口的扩展</a><br />
<a href="http://www.chedong.com/tech/lucene.html#learn">从Lucene我们还可以学到什么</a></p>
<p>参考资料：<br />
Apache: Lucene Project<br />
<a href="http://jakarta.apache.org/lucene/">http://jakarta.apache.org/lucene/</a><br />
Lucene开发/用户邮件列表归档<br />
<a href="http://www.mail-archive.com/lucene-user@jakarta.apache.org/">http://www.mail-archive.com/</a><a href="mailto:lucene-dev@jakarta.apache.org/">lucene-dev@jakarta.apache.org/</a><br />
<a href="http://www.mail-archive.com/lucene-user@jakarta.apache.org/">http://www.mail-archive.com/lucene-user@jakarta.apache.org/</a><br />
The Lucene search engine: Powerful, flexible, and free<br />
<a href="http://www.javaworld.com/javaworld/jw-09-2000/jw-0915-lucene_p.html">http://www.javaworld.com/javaworld/jw-09-2000/jw-0915-Lucene_p.html</a><br />
Lucene Tutorial<br />
<a href="http://www.darksleep.com/puff/lucene/lucene.html">http://www.darksleep.com/puff/lucene/lucene.html</a><br />
Notes on distributed searching with Lucene<br />
<a href="http://home.clara.net/markharwood/lucene/">http://home.clara.net/markharwood/lucene/</a><br />
中文语言的切分词<br />
<a href="http://www.google.com/search?sourceid=navclient&amp;hl=zh-CN&amp;q=chinese+word+segment">http://www.google.com/search?sourceid=navclient&amp;hl=zh-CN&amp;q=chinese+word+segment</a><br />
搜索引擎工具介绍<br />
<a href="http://searchtools.com/">http://searchtools.com/</a><br />
Lucene作者Cutting的几篇论文和专利<br />
<a href="http://lucene.sourceforge.net/publications.html">http://lucene.sourceforge.net/publications.html</a><br />
Lucene的.NET实现：dotLucene<br />
<a href="http://sourceforge.net/projects/dotlucene/">http://sourceforge.net/projects/dotlucene/</a><br />
Lucene作者Cutting的另外一个项目：基于Java的搜索引擎Nutch<br />
<a href="http://www.nutch.org/">http://www.nutch.org/</a><br />
<a href="http://sourceforge.net/projects/nutch/">http://sourceforge.net/projects/nutch/</a><br />
关于基于词表和N-Gram的切分词比较<br />
<a href="http://china.nikkeibp.co.jp/cgi-bin/china/news/int/int200302100112.html">http://china.nikkeibp.co.jp/cgi-bin/china/news/int/int200302100112.html</a><br />
2005-01-08 <a href="http://lucene.sourceforge.net/talks/pisa/">Cutting在Pisa大学做的关于Lucene的讲座：非常详细的Lucene架构解说</a><br />
特别感谢：<a href="http://www.google.com/search?q=%22Jack+Xu%22+Excite">前网易CTO许良杰(Jack Xu)</a>给我的指导：是您将我带入了搜索引擎这个行业。</p>
]]></content:encoded>
			<wfw:commentRss>http://clfour.com/2008/09/lucene-introduction/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>

