java
文章平均质量分 69
wltao
这个作者很懒,什么都没留下…
展开
-
Java_ABC_3.Lucene创建索引
package lucene; import java.io.File; import java.io.FileReader; import java.io.Reader; import java.util.Date; import org.apache.lucen原创 2011-07-21 12:05:53 · 242 阅读 · 0 评论 -
Java_ABC_10.HashMap的遍历
第一种: Map map = new HashMap(); Iterator iter = map.entrySet().iterator(); while (iter.hasNext()) { Map.Entry entry = (Map.Entry) iter.next(); Object key = entry.getKey(); Object val =转载 2012-03-10 22:53:54 · 216 阅读 · 0 评论 -
Java_ABC_9.遍历文件夹
package comment; import java.io.*; import java.util.ArrayList; public class EraseComments { /** * @param args */ public static ArrayList m_listPath = new ArrayList(); public s原创 2011-12-19 14:53:38 · 393 阅读 · 0 评论 -
玩转Solr.1——solr的起步
1. 选择镜像站点,下载最新版Solr。笔者用的版本是3.3.0,因此以3.3.0为例 2. 将下载的apache-solr-3.3.0.rar解压到D盘,如D:/apache-solr-3.3.0, 进如solr主目录,选择example文件夹,运行start原创 2011-10-18 22:50:03 · 283 阅读 · 0 评论 -
利用 Heritrix 构建特定站点爬虫
本文由浅入深,详细介绍了 Heritrix 在 Eclipse 中的配置、运行。最后对其进行扩展,介绍如何实现只抓取特定网站的页面。 通过本文,读者可以了解 Heritrix 的相关特点以及在 Eclipse 中的配置运行,能够从零开始构建特定站点的专有爬虫,从而为网站增加全文转载 2011-10-18 22:36:13 · 889 阅读 · 0 评论 -
Java_ABC_4.Lucene搜索
package lucene; import java.io.File; import org.apache.lucene.document.Document; import org.apache.lucene.index.Term; import org.apach原创 2011-07-21 12:07:10 · 207 阅读 · 0 评论 -
Java_ABC_2.读写文件
package file; import java.io.BufferedReader; import java.io.BufferedWriter; import java.io.FileReader; import java.io.FileWriter; imp原创 2011-07-21 12:03:08 · 308 阅读 · 0 评论 -
Java_ABC_7.连接Solr,查询数据
package solrj; import java.io.IOException; import java.net.MalformedURLException; import java.util.ArrayList; import java.util.Collect原创 2011-07-21 12:22:01 · 706 阅读 · 0 评论 -
Java_ABC_6.解析XML
package xml; import org.w3c.dom.*; import javax.xml.parsers.*; public class XmlParser { private Document document = null; /**原创 2011-07-21 12:19:17 · 275 阅读 · 0 评论 -
Java_ABC_1.连接MySQL数据库
package jdbc; import java.io.BufferedReader; import java.io.FileReader; import java.io.FileWriter; import java.io.IOException; import原创 2011-07-21 12:01:14 · 323 阅读 · 0 评论 -
Java_ABC_8.mmseg导入Solr
1. mmseg4j 用 Chih-Hao Tsai 的 MMSeg 算法(http://technology.chtsai.org/mmseg/ )实现的中文分词器,并实现 lucene 的 analyzer 和 solr 的TokenizerFactory 以方便在Lucen原创 2011-07-21 13:00:43 · 551 阅读 · 0 评论 -
Java_ABC_5.写入XML
package xml; import java.io.FileOutputStream; import org.dom4j.Document; import org.dom4j.DocumentFactory; import org.dom4j.Element;原创 2011-07-21 12:11:52 · 255 阅读 · 0 评论 -
Python进阶_7.Eclipse + PyDey
前言 笔者最近迷上了Python,但是一直没有找到满意的IDE。虽然使用Vim编辑器+命令行的方式比较酷,然而一个优秀的IDE确实能让开发速度提升不少。于是笔者想到Eclipse——一个神一样的利器。经过一番曲折,终究修成正果。整理成文,希望对热爱的Python的童鞋有所帮助。 正文 首先我们需要明白一点——Eclipse作为一个灰常优秀的开发工具,它可被用作N多语言的IDE,转载 2012-03-20 22:57:48 · 779 阅读 · 0 评论