Java实现即时搜索类Sy_解密搜索引擎技术实战Lucene&Java精华版(第3版)源码

【实例简介】

解密搜索引擎技术实战Lucene&Java精华版(第3版)源码

书名:解密搜索引擎技术实战Lucene&Java精华版(第3版)

作者:罗刚 等编著

出版社:电子工业出版社

关键词:Lucene solr 搜索引擎 Lucene实战 随书源码

本书随书光盘文件有1G,压缩后有>400MB,

我单个文件的权限是80MB

故分为下面6个包上传:

解密搜索引擎技术实战Lucene&Java精华版(1)

解密搜索引擎技术实战Lucene&Java精华版(2)-补第5章p1

解密搜索引擎技术实战Lucene&Java精华版(3)-补第5章p2

解密搜索引擎技术实战Lucene&Java精华版(4)

【实例截图】

【核心代码】

fdf70b01-7936-4514-abb8-0c56c23da0ac

├── Char01

│   ├── BinarySearch.java

│   ├── HadoopExample

│   │   └── src

│   │   ├── SimHash

│   │   │   ├── BitUtil.java

│   │   │   ├── ByteUtil.java

│   │   │   ├── FindDup.java

│   │   │   ├── HammingDistance.java

│   │   │   ├── SimHashData.java

│   │   │   ├── SimHashMapper.java

│   │   │   ├── SimHashReducer.java

│   │   │   ├── SimHashSet4.java

│   │   │   └── Span.java

│   │   └── WordCount.java

│   └── readme.txt

├── Char02

│   ├── HttpClient

│   │   ├── bin

│   │   │   ├── GetAndPost.class

│   │   │   ├── HttpClientUtils.class

│   │   │   ├── Jq.class

│   │   │   ├── SimpleGET.class

│   │   │   └── UATest.class

│   │   └── src

│   │   ├── HttpClientUtils.java

│   │   ├── SimpleGET.java

│   │   ├── TestGet.java

│   │   ├── TestPost.java

│   │   └── UATest.java

│   ├── readme.txt

│   ├── RealTimeSpider

│   │   ├── bin

│   │   │   └── com

│   │   │   └── lietu

│   │   │   ├── spider

│   │   │   │   ├── jdbc.class

│   │   │   │   ├── ModifyDate.class

│   │   │   │   ├── MoreUrl.class

│   │   │   │   ├── Node1.class

│   │   │   │   ├── Node2.class

│   │   │   │   ├── Print.class

│   │   │   │   ├── RealTimeSpider2.class

│   │   │   │   ├── RealTimeSpider3.class

│   │   │   │   ├── RealTimeSpider.class

│   │   │   │   ├── RealTimeSpiderTrip.class

│   │   │   │   ├── RetrivePage.class

│   │   │   │   ├── URLSeen.class

│   │   │   │   └── XpathExample.class

│   │   │   └── test

│   │   │   ├── Client.class

│   │   │   ├── Print.class

│   │   │   ├── Server.class

│   │   │   ├── ServerClient$CreateServerThread.class

│   │   │   └── ServerClient.class

│   │   ├── db.mdb

│   │   ├── nihao.txt

│   │   └── src

│   │   └── com

│   │   └── lietu

│   │   ├── spider

│   │   │   ├── jdbc.java

│   │   │   ├── ModifyDate.java

│   │   │   ├── MoreUrl.java

│   │   │   ├── Node1.java

│   │   │   ├── Node2.java

│   │   │   ├── Print.java

│   │   │   ├── RealTimeSpider2.java

│   │   │   ├── RealTimeSpider3.java

│   │   │   ├── RealTimeSpider.java

│   │   │   ├── RealTimeSpiderTrip.java

│   │   │   ├── RetrivePage.java

│   │   │   ├── URLSeen.java

│   │   │   └── XpathExample.java

│   │   └── test

│   │   ├── Client.java

│   │   ├── Print.java

│   │   ├── ServerClient.java

│   │   └── Server.java

│   ├── RssForumSpider

│   │   ├── bin

│   │   │   ├── com

│   │   │   │   └── lietu

│   │   │   │   ├── contentExtractor

│   │   │   │   │   ├── AutoSummary.class

│   │   │   │   │   └── DatePattern.class

│   │   │   │   ├── keywords

│   │   │   │   │   ├── Bigrams.class

│   │   │   │   │   ├── BigramsContextCounts.class

│   │   │   │   │   ├── CnPhraseDic$Prefix.class

│   │   │   │   │   ├── CnPhraseDic$TSTNode.class

│   │   │   │   │   ├── CnPhraseDic.class

│   │   │   │   │   ├── CnTagMaker.class

│   │   │   │   │   ├── KeyWord.class

│   │   │   │   │   ├── PairingHeap$PairNode.class

│   │   │   │   │   ├── PairingHeap.class

│   │   │   │   │   ├── StopSet.class

│   │   │   │   │   ├── WordContext.class

│   │   │   │   │   └── WordWeight.class

│   │   │   │   ├── rssparser

│   │   │   │   │   ├── AppendixInfo.class

│   │   │   │   │   ├── RssItem.class

│   │   │   │   │   ├── RssParser.class

│   │   │   │   │   ├── TextHtml$NumericSymbolicCode.class

│   │   │   │   │   └── TextHtml.class

│   │   │   │   └── spider

│   │   │   │   ├── AVLTreeS$Node.class

│   │   │   │   ├── AVLTreeS.class

│   │   │   │   ├── BadLinkList.class

│   │   │   │   ├── BasicDataSourceImpl.class

│   │   │   │   ├── CharsetHandle.class

│   │   │   │   ├── ContainAttributeFilter.class

│   │   │   │   ├── EDBManager.class

│   │   │   │   ├── FingerPrintDetector.class

│   │   │   │   ├── ForumHtmlParser$ThreadInfo.class

│   │   │   │   ├── ForumHtmlParser.class

│   │   │   │   ├── ForumType.class

│   │   │   │   ├── HttpClientTimeout.class

│   │   │   │   ├── HttpTimeoutFactory.class

│   │   │   │   ├── HttpTimeoutHandler.class

│   │   │   │   ├── HttpURLConnectionTimeout$1.class

│   │   │   │   ├── HttpURLConnectionTimeout.class

│   │   │   │   ├── Md5.class

│   │   │   │   ├── NewsSource.class

│   │   │   │   ├── RssFinder.class

│   │   │   │   ├── SpiderRss.class

│   │   │   │   ├── SpiderSolr.class

│   │   │   │   ├── SpiderThread.class

│   │   │   │   ├── StartAttributeFilter.class

│   │   │   │   ├── StartURLs.class

│   │   │   │   ├── ThreadParser.class

│   │   │   │   ├── ToDoTaskList.class

│   │   │   │   ├── UrlElement.class

│   │   │   │   ├── URLSummary.class

│   │   │   │   ├── VisitedTaskList.class

│   │   │   │   └── XML.class

│   │   │   └── test

│   │   │   ├── Base64.class

│   │   │   ├── ForumPageParser.class

│   │   │   ├── LinkExtractor.class

│   │   │   ├── TestForumHtmlParser.class

│   │   │   ├── TestMD5.class

│   │   │   ├── TestReplyTime.class

│   │   │   ├── TestRssFinder.class

│   │   │   ├── TestRssParser.class

│   │   │   ├── TestSpiderThread.class

│   │   │   └── TestTags.class

│   │   ├── build.xml

│   │   ├── database.properties

│   │   ├── MANIFEST.MF

│   │   ├── run

│   │   │   ├── database.properties

│   │   │   ├── database.properties.bak

│   │   │   ├── spider.bat

│   │   │   ├── spider.properties

│   │   │   └── spider.properties.bak

│   │   ├── spider.properties

│   │   ├── src

│   │   │   └── com

│   │   │   └── lietu

│   │   │   ├── contentExtractor

│   │   │   │   ├── AutoSummary.java

│   │   │   │   └── DatePattern.java

│   │   │   ├── keywords

│   │   │   │   ├── BigramsContextCounts.java

│   │   │   │   ├── Bigrams.java

│   │   │   │   ├── CnPhraseDic.java

│   │   │   │   ├── CnTagMaker.java

│   │   │   │   ├── KeyWord.java

│   │   │   │   ├── PairingHeap.java

│   │   │   │   ├── StopSet.java

│   │   │   │   └── WordWeight.java

│   │   │   ├── rssparser

│   │   │   │   ├── AppendixInfo.java

│   │   │   │   ├── RssItem.java

│   │   │   │   ├── RssParser.java

│   │   │   │   └── TextHtml.java

│   │   │   └── spider

│   │   │   ├── AVLTreeS.java

│   │   │   ├── BadLinkList.java

│   │   │   ├── BasicDataSourceImpl.java

│   │   │   ├── CharsetHandle.java

│   │   │   ├── ContainAttributeFilter.java

│   │   │   ├── EDBManager.java

│   │   │   ├── FingerPrintDetector.java

│   │   │   ├── ForumHtmlParser.java

│   │   │   ├── ForumType.java

│   │   │   ├── HttpClientTimeout.java

│   │   │   ├── HttpTimeoutFactory.java

│   │   │   ├── HttpTimeoutHandler.java

│   │   │   ├── HttpURLConnectionTimeout.java

│   │   │   ├── Md5.java

│   │   │   ├── NewsSource.java

│   │   │   ├── RssFinder.java

│   │   │   ├── SpiderRss.java

│   │   │   ├── SpiderSolr.java

│   │   │   ├── SpiderThread.java

│   │   │   ├── StartAttributeFilter.java

│   │   │   ├── StartURLs.java

│   │   │   ├── ThreadParser.java

│   │   │   ├── ToDoTaskList.java

│   │   │   ├── URLSummary.java

│   │   │   ├── VisitedTaskList.java

│   │   │   └── XML.java

│   │   └── test

│   │   └── test

│   │   ├── Base64.java

│   │   ├── ForumPageParser.java

│   │   ├── LinkExtractor.java

│   │   ├── TestForumHtmlParser.java

│   │   ├── TestMD5.java

│   │   ├── TestReplyTime.java

│   │   ├── TestRssFinder.java

│   │   ├── TestRssParser.java

│   │   ├── TestSpiderThread.java

│   │   └── TestTags.java

│   ├── spider

│   │   ├── ChangeIp.class

│   │   ├── ChangeIp.java

│   │   ├── ConcurrentSpider$Indexer.class

│   │   ├── ConcurrentSpider$Spider.class

│   │   ├── ConcurrentSpider.class

│   │   ├── ConcurrentSpider.java

│   │   ├── Entities$ArrayEntityMap.class

│   │   ├── Entities$BinaryEntityMap.class

│   │   ├── Entities$EntityMap.class

│   │   ├── Entities$HashEntityMap.class

│   │   ├── Entities$LookupEntityMap.class

│   │   ├── Entities$MapIntMap.class

│   │   ├── Entities$PrimitiveEntityMap.class

│   │   ├── Entities$TreeEntityMap.class

│   │   ├── Entities.class

│   │   ├── Entities.java

│   │   ├── GetInformation.class

│   │   ├── GetInformation.java

│   │   ├── Html2Text.class

│   │   ├── Html2Text.java

│   │   ├── IntHashMap$Entry.class

│   │   ├── IntHashMap.class

│   │   ├── IntHashMap.java

│   │   ├── ModifyDate.class

│   │   ├── ModifyDate.java

│   │   ├── MyCrawler.class

│   │   ├── MyCrawler.java

│   │   ├── package.html

│   │   ├── RetrivePage.class

│   │   ├── RetrivePage.java

│   │   ├── SGet.class

│   │   ├── SGet.java

│   │   ├── SHead.class

│   │   ├── SHead.java

│   │   ├── SimpleBloomFilter.class

│   │   ├── SimpleBloomFilter.java

│   │   ├── SocketChannelSelector.class

│   │   ├── SocketChannelSelector.java

│   │   ├── SocketHead.class

│   │   ├── SocketHead.java

│   │   ├── SyDown.class

│   │   ├── SyDown.java

│   │   ├── TestCookie.class

│   │   ├── TestCookie.java

│   │   ├── TestExtractURL.class

│   │   ├── TestExtractURL.java

│   │   ├── TopicCrawler.class

│   │   ├── TopicCrawler.java

│   │   ├── URLParser.class

│   │   ├── URLParser.java

│   │   ├── URLSeen.class

│   │   └── URLSeen.java

│   └── webGraph

│   ├── HITS.java

│   ├── Link.java

│   ├── PageRank.java

│   ├── WebGraph.java

│   └── WebGraphMemory.java

├── Char03

│   ├── NewsCrawler

│   │   ├── build.xml

│   │   ├── crawler.db

│   │   ├── lib

│   │   │   └── newsCrawler.bat

│   │   ├── MANIFEST.MF

│   │   ├── run

│   │   │   ├── crawler.db

│   │   │   └── newsCrawler.bat

│   │   ├── src

│   │   │   ├── com

│   │   │   │   └── lietu

│   │   │   │   ├── detailPage

│   │   │   │   │   ├── ArticleExtractor.java

│   │   │   │   │   ├── AVLTree.java

│   │   │   │   │   ├── DatePattern.java

│   │   │   │   │   ├── DetailInfo.java

│   │   │   │   │   ├── DetailPageExtractor.java

│   │   │   │   │   ├── DetailPaging.java

│   │   │   │   │   ├── JSClassify.java

│   │   │   │   │   ├── JSDetailPage.java

│   │   │   │   │   └── PageExtractor.java

│   │   │   │   ├── FrontPage

│   │   │   │   │   ├── FrontPage2Detail.java

│   │   │   │   │   ├── FrontPageDetector.java

│   │   │   │   │   └── FrontPageHandle.java

│   │   │   │   ├── ie

│   │   │   │   │   ├── AdjList.java

│   │   │   │   │   ├── BodyWords.java

│   │   │   │   │   ├── bodyWords.txt

│   │   │   │   │   ├── CnToken.java

│   │   │   │   │   ├── CnTokenLinkedList.java

│   │   │   │   │   ├── CopyRightWords.java

│   │   │   │   │   ├── copyRightWords.txt

│   │   │   │   │   ├── DocPart.java

│   │   │   │   │   ├── Evidence.java

│   │   │   │   │   ├── FuncTree.java

│   │   │   │   │   ├── gov.txt

│   │   │   │   │   ├── GraphMatcher.java

│   │   │   │   │   ├── NextInput.java

│   │   │   │   │   ├── NodeType.java

│   │   │   │   │   ├── package.html

│   │   │   │   │   ├── RightParser.java

│   │   │   │   │   ├── Rule.java

│   │   │   │   │   ├── StackValue.java

│   │   │   │   │   ├── StructExtractor.java

│   │   │   │   │   ├── template.txt

│   │   │   │   │   ├── TernarySearchTrie.java

│   │   │   │   │   ├── TextExtractor.java

│   │   │   │   │   ├── Token.java

│   │   │   │   │   ├── TreeNode.java

│   │   │   │   │   ├── Trie.java

│   │   │   │   │   ├── TrieNode.java

│   │   │   │   │   └── WordEntry.java

│   │   │   │   ├── listPage

│   │   │   │   │   ├── AString.java

│   │   │   │   │   ├── BroadCrawler.java

│   │   │   │   │   ├── DetailPage2List.java

│   │   │   │   │   ├── DetailURLExtractor.java

│   │   │   │   │   ├── HotTrack.java

│   │   │   │   │   ├── ListCollector.java

│   │   │   │   │   ├── ListPageDetector.java

│   │   │   │   │   ├── ListURLIterator.java

│   │   │   │   │   ├── ListURL.java

│   │   │   │   │   ├── ListUtil.java

│   │   │   │   │   ├── NavigatorExtractor.java

│   │   │   │   │   ├── NavigatorTravel.java

│   │   │   │   │   ├── NextLinkFinder.java

│   │   │   │   │   ├── Page.java

│   │   │   │   │   ├── Repeat.java

│   │   │   │   │   └── TextVisitor.java

│   │   │   │   ├── match

│   │   │   │   │   └── template

│   │   │   │   │   ├── AdjList.java

│   │   │   │   │   ├── CnToken.java

│   │   │   │   │   ├── CnTokenLinkedList.java

│   │   │   │   │   ├── GraphMatcher.java

│   │   │   │   │   ├── IndexMinPQ.java

│   │   │   │   │   ├── NextInput.java

│   │   │   │   │   ├── NodeType.java

│   │   │   │   │   ├── PriorityQueue.java

│   │   │   │   │   ├── RightParser.java

│   │   │   │   │   ├── Rule.java

│   │   │   │   │   ├── StackValue.java

│   │   │   │   │   ├── TernarySearchTrie.java

│   │   │   │   │   ├── Trie.java

│   │   │   │   │   ├── TrieNode.java

│   │   │   │   │   ├── URLTemplate.java

│   │   │   │   │   ├── WordEntry.java

│   │   │   │   │   ├── WordTokenInf.java

│   │   │   │   │   └── WordType.java

│   │   │   │   ├── newsSpider

│   │   │   │   │   ├── BasicDataSourceImpl.java

│   │   │   │   │   ├── BlockTree.java

│   │   │   │   │   ├── BloomFilter.java

│   │   │   │   │   ├── CopyRightBlock.java

│   │   │   │   │   ├── Crawler.java

│   │   │   │   │   ├── CrawlerUI.java

│   │   │   │   │   ├── DBUtil.java

│   │   │   │   │   ├── DetailLProvider.java

│   │   │   │   │   ├── DetailNotFindException.java

│   │   │   │   │   ├── DetailURL.java

│   │   │   │   │   ├── DocIDServer.java

│   │   │   │   │   ├── ElasticSearchClient.java

│   │   │   │   │   ├── ExtractListURL.java

│   │   │   │   │   ├── HttpUtil.java

│   │   │   │   │   ├── IFrameExtractor.java

│   │   │   │   │   ├── JSDetailInfo.java

│   │   │   │   │   ├── JSExtractor.java

│   │   │   │   │   ├── JSListExtractor.java

│   │   │   │   │   ├── JSListHandler.java

│   │   │   │   │   ├── LinkFilter.java

│   │   │   │   │   ├── LinkPrefix.java

│   │   │   │   │   ├── ListExtractor.java

│   │   │   │   │   ├── ListHandler.java

│   │   │   │   │   ├── ListPageLabeler.java

│   │   │   │   │   ├── ListTable.java

│   │   │   │   │   ├── NewsSpider.java

│   │   │   │   │   ├── package.html

│   │   │   │   │   ├── PageDetail.java

│   │   │   │   │   ├── PageDistance.java

│   │   │   │   │   ├── PageFeatureConfig.java

│   │   │   │   │   ├── Page.java

│   │   │   │   │   ├── PageList.java

│   │   │   │   │   ├── PageSimilarity.java

│   │   │   │   │   ├── PagingText.java

│   │   │   │   │   ├── PrefixExtractor.java

│   │   │   │   │   ├── Queue.java

│   │   │   │   │   ├── StaticLinkFilter.java

│   │   │   │   │   ├── StaticListHandler.java

│   │   │   │   │   ├── StringSimilarity.java

│   │   │   │   │   ├── TargetDB.java

│   │   │   │   │   ├── TargetES.java

│   │   │   │   │   ├── Target.java

│   │   │   │   │   ├── URLClassify.java

│   │   │   │   │   ├── Util.java

│   │   │   │   │   └── Visitor.java

│   │   │   │   ├── rss

│   │   │   │   │   ├── DateParser.java

│   │   │   │   │   ├── RssItem.java

│   │   │   │   │   ├── RssParser.java

│   │   │   │   │   ├── RSSUtil.java

│   │   │   │   │   ├── TargetES.java

│   │   │   │   │   ├── Target.java

│   │   │   │   │   └── ThreadInfo.java

│   │   │   │   ├── subDomain

│   │   │   │   │   ├── DomainType.java

│   │   │   │   │   └── SubDomain.java

│   │   │   │   ├── tableExtract

│   │   │   │   │   └── KVExtractor.java

│   │   │   │   ├── topicPage

│   │   │   │   │   ├── TopicPageDetector.java

│   │   │   │   │   └── TopicURLExtractor.java

│   │   │   │   └── url

│   │   │   │   ├── ParseURL.java

│   │   │   │   ├── TLDList.java

│   │   │   │   ├── URLCanonicalizer.java

│   │   │   │   ├── UrlResolver.java

│   │   │   │   ├── URLValid.java

│   │   │   │   └── WebURL.java

│   │   │   ├── config.properties

│   │   │   ├── db.properties

│   │   │   └── tld-names.txt

│   │   └── test

│   │   ├── detailPage

│   │   │   ├── TestContentExtract.java

│   │   │   ├── TestDetailPageExtractor.java

│   │   │   ├── TestHtmlUnit.java

│   │   │   ├── TestJSClassify.java

│   │   │   ├── TestJSDetail.java

│   │   │   └── TestJSEngineer.java

│   │   ├── ie

│   │   │   ├── gov.txt

│   │   │   ├── JD.java

│   │   │   ├── TestBodyWords.java

│   │   │   ├── TestCopyRightWords.java

│   │   │   ├── TestEnglishExtractor.java

│   │   │   ├── TestIE.java

│   │   │   ├── TestKVExtractor.java

│   │   │   ├── TestRightParser.java

│   │   │   ├── TestRSS.java

│   │   │   ├── TestStructExtract.java

│   │   │   ├── TestTrie.java

│   │   │   └── TestUnescap.java

│   │   ├── input

│   │   │   ├── CreateTest.java

│   │   │   └── TestClient.java

│   │   ├── jsoup

│   │   │   └── TestJsoup.java

│   │   ├── listPage

│   │   │   ├── TestDetailURLExtractor.java

│   │   │   ├── TestFrontPage2Detail.java

│   │   │   ├── TestFrontPageDetector.java

│   │   │   ├── TestFrontPageHandler.java

│   │   │   ├── TestListCollector.java

│   │   │   ├── TestListPageDetector.java

│   │   │   ├── TestListURLIterator.java

│   │   │   ├── TestListUtil.java

│   │   │   ├── TestSina.java

│   │   │   └── TestTextVisitor.java

│   │   ├── multiThread

│   │   │   ├── RealTimeSpider.java

│   │   │   └── TestThreadSpider.java

│   │   ├── newsSpider

│   │   │   ├── crawler.mdb

│   │   │   ├── ExtractNews.java

│   │   │   ├── ListComparator.java

│   │   │   ├── TestAVLTree.java

│   │   │   ├── TestCalcSign.java

│   │   │   ├── TestCollector.java

│   │   │   ├── TestDatePattern.java

│   │   │   ├── TestDBUtil.java

│   │   │   ├── TestDocIDServer.java

│   │   │   ├── TestDownLoader.java

│   │   │   ├── TestDWTAlignment.java

│   │   │   ├── TestDWTDistance.java

│   │   │   ├── TestHttpClient.java

│   │   │   ├── TestHttpUtil.java

│   │   │   ├── TestIFrame.java

│   │   │   ├── TestJSExtractor.java

│   │   │   ├── TestJSListHandler.java

│   │   │   ├── TestJSList.java

│   │   │   ├── TestJsoup.java

│   │   │   ├── TestJSPaging.java

│   │   │   ├── TestLDS.java

│   │   │   ├── TestLinkPrefix.java

│   │   │   ├── TestListComparator.java

│   │   │   ├── TestListExtractor.java

│   │   │   ├── TestListTable.java

│   │   │   ├── TestMatchPrefix.java

│   │   │   ├── TestNavigatorExtractor.java

│   │   │   ├── TestNewsSpider.java

│   │   │   ├── TestNextLinkFinder.java

│   │   │   ├── TestPageSimilarity.java

│   │   │   ├── TestPrefixExtractor.java

│   │   │   ├── TestQueue.java

│   │   │   ├── TestStaticListHandler.java

│   │   │   ├── TestTargetDb.java

│   │   │   ├── TestTargetES.java

│   │   │   ├── TestURL.java

│   │   │   ├── TitleAlignment.java

│   │   │   └── UTestQueue.java

│   │   ├── rss

│   │   │   ├── TestParseDate.java

│   │   │   ├── TestRssParser.java

│   │   │   ├── TestRSSSpider.java

│   │   │   └── TestRSSUtil.java

│   │   ├── search

│   │   │   ├── HighlighterTest.java

│   │   │   ├── PagingTest.java

│   │   │   ├── PhraseQueryTest.java

│   │   │   ├── QueryTest.java

│   │   │   ├── TestFacet.java

│   │   │   └── TestFilter.java

│   │   ├── searchSpider

│   │   │   ├── BaiduSpider.java

│   │   │   ├── HttpUtil.java

│   │   │   ├── SearchResult.java

│   │   │   └── TestRedirect.java

│   │   ├── template

│   │   │   ├── template.txt

│   │   │   ├── TestAdjList.java

│   │   │   ├── TestQueryTemplate.java

│   │   │   └── TestRightParser.java

│   │   ├── topicPage

│   │   │   └── TestTopicURL.java

│   │   ├── url

│   │   │   ├── TestParseURL.java

│   │   │   ├── TestURLNormnizer.java

│   │   │   ├── TestWebURL.java

│   │   │   └── URLCanonicalizerTest.java

│   │   └── weibo

│   │   ├── HtmlUnitWeibo.java

│   │   ├── SearchWeiBo.java

│   │   └── spider.java

│   ├── newsspider

│   │   ├── bin

│   │   │   ├── com

│   │   │   │   └── lietu

│   │   │   │   ├── newsspider

│   │   │   │   │   ├── config

│   │   │   │   │   │   └── crawler.properties

│   │   │   │   │   ├── db

│   │   │   │   │   │   ├── BasicDataSourceImpl.class

│   │   │   │   │   │   ├── BerkeleyDBDao.class

│   │   │   │   │   │   ├── DatePattern.class

│   │   │   │   │   │   ├── DateSummary.class

│   │   │   │   │   │   ├── EDBManager.class

│   │   │   │   │   │   ├── IndexUrl.class

│   │   │   │   │   │   ├── ReadURL.class

│   │   │   │   │   │   ├── SimpleBloomFilter.class

│   │   │   │   │   │   ├── TextHtml$NumericSymbolicCode.class

│   │   │   │   │   │   ├── TextHtml.class

│   │   │   │   │   │   ├── ToDoTaskList.class

│   │   │   │   │   │   ├── VisitedTaskList.class

│   │   │   │   │   │   └── WebSite.class

│   │   │   │   │   ├── DetailPageParser.class

│   │   │   │   │   ├── ex

│   │   │   │   │   │   ├── PageListLoop.class

│   │   │   │   │   │   └── TestSpider.class

│   │   │   │   │   ├── FileDownLoader.class

│   │   │   │   │   ├── ie

│   │   │   │   │   │   ├── CharSetFilter.class

│   │   │   │   │   │   ├── ContentExtractor$IntRange.class

│   │   │   │   │   │   ├── ContentExtractor$NodeDesc.class

│   │   │   │   │   │   ├── ContentExtractor.class

│   │   │   │   │   │   ├── FastListExtractor$BooleanValue.class

│   │   │   │   │   │   ├── FastListExtractor$IntValue.class

│   │   │   │   │   │   ├── FastListExtractor$NodeInf.class

│   │   │   │   │   │   ├── FastListExtractor.class

│   │   │   │   │   │   ├── LinkDesc.class

│   │   │   │   │   │   ├── ListExtractor$BooleanValue.class

│   │   │   │   │   │   ├── ListExtractor$IntValue.class

│   │   │   │   │   │   ├── ListExtractor$NodeInf.class

│   │   │   │   │   │   ├── ListExtractor.class

│   │   │   │   │   │   └── TitleSimilarity.class

│   │   │   │   │   ├── ListPageParser.class

│   │   │   │   │   ├── page

│   │   │   │   │   │   ├── Page.class

│   │   │   │   │   │   ├── PageDetail.class

│   │   │   │   │   │   ├── PageDistance.class

│   │   │   │   │   │   ├── PageList.class

│   │   │   │   │   │   ├── PageSimilarity.class

│   │   │   │   │   │   ├── PageType.class

│   │   │   │   │   │   ├── PageTypeFinder.class

│   │   │   │   │   │   └── PageUnknow.class

│   │   │   │   │   ├── PageIterator.class

│   │   │   │   │   ├── PageLinkCollector.class

│   │   │   │   │   ├── PageParser.class

│   │   │   │   │   ├── pagewalker

│   │   │   │   │   │   ├── Filter.class

│   │   │   │   │   │   ├── PageScanner.class

│   │   │   │   │   │   └── PageVisitor.class

│   │   │   │   │   ├── Spider.class

│   │   │   │   │   ├── SpiderList.class

│   │   │   │   │   ├── util

│   │   │   │   │   │   ├── ConfigUtil.class

│   │   │   │   │   │   └── URLUtil.class

│   │   │   │   │   └── writer

│   │   │   │   │   ├── ContentWriter.class

│   │   │   │   │   ├── DbWriter.class

│   │   │   │   │   ├── PrintWriter.class

│   │   │   │   │   └── SolrWriter.class

│   │   │   │   └── save

│   │   │   │   ├── BasicDataSourceImpl.class

│   │   │   │   ├── CmsWriter.class

│   │   │   │   ├── ContentWriter.class

│   │   │   │   ├── FileIo.class

│   │   │   │   ├── Save.class

│   │   │   │   └── SqlDateSourceImpl.class

│   │   │   ├── db.properties

│   │   │   ├── mysqldb.properties

│   │   │   ├── sql.properties

│   │   │   └── test

│   │   │   └── com

│   │   │   └── lietu

│   │   │   └── newsspider

│   │   │   ├── db

│   │   │   │   └── SimpleBloomFilterTest.class

│   │   │   ├── ie

│   │   │   │   ├── TestContentExtractor.class

│   │   │   │   ├── TestFastListExtractor.class

│   │   │   │   └── TestListExtractor.class

│   │   │   ├── page

│   │   │   │   ├── PageDistance.class

│   │   │   │   ├── PageSimilarity.class

│   │   │   │   └── TestPageType.class

│   │   │   ├── pagewalker

│   │   │   │   └── TestPageScanner.class

│   │   │   ├── sst

│   │   │   │   ├── RootStyleNode.class

│   │   │   │   ├── StyleNode.class

│   │   │   │   ├── StyleNodeSet.class

│   │   │   │   ├── StyleTree.class

│   │   │   │   ├── testStyleNode.class

│   │   │   │   └── testStyleNodeSet.class

│   │   │   └── zhang

│   │   │   ├── AreaTag.class

│   │   │   ├── BlockquoteTag.class

│   │   │   ├── Greater.class

│   │   │   ├── Image.class

│   │   │   ├── PrototypicalNodeFactory.class

│   │   │   ├── test

│   │   │   │   └── TestDetail.class

│   │   │   ├── Test.class

│   │   │   ├── Try.class

│   │   │   ├── Writer.class

│   │   │   ├── WriterFilter2.class

│   │   │   └── WriterFilter.class

│   │   ├── db

│   │   │   └── create.sql

│   │   ├── doc

│   │   │   ├── 新闻抓取详细设计.doc

│   │   │   └── 论坛信息采集.doc

│   │   ├── src

│   │   │   ├── com

│   │   │   │   └── lietu

│   │   │   │   └── newsspider

│   │   │   │   ├── config

│   │   │   │   │   └── crawler.properties

│   │   │   │   ├── db

│   │   │   │   │   ├── BasicDataSourceImpl.java

│   │   │   │   │   ├── BerkeleyDBDao.java

│   │   │   │   │   ├── DatePattern.java

│   │   │   │   │   ├── DateSummary.java

│   │   │   │   │   ├── EDBManager.java

│   │   │   │   │   ├── IndexUrl.java

│   │   │   │   │   ├── ReadURL.java

│   │   │   │   │   ├── SimpleBloomFilter.java

│   │   │   │   │   ├── TextHtml.java

│   │   │   │   │   ├── ToDoTaskList.java

│   │   │   │   │   ├── VisitedTaskList.java

│   │   │   │   │   └── WebSite.java

│   │   │   │   ├── DetailPageParser.java

│   │   │   │   ├── ex

│   │   │   │   │   ├── PageListLoop.java

│   │   │   │   │   └── TestSpider.java

│   │   │   │   ├── FileDownLoader.java

│   │   │   │   ├── ie

│   │   │   │   │   ├── CharSetFilter.java

│   │   │   │   │   ├── ContentExtractor.java

│   │   │   │   │   ├── FastListExtractor.java

│   │   │   │   │   ├── LinkDesc.java

│   │   │   │   │   ├── ListExtractor.java

│   │   │   │   │   └── TitleSimilarity.java

│   │   │   │   ├── ListPageParser.java

│   │   │   │   ├── page

│   │   │   │   │   ├── PageDetail.java

│   │   │   │   │   ├── PageDistance.java

│   │   │   │   │   ├── Page.java

│   │   │   │   │   ├── PageList.java

│   │   │   │   │   ├── PageSimilarity.java

│   │   │   │   │   ├── PageTypeFinder.java

│   │   │   │   │   ├── PageType.java

│   │   │   │   │   └── PageUnknow.java

│   │   │   │   ├── PageIterator.java

│   │   │   │   ├── PageLinkCollector.java

│   │   │   │   ├── PageParser.java

│   │   │   │   ├── pagewalker

│   │   │   │   │   ├── Filter.java

│   │   │   │   │   ├── PageScanner.java

│   │   │   │   │   └── PageVisitor.java

│   │   │   │   ├── Spider.java

│   │   │   │   ├── SpiderList.java

│   │   │   │   ├── util

│   │   │   │   │   ├── ConfigUtil.java

│   │   │   │   │   └── URLUtil.java

│   │   │   │   └── writer

│   │   │   │   ├── ContentWriter.java

│   │   │   │   ├── DbWriter.java

│   │   │   │   ├── PrintWriter.java

│   │   │   │   └── SolrWriter.java

│   │   │   ├── db.properties

│   │   │   ├── mysqldb.properties

│   │   │   └── sql.properties

│   │   └── test

│   │   ├── com

│   │   │   └── lietu

│   │   │   └── save

│   │   │   ├── BasicDataSourceImpl.java

│   │   │   ├── CmsWriter.java

│   │   │   ├── ContentWriter.java

│   │   │   ├── FileIo.java

│   │   │   ├── Save.java

│   │   │   └── SqlDateSourceImpl.java

│   │   └── test

│   │   └── com

│   │   └── lietu

│   │   └── newsspider

│   │   ├── db

│   │   │   └── SimpleBloomFilterTest.java

│   │   ├── ie

│   │   │   ├── TestContentExtractor.java

│   │   │   ├── TestFastListExtractor.java

│   │   │   └── TestListExtractor.java

│   │   ├── page

│   │   │   ├── PageDistance.java

│   │   │   ├── PageSimilarity.java

│   │   │   └── TestPageType.java

│   │   ├── pagewalker

│   │   │   └── TestPageScanner.java

│   │   ├── sst

│   │   │   ├── RootStyleNode.java

│   │   │   ├── StyleNode.java

│   │   │   ├── StyleNodeSet.java

│   │   │   ├── StyleTree.java

│   │   │   ├── testStyleNode.java

│   │   │   └── testStyleNodeSet.java

│   │   └── zhang

│   │   ├── AreaTag.java

│   │   ├── BlockquoteTag.java

│   │   ├── Greater.java

│   │   ├── Image.java

│   │   ├── PrototypicalNodeFactory.java

│   │   ├── test

│   │   │   └── TestDetail.java

│   │   ├── Test.java

│   │   ├── Try.java

│   │   ├── WriterFilter2.java

│   │   ├── WriterFilter.java

│   │   └── Writer.java

│   ├── parse-rtf

│   │   ├── bin

│   │   │   ├── com

│   │   │   │   └── lietu

│   │   │   │   ├── rtf

│   │   │   │   │   ├── converter

│   │   │   │   │   │   └── text

│   │   │   │   │   │   ├── RtfTextConverter.class

│   │   │   │   │   │   └── RtfTextConvertSettings.class

│   │   │   │   │   ├── extract

│   │   │   │   │   │   ├── RtfExtractor.class

│   │   │   │   │   │   ├── RTFReader$TitleInfo.class

│   │   │   │   │   │   ├── RTFReader.class

│   │   │   │   │   │   └── StopSet.class

│   │   │   │   │   ├── interpreter

│   │   │   │   │   │   ├── RtfColorTableBuilder.class

│   │   │   │   │   │   ├── RtfDocumentInfoBuilder.class

│   │   │   │   │   │   ├── RtfFontBuilder.class

│   │   │   │   │   │   ├── RtfFontTableBuilder.class

│   │   │   │   │   │   ├── RtfImageBuilder.class

│   │   │   │   │   │   ├── RtfInterpreterBase.class

│   │   │   │   │   │   ├── RtfInterpreter.class

│   │   │   │   │   │   ├── RtfInterpreterContext.class

│   │   │   │   │   │   ├── RtfInterpreterListenerBase.class

│   │   │   │   │   │   ├── RtfInterpreterListenerDocumentBuilder.class

│   │   │   │   │   │   ├── RtfInterpreterListenerFileLogger.class

│   │   │   │   │   │   ├── RtfInterpreterListenerLogger.class

│   │   │   │   │   │   ├── RtfInterpreterLoggerSettings.class

│   │   │   │   │   │   ├── RtfTextBuilder.class

│   │   │   │   │   │   ├── RtfTimestampBuilder.class

│   │   │   │   │   │   └── RtfUserPropertyBuilder.class

│   │   │   │   │   ├── interpreterTests

│   │   │   │   │   │   ├── RtfInterpreterTest.class

│   │   │   │   │   │   ├── TextReader.class

│   │   │   │   │   │   └── WriteDocumentModel.class

│   │   │   │   │   ├── IRtfColor.class

│   │   │   │   │   ├── IRtfDocument.class

│   │   │   │   │   ├── IRtfDocumentInfo.class

│   │   │   │   │   ├── IRtfDocumentProperty.class

│   │   │   │   │   ├── IRtfElement.class

│   │   │   │   │   ├── IRtfElementVisitor.class

│   │   │   │   │   ├── IRtfFont.class

│   │   │   │   │   ├── IRtfGroup.class

│   │   │   │   │   ├── IRtfInterpreter.class

│   │   │   │   │   ├── IRtfInterpreterContext.class

│   │   │   │   │   ├── IRtfInterpreterListener.class

│   │   │   │   │   ├── IRtfParser.class

│   │   │   │   │   ├── IRtfParserListener.class

│   │   │   │   │   ├── IRtfSource.class

│   │   │   │   │   ├── IRtfTag.class

│   │   │   │   │   ├── IRtfText.class

│   │   │   │   │   ├── IRtfTextFormat.class

│   │   │   │   │   ├── IRtfVisualBreak.class

│   │   │   │   │   ├── IRtfVisual.class

│   │   │   │   │   ├── IRtfVisualImage.class

│   │   │   │   │   ├── IRtfVisualSpecialChar.class

│   │   │   │   │   ├── IRtfVisualText.class

│   │   │   │   │   ├── IRtfVisualVisitor.class

│   │   │   │   │   ├── model

│   │   │   │   │   │   ├── RtfColor.class

│   │   │   │   │   │   ├── RtfDocument.class

│   │   │   │   │   │   ├── RtfDocumentInfo.class

│   │   │   │   │   │   ├── RtfDocumentProperty.class

│   │   │   │   │   │   ├── RtfElement.class

│   │   │   │   │   │   ├── RtfGroup.class

│   │   │   │   │   │   ├── RtfText.class

│   │   │   │   │   │   ├── RtfTextFormat.class

│   │   │   │   │   │   ├── RtfVisualBreak.class

│   │   │   │   │   │   ├── RtfVisual.class

│   │   │   │   │   │   ├── RtfVisualImage.class

│   │   │   │   │   │   ├── RtfVisualSpecialChar.class

│   │   │   │   │   │   └── RtfVisualText.class

│   │   │   │   │   ├── parser

│   │   │   │   │   │   ├── CodePage2Locale.class

│   │   │   │   │   │   ├── IntValue.class

│   │   │   │   │   │   ├── MemoryStream.class

│   │   │   │   │   │   ├── RtfParserBase.class

│   │   │   │   │   │   ├── RtfParser.class

│   │   │   │   │   │   ├── RtfParserListenerBase.class

│   │   │   │   │   │   ├── RtfParserListenerFileLogger.class

│   │   │   │   │   │   ├── RtfParserListenerLogger.class

│   │   │   │   │   │   ├── RtfParserListenerStructureBuilder.class

│   │   │   │   │   │   ├── RtfParserLoggerSettings.class

│   │   │   │   │   │   ├── RtfSource.class

│   │   │   │   │   │   ├── TextReader$EOFError.class

│   │   │   │   │   │   ├── TextReader$Error.class

│   │   │   │   │   │   ├── TextReader$FormatError.class

│   │   │   │   │   │   └── TextReader.class

│   │   │   │   │   ├── parserTests

│   │   │   │   │   │   ├── DecodingBuffer.class

│   │   │   │   │   │   └── RtfParserDump.class

│   │   │   │   │   ├── RtfElementKind.class

│   │   │   │   │   ├── RtfElementVisitorOrder.class

│   │   │   │   │   ├── RtfException.class

│   │   │   │   │   ├── RtfFont.class

│   │   │   │   │   ├── RtfFontKind.class

│   │   │   │   │   ├── RtfFontPitch.class

│   │   │   │   │   ├── RtfInterpreterState.class

│   │   │   │   │   ├── RtfPropertyKind.class

│   │   │   │   │   ├── RtfSpec.class

│   │   │   │   │   ├── RtfTextAlignment.class

│   │   │   │   │   ├── RtfVisualBreakKind.class

│   │   │   │   │   ├── RtfVisualImageFormat.class

│   │   │   │   │   ├── RtfVisualKind.class

│   │   │   │   │   ├── RtfVisualSpecialCharKind.class

│   │   │   │   │   ├── support

│   │   │   │   │   │   ├── RtfElementVisitorBase.class

│   │   │   │   │   │   ├── RtfInterpreterTool.class

│   │   │   │   │   │   ├── RtfParserTool.class

│   │   │   │   │   │   └── RtfVisualVisitorBase.class

│   │   │   │   │   └── sys

│   │   │   │   │   ├── CompareTool.class

│   │   │   │   │   ├── HashTool.class

│   │   │   │   │   └── RtfTag.class

│   │   │   │   └── solutions

│   │   │   │   └── community

│   │   │   │   └── rtf2Raw

│   │   │   │   ├── Program.class

│   │   │   │   ├── TestFile.class

│   │   │   │   ├── TestTitle.class

│   │   │   │   └── TestWeb.class

│   │   │   └── resources

│   │   │   └── RtfInterpreterTest_10.rtf

│   │   ├── build.xml

│   │   ├── src

│   │   │   └── com

│   │   │   └── lietu

│   │   │   └── rtf

│   │   │   ├── converter

│   │   │   │   └── text

│   │   │   │   ├── RtfTextConverter.java

│   │   │   │   └── RtfTextConvertSettings.java

│   │   │   ├── extract

│   │   │   │   ├── RtfExtractor.java

│   │   │   │   ├── RTFReader.java

│   │   │   │   └── StopSet.java

│   │   │   ├── interpreter

│   │   │   │   ├── RtfColorTableBuilder.java

│   │   │   │   ├── RtfDocumentInfoBuilder.java

│   │   │   │   ├── RtfFontBuilder.java

│   │   │   │   ├── RtfFontTableBuilder.java

│   │   │   │   ├── RtfImageBuilder.java

│   │   │   │   ├── RtfInterpreterBase.java

│   │   │   │   ├── RtfInterpreterContext.java

│   │   │   │   ├── RtfInterpreter.java

│   │   │   │   ├── RtfInterpreterListenerBase.java

│   │   │   │   ├── RtfInterpreterListenerDocumentBuilder.java

│   │   │   │   ├── RtfInterpreterListenerFileLogger.java

│   │   │   │   ├── RtfInterpreterListenerLogger.java

│   │   │   │   ├── RtfInterpreterLoggerSettings.java

│   │   │   │   ├── RtfTextBuilder.java

│   │   │   │   ├── RtfTimestampBuilder.java

│   │   │   │   └── RtfUserPropertyBuilder.java

│   │   │   ├── IRtfColor.java

│   │   │   ├── IRtfDocumentInfo.java

│   │   │   ├── IRtfDocument.java

│   │   │   ├── IRtfDocumentProperty.java

│   │   │   ├── IRtfElement.java

│   │   │   ├── IRtfElementVisitor.java

│   │   │   ├── IRtfFont.java

│   │   │   ├── IRtfGroup.java

│   │   │   ├── IRtfInterpreterContext.java

│   │   │   ├── IRtfInterpreter.java

│   │   │   ├── IRtfInterpreterListener.java

│   │   │   ├── IRtfParser.java

│   │   │   ├── IRtfParserListener.java

│   │   │   ├── IRtfSource.java

│   │   │   ├── IRtfTag.java

│   │   │   ├── IRtfTextFormat.java

│   │   │   ├── IRtfText.java

│   │   │   ├── IRtfVisualBreak.java

│   │   │   ├── IRtfVisualImage.java

│   │   │   ├── IRtfVisual.java

│   │   │   ├── IRtfVisualSpecialChar.java

│   │   │   ├── IRtfVisualText.java

│   │   │   ├── IRtfVisualVisitor.java

│   │   │   ├── model

│   │   │   │   ├── RtfColor.java

│   │   │   │   ├── RtfDocumentInfo.java

│   │   │   │   ├── RtfDocument.java

│   │   │   │   ├── RtfDocumentProperty.java

│   │   │   │   ├── RtfElement.java

│   │   │   │   ├── RtfGroup.java

│   │   │   │   ├── RtfTextFormat.java

│   │   │   │   ├── RtfText.java

│   │   │   │   ├── RtfVisualBreak.java

│   │   │   │   ├── RtfVisualImage.java

│   │   │   │   ├── RtfVisual.java

│   │   │   │   ├── RtfVisualSpecialChar.java

│   │   │   │   └── RtfVisualText.java

│   │   │   ├── parser

│   │   │   │   ├── CodePage2Locale.java

│   │   │   │   ├── IntValue.java

│   │   │   │   ├── MemoryStream.java

│   │   │   │   ├── RtfParserBase.java

│   │   │   │   ├── RtfParser.java

│   │   │   │   ├── RtfParserListenerBase.java

│   │   │   │   ├── RtfParserListenerFileLogger.java

│   │   │   │   ├── RtfParserListenerLogger.java

│   │   │   │   ├── RtfParserListenerStructureBuilder.java

│   │   │   │   ├── RtfParserLoggerSettings.java

│   │   │   │   ├── RtfSource.java

│   │   │   │   └── TextReader.java

│   │   │   ├── RtfElementKind.java

│   │   │   ├── RtfElementVisitorOrder.java

│   │   │   ├── RtfException.java

│   │   │   ├── RtfFont.java

│   │   │   ├── RtfFontKind.java

│   │   │   ├── RtfFontPitch.java

│   │   │   ├── RtfInterpreterState.java

│   │   │   ├── RtfPropertyKind.java

│   │   │   ├── RtfSpec.java

│   │   │   ├── RtfTextAlignment.java

│   │   │   ├── RtfVisualBreakKind.java

│   │   │   ├── RtfVisualImageFormat.java

│   │   │   ├── RtfVisualKind.java

│   │   │   ├── RtfVisualSpecialCharKind.java

│   │   │   ├── support

│   │   │   │   ├── RtfElementVisitorBase.java

│   │   │   │   ├── RtfInterpreterTool.java

│   │   │   │   ├── RtfParserTool.java

│   │   │   │   └── RtfVisualVisitorBase.java

│   │   │   └── sys

│   │   │   ├── CompareTool.java

│   │   │   ├── HashTool.java

│   │   │   └── RtfTag.java

│   │   └── test

│   │   ├── com

│   │   │   └── lietu

│   │   │   ├── rtf

│   │   │   │   ├── interpreterTests

│   │   │   │   │   ├── RtfInterpreterTest.java

│   │   │   │   │   ├── TextReader.java

│   │   │   │   │   └── WriteDocumentModel.java

│   │   │   │   └── parserTests

│   │   │   │   ├── DecodingBuffer.java

│   │   │   │   └── RtfParserDump.java

│   │   │   └── solutions

│   │   │   └── community

│   │   │   └── rtf2Raw

│   │   │   ├── Program.java

│   │   │   ├── TestFile.java

│   │   │   ├── TestTitle.java

│   │   │   └── TestWeb.java

│   │   └── resources

│   │   └── RtfInterpreterTest_10.rtf

│   ├── readme.txt

│   ├── SearchChinesePdf

│   │   ├── bin

│   │   │   ├── com

│   │   │   │   └── lietu

│   │   │   │   └── pdfbox

│   │   │   │   ├── OperatorSet.class

│   │   │   │   ├── PDFTextStripper.class

│   │   │   │   ├── PdfTitle.class

│   │   │   │   ├── PdfTitleExtractor$FloatValue.class

│   │   │   │   ├── PdfTitleExtractor.class

│   │   │   │   └── TextPageDrawer.class

│   │   │   ├── src

│   │   │   │   ├── database.properties

│   │   │   │   └── spider.properties

│   │   │   └── test

│   │   │   └── com

│   │   │   └── lietu

│   │   │   ├── PDFTextLocations.class

│   │   │   ├── PDFTree.class

│   │   │   ├── PrintTextLocations.class

│   │   │   ├── Test.class

│   │   │   ├── TestContent.class

│   │   │   └── TestPDF.class

│   │   ├── PDFBox.log

│   │   ├── src

│   │   │   ├── com

│   │   │   │   └── lietu

│   │   │   │   └── pdfbox

│   │   │   │   ├── OperatorSet.java

│   │   │   │   ├── PDFTextStripper.java

│   │   │   │   ├── PdfTitleExtractor.java

│   │   │   │   ├── PdfTitle.java

│   │   │   │   └── TextPageDrawer.java

│   │   │   └── src

│   │   │   ├── database.properties

│   │   │   └── spider.properties

│   │   └── test

│   │   └── test

│   │   └── com

│   │   └── lietu

│   │   ├── PDFTextLocations.java

│   │   ├── PDFTree.java

│   │   ├── PrintTextLocations.java

│   │   ├── TestContent.java

│   │   ├── Test.java

│   │   └── TestPDF.java

│   └── SearchWord

│   ├── bin

│   │   ├── com

│   │   │   ├── bitmechanic

│   │   │   │   └── spindle

│   │   │   │   ├── AVLTreeS$Node.class

│   │   │   │   ├── AVLTreeS.class

│   │   │   │   ├── CircularStringBuffer.class

│   │   │   │   ├── ListDesc.class

│   │   │   │   ├── TextHtml$NumericSymbolicCode.class

│   │   │   │   ├── TextHtml.class

│   │   │   │   ├── TitleDetectQ.class

│   │   │   │   ├── XML.class

│   │   │   │   └── XmlElement.class

│   │   │   └── lietu

│   │   │   ├── filter

│   │   │   │   ├── ConvertIco24ToRGB.class

│   │   │   │   ├── ExcelReader$CellInfo.class

│   │   │   │   ├── ExcelReader$TitleInf.class

│   │   │   │   ├── ExcelReader.class

│   │   │   │   ├── PDFBox.class

│   │   │   │   ├── PowerPointReader.class

│   │   │   │   ├── WordReader$TitleInfo.class

│   │   │   │   └── WordReader.class

│   │   │   ├── imageSpider

│   │   │   │   └── ImageSpider.class

│   │   │   ├── keywords

│   │   │   │   ├── Bigrams.class

│   │   │   │   ├── BigramsContextCounts.class

│   │   │   │   ├── CnPhraseDic$Prefix.class

│   │   │   │   ├── CnPhraseDic$TSTNode.class

│   │   │   │   ├── CnPhraseDic.class

│   │   │   │   ├── CnTagMaker.class

│   │   │   │   ├── KeyWord.class

│   │   │   │   ├── PairingHeap$PairNode.class

│   │   │   │   ├── PairingHeap.class

│   │   │   │   ├── StopSet.class

│   │   │   │   ├── WordContext.class

│   │   │   │   └── WordWeight.class

│   │   │   └── webCat

│   │   │   ├── URLCassify.class

│   │   │   ├── URLPattern$Prefix.class

│   │   │   ├── URLPattern$PrefixRet.class

│   │   │   ├── URLPattern$TSTItem.class

│   │   │   ├── URLPattern$TSTNode.class

│   │   │   └── URLPattern.class

│   │   ├── database.properties

│   │   ├── spider.properties

│   │   └── test

│   │   └── com

│   │   └── lietu

│   │   └── filter

│   │   ├── getSpiderData.class

│   │   ├── Test.class

│   │   ├── TestContent.class

│   │   ├── TestgetData.class

│   │   ├── TestgetXml.class

│   │   └── TestWordReader.class

│   ├── build.xml

│   ├── config

│   │   ├── spider56cn2.xml

│   │   ├── spider56cn.xml

│   │   ├── spiderABB.xml

│   │   ├── spiderbjedu.txt

│   │   ├── spiderbook.xml

│   │   ├── spiderfengguang.xml

│   │   ├── spiderGE.xml

│   │   ├── spidergkong.xml

│   │   ├── spiderhnlgplc.xml

│   │   ├── spiderlog.xml

│   │   ├── spidervertinfo.xml

│   │   ├── spider.xml

│   │   └── spider.xml.bak

│   ├── database.properties

│   ├── dic

│   │   ├── BaseDic.txt

│   │   ├── BigramDict.txt

│   │   ├── bonus.txt

│   │   ├── ChineseMap.txt

│   │   ├── common-misspells.txt

│   │   ├── connect.txt

│   │   ├── coreDict.txt

│   │   ├── english.txt

│   │   ├── hanziPinyin.txt

│   │   ├── lexical.ctx.txt

│   │   ├── nr.ctx.txt

│   │   ├── nrTone.txt

│   │   ├── nr.txt

│   │   ├── ns.ctx.txt

│   │   ├── ns.txt

│   │   ├── nz.ctx.txt

│   │   ├── nz.txt

│   │   ├── phrase.txt

│   │   ├── Simp2TradPOS.txt

│   │   ├── Simp2Trad.txt

│   │   ├── stigma.txt

│   │   ├── stopword.txt

│   │   ├── tr.ctx.txt

│   │   └── tr.txt

│   ├── MANIFEST.MF

│   ├── mysqldb.properties

│   ├── spider.properties

│   ├── src

│   │   ├── com

│   │   │   ├── bitmechanic

│   │   │   │   └── spindle

│   │   │   │   ├── AVLTreeS.java

│   │   │   │   ├── CircularStringBuffer.java

│   │   │   │   ├── ListDesc.java

│   │   │   │   ├── TextHtml.java

│   │   │   │   ├── TitleDetectQ.java

│   │   │   │   ├── XmlElement.java

│   │   │   │   └── XML.java

│   │   │   └── lietu

│   │   │   ├── filter

│   │   │   │   ├── ConvertIco24ToRGB.java

│   │   │   │   ├── ExcelReader.java

│   │   │   │   ├── PDFBox.java

│   │   │   │   ├── PowerPointReader.java

│   │   │   │   └── WordReader.java

│   │   │   ├── imageSpider

│   │   │   │   └── ImageSpider.java

│   │   │   ├── keywords

│   │   │   │   ├── BigramsContextCounts.java

│   │   │   │   ├── Bigrams.java

│   │   │   │   ├── CnPhraseDic.java

│   │   │   │   ├── CnTagMaker.java

│   │   │   │   ├── KeyWord.java

│   │   │   │   ├── PairingHeap.java

│   │   │   │   ├── StopSet.java

│   │   │   │   └── WordWeight.java

│   │   │   └── webCat

│   │   │   ├── URLCassify.java

│   │   │   └── URLPattern.java

│   │   ├── database.properties

│   │   └── spider.properties

│   └── test

│   └── test

│   └── com

│   └── lietu

│   └── filter

│   ├── getSpiderData.java

│   ├── TestContent.java

│   ├── TestgetData.java

│   ├── TestgetXml.java

│   ├── Test.java

│   └── TestWordReader.java

├── Char04

│   ├── AddressSeg

│   │   ├── bin

│   │   │   ├── com

│   │   │   │   └── lietu

│   │   │   │   └── address

│   │   │   │   ├── AddressSpan.class

│   │   │   │   ├── AddressTagger.class

│   │   │   │   ├── AddressToken.class

│   │   │   │   ├── AddressTokenLinkedList$LinkIterator.class

│   │   │   │   ├── AddressTokenLinkedList$Node.class

│   │   │   │   ├── AddressTokenLinkedList.class

│   │   │   │   ├── AddressType.class

│   │   │   │   ├── AddTokenInf.class

│   │   │   │   ├── AddTokenizer.class

│   │   │   │   ├── AddTypes$AddressTypeInf.class

│   │   │   │   ├── AddTypes$LinkIterator.class

│   │   │   │   ├── AddTypes$Node.class

│   │   │   │   ├── AddTypes.class

│   │   │   │   ├── AdjList.class

│   │   │   │   ├── ContextStatAddress.class

│   │   │   │   ├── DicAddress$MatchRet.class

│   │   │   │   ├── DicAddress$TSTNode.class

│   │   │   │   ├── DicAddress.class

│   │   │   │   ├── NGramTokenFilter.class

│   │   │   │   ├── package.html

│   │   │   │   ├── Production.class

│   │   │   │   ├── UnknowGrammar$MatchRet.class

│   │   │   │   ├── UnknowGrammar$Prefix.class

│   │   │   │   ├── UnknowGrammar$TSTNode.class

│   │   │   │   └── UnknowGrammar.class

│   │   │   └── test

│   │   │   └── com

│   │   │   └── lietu

│   │   │   └── address

│   │   │   ├── AddressAnalyzer.class

│   │   │   ├── TestAddAnalyzer.class

│   │   │   └── TestAddressTagger.class

│   │   ├── build.xml

│   │   ├── dic

│   │   │   ├── city.txt

│   │   │   ├── country.txt

│   │   │   ├── county.txt

│   │   │   ├── district.txt

│   │   │   ├── Feature.txt

│   │   │   ├── function.txt

│   │   │   ├── KeyWord.txt

│   │   │   ├── landmark.txt

│   │   │   ├── province.txt

│   │   │   ├── relatedPos.txt

│   │   │   ├── street.txt

│   │   │   ├── SuffixBuildingUnit.txt

│   │   │   ├── SuffixDistrict.txt

│   │   │   ├── SuffixLandMark.txt

│   │   │   ├── town.txt

│   │   │   └── village.txt

│   │   ├── src

│   │   │   └── com

│   │   │   └── lietu

│   │   │   └── address

│   │   │   ├── AddressSpan.java

│   │   │   ├── AddressTagger.java

│   │   │   ├── AddressToken.java

│   │   │   ├── AddressTokenLinkedList.java

│   │   │   ├── AddressType.java

│   │   │   ├── AddTokenInf.java

│   │   │   ├── AddTokenizer.java

│   │   │   ├── AddTypes.java

│   │   │   ├── AdjList.java

│   │   │   ├── ContextStatAddress.java

│   │   │   ├── DicAddress.java

│   │   │   ├── NGramTokenFilter.java

│   │   │   ├── package.html

│   │   │   ├── Production.java

│   │   │   └── UnknowGrammar.java

│   │   └── test

│   │   └── test

│   │   └── com

│   │   └── lietu

│   │   └── address

│   │   ├── AddressAnalyzer.java

│   │   ├── TestAddAnalyzer.java

│   │   └── TestAddressTagger.java

│   ├── CompanySeg

│   │   ├── bin

│   │   │   ├── com

│   │   │   │   └── lietu

│   │   │   │   └── company

│   │   │   │   ├── AdjList.class

│   │   │   │   ├── ComFilter.class

│   │   │   │   ├── Company.class

│   │   │   │   ├── CompanyTagger.class

│   │   │   │   ├── CompanyToken.class

│   │   │   │   ├── CompanyTokenInf.class

│   │   │   │   ├── CompanyType.class

│   │   │   │   ├── CompanyTypeInf.class

│   │   │   │   ├── CompanyTypes$LinkIterator.class

│   │   │   │   ├── CompanyTypes$Node.class

│   │   │   │   ├── CompanyTypes.class

│   │   │   │   ├── ComTokenizer.class

│   │   │   │   ├── DicCompany$MatchRet.class

│   │   │   │   ├── DicCompany$TSTNode.class

│   │   │   │   ├── DicCompany.class

│   │   │   │   ├── DicTypes$LinkIterator.class

│   │   │   │   ├── DicTypes$Node.class

│   │   │   │   ├── DicTypes$PoiTypeInf.class

│   │   │   │   ├── DicTypes.class

│   │   │   │   ├── Production.class

│   │   │   │   ├── Span.class

│   │   │   │   ├── TokenLinkedList$LinkIterator.class

│   │   │   │   ├── TokenLinkedList$Node.class

│   │   │   │   ├── TokenLinkedList.class

│   │   │   │   ├── TransProb.class

│   │   │   │   ├── UnknowGrammar$MatchRet.class

│   │   │   │   ├── UnknowGrammar$Prefix.class

│   │   │   │   ├── UnknowGrammar$TSTNode.class

│   │   │   │   └── UnknowGrammar.class

│   │   │   └── test

│   │   │   └── com

│   │   │   └── lietu

│   │   │   └── company

│   │   │   ├── CompanyAnalyzer.class

│   │   │   ├── TestCompany$1.class

│   │   │   ├── TestCompany.class

│   │   │   └── TestCompanyTagger.class

│   │   ├── build.xml

│   │   ├── dic

│   │   │   ├── city.txt

│   │   │   ├── country.txt

│   │   │   ├── county.txt

│   │   │   ├── feature.txt

│   │   │   ├── function.txt

│   │   │   ├── keyword.txt

│   │   │   ├── province.txt

│   │   │   ├── suffixDistrict.txt

│   │   │   ├── town.txt

│   │   │   └── village.txt

│   │   ├── src

│   │   │   └── com

│   │   │   └── lietu

│   │   │   └── company

│   │   │   ├── AdjList.java

│   │   │   ├── ComFilter.java

│   │   │   ├── Company.java

│   │   │   ├── CompanyTagger.java

│   │   │   ├── CompanyTokenInf.java

│   │   │   ├── CompanyToken.java

│   │   │   ├── CompanyTypeInf.java

│   │   │   ├── CompanyType.java

│   │   │   ├── CompanyTypes.java

│   │   │   ├── ComTokenizer.java

│   │   │   ├── DicCompany.java

│   │   │   ├── DicTypes.java

│   │   │   ├── Production.java

│   │   │   ├── Span.java

│   │   │   ├── TokenLinkedList.java

│   │   │   ├── TransProb.java

│   │   │   └── UnknowGrammar.java

│   │   └── test

│   │   └── test

│   │   └── com

│   │   └── lietu

│   │   └── company

│   │   ├── CompanyAnalyzer.java

│   │   ├── TestCompany.java

│   │   └── TestCompanyTagger.java

│   ├── nlp

│   │   ├── bin

│   │   │   ├── fmseg

│   │   │   │   ├── TernarySearchTrie$TSTNode.class

│   │   │   │   ├── TernarySearchTrie.class

│   │   │   │   ├── Word.class

│   │   │   │   └── WordType.class

│   │   │   ├── fmseg1

│   │   │   │   ├── TernarySearchTrie$TSTNode.class

│   │   │   │   └── TernarySearchTrie.class

│   │   │   ├── nvgram

│   │   │   │   ├── TernarySearchTrie$StackValue.class

│   │   │   │   ├── TernarySearchTrie$TrieIterator.class

│   │   │   │   ├── TernarySearchTrie$TSTNode.class

│   │   │   │   ├── TernarySearchTrie.class

│   │   │   │   └── WordEntry.class

│   │   │   ├── probSeg

│   │   │   │   ├── AdjList.class

│   │   │   │   ├── CalcProb.class

│   │   │   │   ├── CnToken.class

│   │   │   │   ├── CnTokenLinkedList$LinkIterator.class

│   │   │   │   ├── CnTokenLinkedList$Node.class

│   │   │   │   ├── CnTokenLinkedList.class

│   │   │   │   ├── Segmenter.class

│   │   │   │   ├── TernarySearchTrie$PrefixRet.class

│   │   │   │   ├── TernarySearchTrie$TSTNode.class

│   │   │   │   ├── TernarySearchTrie.class

│   │   │   │   ├── TestSeg.class

│   │   │   │   ├── TestSegResult.class

│   │   │   │   ├── TestTokenList.class

│   │   │   │   └── WordType.class

│   │   │   ├── seg

│   │   │   │   ├── FindPath.class

│   │   │   │   ├── Segmenter.class

│   │   │   │   ├── SuffixTrie$SuffixRet.class

│   │   │   │   ├── SuffixTrie$TSTNode.class

│   │   │   │   ├── SuffixTrie.class

│   │   │   │   └── WordType.class

│   │   │   └── templateSeg

│   │   │   ├── AdjList$AdjIterator.class

│   │   │   ├── AdjList.class

│   │   │   ├── CnToken.class

│   │   │   ├── CnTokenLinkedList$LinkIterator.class

│   │   │   ├── CnTokenLinkedList$Node.class

│   │   │   ├── CnTokenLinkedList.class

│   │   │   ├── DicDBFactory.class

│   │   │   ├── DicFactory.class

│   │   │   ├── DocTypes$DocTypeInf.class

│   │   │   ├── DocTypes$LinkIterator.class

│   │   │   ├── DocTypes$Node.class

│   │   │   ├── DocTypes.class

│   │   │   ├── GraphMatcher$MatchValue.class

│   │   │   ├── GraphMatcher$NextInput.class

│   │   │   ├── GraphMatcher$StatePair.class

│   │   │   ├── GraphMatcher.class

│   │   │   ├── NodeType.class

│   │   │   ├── PartOfSpeech.class

│   │   │   ├── RightParser.class

│   │   │   ├── Rule.class

│   │   │   ├── RuleSegmenter.class

│   │   │   ├── TernarySearchTrie$PrefixRet.class

│   │   │   ├── TernarySearchTrie$TSTNode.class

│   │   │   ├── TernarySearchTrie.class

│   │   │   ├── TestDicDBFactory.class

│   │   │   ├── TestRule.class

│   │   │   ├── TestRuleSegmenter.class

│   │   │   ├── TestTST.class

│   │   │   ├── Trie.class

│   │   │   ├── TrieNode.class

│   │   │   └── WordEntry.class

│   │   ├── dic

│   │   │   └── words.db

│   │   ├── SDIC.txt

│   │   └── src

│   │   ├── fmseg

│   │   │   ├── TernarySearchTrie.java

│   │   │   ├── Word.java

│   │   │   └── WordType.java

│   │   ├── fmseg1

│   │   │   └── TernarySearchTrie.java

│   │   ├── nvgram

│   │   │   ├── TernarySearchTrie.java

│   │   │   └── WordEntry.java

│   │   ├── probSeg

│   │   │   ├── AdjList.class

│   │   │   ├── AdjList.java

│   │   │   ├── CalcProb.class

│   │   │   ├── CalcProb.java

│   │   │   ├── CnToken.class

│   │   │   ├── CnToken.java

│   │   │   ├── CnTokenLinkedList$LinkIterator.class

│   │   │   ├── CnTokenLinkedList$Node.class

│   │   │   ├── CnTokenLinkedList.class

│   │   │   ├── CnTokenLinkedList.java

│   │   │   ├── Segmenter.class

│   │   │   ├── Segmenter.java

│   │   │   ├── TernarySearchTrie$PrefixRet.class

│   │   │   ├── TernarySearchTrie$TSTNode.class

│   │   │   ├── TernarySearchTrie.class

│   │   │   ├── TernarySearchTrie.java

│   │   │   ├── TestSeg.java

│   │   │   ├── TestSegResult.class

│   │   │   ├── TestSegResult.java

│   │   │   ├── TestTokenList.class

│   │   │   ├── TestTokenList.java

│   │   │   ├── WordType.class

│   │   │   └── WordType.java

│   │   ├── seg

│   │   │   ├── FindPath.java

│   │   │   ├── Segmenter.java

│   │   │   ├── SuffixTrie.java

│   │   │   └── WordType.java

│   │   └── templateSeg

│   │   ├── AdjList.java

│   │   ├── CnToken.java

│   │   ├── CnTokenLinkedList.java

│   │   ├── DicDBFactory.java

│   │   ├── DicFactory.java

│   │   ├── DocTypes.java

│   │   ├── GraphMatcher.java

│   │   ├── NodeType.java

│   │   ├── PartOfSpeech.java

│   │   ├── RightParser.java

│   │   ├── Rule.java

│   │   ├── RuleSegmenter.java

│   │   ├── TernarySearchTrie.java

│   │   ├── TestDicDBFactory.java

│   │   ├── TestRule.java

│   │   ├── TestRuleSegmenter.java

│   │   ├── TestTST.java

│   │   ├── Trie.java

│   │   ├── TrieNode.java

│   │   └── WordEntry.java

│   ├── readme.txt

│   └── seg

│   ├── dic

│   │   ├── baseWords.txt

│   │   ├── coreDict.txt

│   │   ├── ontology.txt

│   │   ├── WordList.bin

│   │   └── WordList.txt

│   ├── pom.xml

│   ├── src

│   │   ├── main

│   │   │   └── java

│   │   │   └── org

│   │   │   └── lxd

│   │   │   └── chinese

│   │   │   └── seg

│   │   │   ├── AdjList.java

│   │   │   ├── App.java

│   │   │   ├── CnToken.java

│   │   │   ├── CnTokenLinkedList.java

│   │   │   ├── Constant.java

│   │   │   ├── DBUtil.java

│   │   │   ├── DicDBFactory.java

│   │   │   ├── DicFactory.java

│   │   │   ├── DicFileFactory.java

│   │   │   ├── PartOfSpeech.java

│   │   │   ├── POSTransFreq.txt

│   │   │   ├── Segmenter.java

│   │   │   ├── Tagger.java

│   │   │   ├── TernarySearchTrie.java

│   │   │   ├── WordEntry.java

│   │   │   ├── WordTokenInf.java

│   │   │   ├── WordToken.java

│   │   │   └── WordTypes.java

│   │   └── test

│   │   └── java

│   │   └── org

│   │   └── lxd

│   │   └── chinese

│   │   └── seg

│   │   ├── AppTest.java

│   │   ├── TestAdjList.java

│   │   ├── TestSegmenter.java

│   │   └── TestTagger.java

│   └── target

│   ├── classes

│   │   ├── META-INF

│   │   │   ├── MANIFEST.MF

│   │   │   └── maven

│   │   │   └── org.lxd

│   │   │   └── chinese.seg

│   │   │   ├── pom.properties

│   │   │   └── pom.xml

│   │   └── org

│   │   └── lxd

│   │   └── chinese

│   │   └── seg

│   │   ├── AdjList$AdjIterator.class

│   │   ├── AdjList.class

│   │   ├── App.class

│   │   ├── CnToken.class

│   │   ├── CnTokenLinkedList$LinkIterator.class

│   │   ├── CnTokenLinkedList$Node.class

│   │   ├── CnTokenLinkedList.class

│   │   ├── Constant.class

│   │   ├── DBUtil.class

│   │   ├── DicDBFactory.class

│   │   ├── DicFactory.class

│   │   ├── DicFileFactory.class

│   │   ├── PartOfSpeech.class

│   │   ├── POSTransFreq.txt

│   │   ├── Segmenter.class

│   │   ├── Tagger.class

│   │   ├── TernarySearchTrie$PrefixRet.class

│   │   ├── TernarySearchTrie$TSTNode.class

│   │   ├── TernarySearchTrie.class

│   │   ├── WordEntry.class

│   │   ├── WordToken.class

│   │   ├── WordTokenInf.class

│   │   └── WordTypes.class

│   └── test-classes

│   └── org

│   └── lxd

│   └── chinese

│   └── seg

│   ├── AppTest.class

│   ├── TestAdjList.class

│   ├── TestSegmenter.class

│   └── TestTagger.class

├── Char07

│   ├── basic

│   │   ├── DirSpider.java

│   │   └── IndexMerge.java

│   └── readme.txt

├── Char08

│   ├── readme.txt

│   └── SolrJTest

│   ├── bin

│   │   ├── SearchServer.class

│   │   └── TestSearchHighlighter.class

│   └── src

│   ├── SearchServer.java

│   └── TestSearchHighlighter.java

├── Char09

│   ├── data

│   │   ├── 名称、地址拆分数据.mdb

│   │   ├── 名称拆分.xls

│   │   ├── 地址拆分.xls

│   │   ├── 抽样数据.xls

│   │   └── 测试样例.xls

│   ├── POIExtract

│   │   ├── bin

│   │   │   ├── com

│   │   │   │   ├── ibm

│   │   │   │   │   └── compbio

│   │   │   │   │   ├── Cell.class

│   │   │   │   │   ├── DynamicProgramming.class

│   │   │   │   │   ├── package.html

│   │   │   │   │   └── sequence

│   │   │   │   │   └── LongestCommonSubsequence.class

│   │   │   │   ├── lietu

│   │   │   │   │   ├── address

│   │   │   │   │   │   ├── AddDicData$LinkIterator.class

│   │   │   │   │   │   ├── AddDicData$Node.class

│   │   │   │   │   │   ├── AddDicData.class

│   │   │   │   │   │   ├── AddDicTypes$AddTypeInf.class

│   │   │   │   │   │   ├── AddDicTypes$LinkIterator.class

│   │   │   │   │   │   ├── AddDicTypes$Node.class

│   │   │   │   │   │   ├── AddDicTypes.class

│   │   │   │   │   │   ├── Address.class

│   │   │   │   │   │   ├── AddressSpan.class

│   │   │   │   │   │   ├── AddressTagger.class

│   │   │   │   │   │   ├── AddressToken.class

│   │   │   │   │   │   ├── AddressTokenInf.class

│   │   │   │   │   │   ├── AddressTokenLinkedList$LinkIterator.class

│   │   │   │   │   │   ├── AddressTokenLinkedList$Node.class

│   │   │   │   │   │   ├── AddressTokenLinkedList.class

│   │   │   │   │   │   ├── AddressTokenWeight.class

│   │   │   │   │   │   ├── AddressType.class

│   │   │   │   │   │   ├── AddTokenizer.class

│   │   │   │   │   │   ├── AddTypeInf.class

│   │   │   │   │   │   ├── AddTypes$LinkIterator.class

│   │   │   │   │   │   ├── AddTypes$Node.class

│   │   │   │   │   │   ├── AddTypes.class

│   │   │   │   │   │   ├── AdjList.class

│   │   │   │   │   │   ├── AVLTree$Node.class

│   │   │   │   │   │   ├── AVLTree.class

│   │   │   │   │   │   ├── ContextStatAddress.class

│   │   │   │   │   │   ├── DicAddress$MatchRet.class

│   │   │   │   │   │   ├── DicAddress$Prefix.class

│   │   │   │   │   │   ├── DicAddress$TSTNode.class

│   │   │   │   │   │   ├── DicAddress.class

│   │   │   │   │   │   ├── DicSuffix$MatchRet.class

│   │   │   │   │   │   ├── DicSuffix$Prefix.class

│   │   │   │   │   │   ├── DicSuffix$TSTNode.class

│   │   │   │   │   │   ├── DicSuffix.class

│   │   │   │   │   │   ├── LRS.class

│   │   │   │   │   │   ├── package.html

│   │   │   │   │   │   ├── Production.class

│   │   │   │   │   │   ├── UnknowAddress.class

│   │   │   │   │   │   ├── UnknowGrammar$MatchRet.class

│   │   │   │   │   │   ├── UnknowGrammar$Prefix.class

│   │   │   │   │   │   ├── UnknowGrammar$TSTNode.class

│   │   │   │   │   │   └── UnknowGrammar.class

│   │   │   │   │   ├── data

│   │   │   │   │   │   ├── AccessManager.class

│   │   │   │   │   │   └── package.html

│   │   │   │   │   ├── exchange

│   │   │   │   │   │   └── StreetToArea.class

│   │   │   │   │   ├── hmm

│   │   │   │   │   │   ├── AddDicTypes$AddTypeInf.class

│   │   │   │   │   │   ├── AddDicTypes$LinkIterator.class

│   │   │   │   │   │   ├── AddDicTypes$Node.class

│   │   │   │   │   │   ├── AddDicTypes.class

│   │   │   │   │   │   ├── AddrTagger.class

│   │   │   │   │   │   ├── AdressReliability.class

│   │   │   │   │   │   ├── DicAddress$MatchRet.class

│   │   │   │   │   │   ├── DicAddress$Prefix.class

│   │   │   │   │   │   ├── DicAddress$TSTNode.class

│   │   │   │   │   │   ├── DicAddress.class

│   │   │   │   │   │   ├── GetAddressEmit.class

│   │   │   │   │   │   ├── NameReliability.class

│   │   │   │   │   │   ├── Node.class

│   │   │   │   │   │   ├── package.html

│   │   │   │   │   │   ├── State.class

│   │   │   │   │   │   ├── StateTable.class

│   │   │   │   │   │   ├── Symbol.class

│   │   │   │   │   │   └── SymbolTable.class

│   │   │   │   │   ├── orgs

│   │   │   │   │   │   ├── AdjList.class

│   │   │   │   │   │   ├── ContextStatPoi.class

│   │   │   │   │   │   ├── DicPois$MatchRet.class

│   │   │   │   │   │   ├── DicPois$TSTNode.class

│   │   │   │   │   │   ├── DicPois.class

│   │   │   │   │   │   ├── PoiDicTypes$LinkIterator.class

│   │   │   │   │   │   ├── PoiDicTypes$Node.class

│   │   │   │   │   │   ├── PoiDicTypes$PoiTypeInf.class

│   │   │   │   │   │   ├── PoiDicTypes.class

│   │   │   │   │   │   ├── PoiSpan.class

│   │   │   │   │   │   ├── PoiTagger.class

│   │   │   │   │   │   ├── PoiToken.class

│   │   │   │   │   │   ├── PoiTokenInf.class

│   │   │   │   │   │   ├── PoiTokenLinkedList$LinkIterator.class

│   │   │   │   │   │   ├── PoiTokenLinkedList$Node.class

│   │   │   │   │   │   ├── PoiTokenLinkedList.class

│   │   │   │   │   │   ├── PoiTokenWeight.class

│   │   │   │   │   │   ├── PoiType.class

│   │   │   │   │   │   ├── PoiTypeInf.class

│   │   │   │   │   │   ├── PoiTypes$LinkIterator.class

│   │   │   │   │   │   ├── PoiTypes$Node.class

│   │   │   │   │   │   ├── PoiTypes.class

│   │   │   │   │   │   ├── Production.class

│   │   │   │   │   │   ├── UnknowKeyword.class

│   │   │   │   │   │   └── UnknowPoi.class

│   │   │   │   │   ├── poi

│   │   │   │   │   │   ├── AVLTree$Node.class

│   │   │   │   │   │   ├── AVLTree.class

│   │   │   │   │   │   ├── FunctionSet.class

│   │   │   │   │   │   ├── package.html

│   │   │   │   │   │   ├── POI.class

│   │   │   │   │   │   ├── UnknowGrammarPoi$MatchRet.class

│   │   │   │   │   │   ├── UnknowGrammarPoi$Prefix.class

│   │   │   │   │   │   ├── UnknowGrammarPoi$TSTNode.class

│   │   │   │   │   │   └── UnknowGrammarPoi.class

│   │   │   │   │   ├── simhash

│   │   │   │   │   │   ├── BitUtil.class

│   │   │   │   │   │   ├── CombinationGenerator.class

│   │   │   │   │   │   ├── CopyOfSimHashData1.class

│   │   │   │   │   │   ├── GeneralHashFunctionLibrary.class

│   │   │   │   │   │   ├── Hash.class

│   │   │   │   │   │   ├── JenkinsHash.class

│   │   │   │   │   │   ├── MD5.class

│   │   │   │   │   │   ├── MurmurHash.class

│   │   │   │   │   │   ├── MyObjectOutputStream.class

│   │   │   │   │   │   ├── package.html

│   │   │   │   │   │   ├── POISimHash.class

│   │   │   │   │   │   ├── SimHashData1.class

│   │   │   │   │   │   ├── SimHashData.class

│   │   │   │   │   │   ├── SimHashSet$1.class

│   │   │   │   │   │   ├── SimHashSet4$1.class

│   │   │   │   │   │   ├── SimHashSet4$2.class

│   │   │   │   │   │   ├── SimHashSet4.class

│   │   │   │   │   │   ├── SimHashSet.class

│   │   │   │   │   │   ├── Span.class

│   │   │   │   │   │   ├── SynonymsMap.class

│   │   │   │   │   │   ├── TestBitUtil.class

│   │   │   │   │   │   ├── TestCombination.class

│   │   │   │   │   │   ├── TestJenkinsHash$TestData.class

│   │   │   │   │   │   ├── TestJenkinsHash.class

│   │   │   │   │   │   ├── TestMurmurHash.class

│   │   │   │   │   │   ├── TestPOICharSim.class

│   │   │   │   │   │   ├── TestPOIHash.class

│   │   │   │   │   │   ├── TestPOISimHashStructure.class

│   │   │   │   │   │   ├── TestPOIStructure.class

│   │   │   │   │   │   ├── TestSimHash4.class

│   │   │   │   │   │   ├── TestSimHashOther$1.class

│   │   │   │   │   │   ├── TestSimHashOther.class

│   │   │   │   │   │   ├── TestSimHashSet.class

│   │   │   │   │   │   ├── TestTextSimHash.class

│   │   │   │   │   │   ├── TextSimHash$1.class

│   │   │   │   │   │   ├── TextSimHash$1MyMap.class

│   │   │   │   │   │   └── TextSimHash.class

│   │   │   │   │   ├── similarity

│   │   │   │   │   │   ├── AddressRelations.class

│   │   │   │   │   │   ├── AddressSimilar.class

│   │   │   │   │   │   ├── AddrSimilar.class

│   │   │   │   │   │   ├── CharSim.class

│   │   │   │   │   │   ├── DicAddress$MatchRet.class

│   │   │   │   │   │   ├── DicAddress$Prefix.class

│   │   │   │   │   │   ├── DicAddress$TSTNode.class

│   │   │   │   │   │   ├── DicAddress.class

│   │   │   │   │   │   ├── Distance.class

│   │   │   │   │   │   ├── package.html

│   │   │   │   │   │   ├── Record.class

│   │   │   │   │   │   ├── RecordSim.class

│   │   │   │   │   │   └── SmallAddressSim.class

│   │   │   │   │   ├── tbl

│   │   │   │   │   │   └── Tbl.class

│   │   │   │   │   ├── tel

│   │   │   │   │   │   ├── DicTel$MatchRet.class

│   │   │   │   │   │   ├── DicTel$TrieNode.class

│   │   │   │   │   │   ├── DicTel.class

│   │   │   │   │   │   ├── package.html

│   │   │   │   │   │   ├── TelNumber.class

│   │   │   │   │   │   └── TelSeg.class

│   │   │   │   │   ├── text

│   │   │   │   │   │   ├── AddressSynonym.class

│   │   │   │   │   │   ├── AdjListDoc.class

│   │   │   │   │   │   ├── BodyType.class

│   │   │   │   │   │   ├── CityRelevance.class

│   │   │   │   │   │   ├── ContextStatDoc.class

│   │   │   │   │   │   ├── DicDoc$MatchRet.class

│   │   │   │   │   │   ├── DicDoc$TSTNode.class

│   │   │   │   │   │   ├── DicDoc.class

│   │   │   │   │   │   ├── Doc.class

│   │   │   │   │   │   ├── DocDicTypes$LinkIterator.class

│   │   │   │   │   │   ├── DocDicTypes$Node.class

│   │   │   │   │   │   ├── DocDicTypes$PoiTypeInf1.class

│   │   │   │   │   │   ├── DocDicTypes.class

│   │   │   │   │   │   ├── DocFactory$PlaceAndCode.class

│   │   │   │   │   │   ├── DocFactory.class

│   │   │   │   │   │   ├── DocSimHash.class

│   │   │   │   │   │   ├── DocSpan.class

│   │   │   │   │   │   ├── DocTagger.class

│   │   │   │   │   │   ├── DocToken.class

│   │   │   │   │   │   ├── DocTokenInf.class

│   │   │   │   │   │   ├── DocTokenLinkedList$LinkIterator.class

│   │   │   │   │   │   ├── DocTokenLinkedList$Node.class

│   │   │   │   │   │   ├── DocTokenLinkedList.class

│   │   │   │   │   │   ├── DocType.class

│   │   │   │   │   │   ├── DocTypeInf.class

│   │   │   │   │   │   ├── DocTypes$LinkIterator.class

│   │   │   │   │   │   ├── DocTypes$Node.class

│   │   │   │   │   │   ├── DocTypes.class

│   │   │   │   │   │   ├── MatterSynonym.class

│   │   │   │   │   │   ├── MatterType.class

│   │   │   │   │   │   ├── package.html

│   │   │   │   │   │   ├── Synonym.class

│   │   │   │   │   │   ├── SynonymDic$Prefix.class

│   │   │   │   │   │   ├── SynonymDic$PrefixRet.class

│   │   │   │   │   │   ├── SynonymDic$TSTItem.class

│   │   │   │   │   │   ├── SynonymDic$TSTNode.class

│   │   │   │   │   │   ├── SynonymDic.class

│   │   │   │   │   │   ├── SynonymReplace.class

│   │   │   │   │   │   ├── UnknowDoc.class

│   │   │   │   │   │   ├── UnknowGrammarDoc$MatchRet.class

│   │   │   │   │   │   ├── UnknowGrammarDoc$TSTNode.class

│   │   │   │   │   │   ├── UnknowGrammarDoc.class

│   │   │   │   │   │   └── UnknowKeyword.class

│   │   │   │   │   ├── textSim

│   │   │   │   │   │   ├── ComputeSim.class

│   │   │   │   │   │   ├── Document.class

│   │   │   │   │   │   ├── package.html

│   │   │   │   │   │   ├── StopSet.class

│   │   │   │   │   │   └── VectorUtils.class

│   │   │   │   │   ├── unstructured

│   │   │   │   │   │   ├── DateMatcher.class

│   │   │   │   │   │   ├── DicEnd$TSTNode.class

│   │   │   │   │   │   ├── DicEnd.class

│   │   │   │   │   │   ├── DicSentenceEnd$MatchRet.class

│   │   │   │   │   │   ├── DicSentenceEnd$TSTNode.class

│   │   │   │   │   │   ├── DicSentenceEnd.class

│   │   │   │   │   │   ├── DocSplit.class

│   │   │   │   │   │   ├── FSM.class

│   │   │   │   │   │   ├── Guard.class

│   │   │   │   │   │   ├── InputEvent.class

│   │   │   │   │   │   ├── MatchType.class

│   │   │   │   │   │   ├── News.class

│   │   │   │   │   │   ├── package.html

│   │   │   │   │   │   ├── Similar.class

│   │   │   │   │   │   ├── State.class

│   │   │   │   │   │   ├── TestBody.class

│   │   │   │   │   │   ├── TestData.class

│   │   │   │   │   │   ├── TestDocFactory.class

│   │   │   │   │   │   ├── TestExtract.class

│   │   │   │   │   │   ├── TestGetTime.class

│   │   │   │   │   │   ├── TestHashCode.class

│   │   │   │   │   │   ├── TestMatterSynonym.class

│   │   │   │   │   │   ├── TestSimilarity.class

│   │   │   │   │   │   ├── TestSuffixStreet.class

│   │   │   │   │   │   ├── TestSynonymReplace.class

│   │   │   │   │   │   ├── TestTagger.class

│   │   │   │   │   │   ├── TestUnstructuredData.class

│   │   │   │   │   │   └── Transition.class

│   │   │   │   │   └── util

│   │   │   │   │   └── DataBaseUtil.class

│   │   │   │   └── liqiang

│   │   │   │   └── hamming

│   │   │   │   ├── ByteUtil.class

│   │   │   │   ├── ByteUtil.java.bak

│   │   │   │   ├── DictDoc$Node.class

│   │   │   │   ├── DictDoc.class

│   │   │   │   ├── FileUtil.class

│   │   │   │   ├── FileUtil.java.bak

│   │   │   │   ├── HammingDistance.class

│   │   │   │   ├── HammingDistance.java.bak

│   │   │   │   ├── Search.class

│   │   │   │   ├── Search.java.bak

│   │   │   │   ├── SimplestSearch.class

│   │   │   │   ├── SimplestSearch.java.bak

│   │   │   │   ├── Sort.class

│   │   │   │   ├── Sort.java.bak

│   │   │   │   ├── StructedData.class

│   │   │   │   ├── StructedData.java.bak

│   │   │   │   ├── TestDataGenerator.class

│   │   │   │   └── TestDataGenerator.java.bak

│   │   │   ├── database.properties

│   │   │   ├── test

│   │   │   │   ├── com

│   │   │   │   │   └── lietu

│   │   │   │   │   ├── address

│   │   │   │   │   │   ├── AddAnalysis.class

│   │   │   │   │   │   ├── AddNewWord.class

│   │   │   │   │   │   ├── TestAddCitycCode.class

│   │   │   │   │   │   ├── TestAddress$1.class

│   │   │   │   │   │   ├── TestAddress.class

│   │   │   │   │   │   ├── TestAddressSeg.class

│   │   │   │   │   │   ├── TestDabaAddress.class

│   │   │   │   │   │   ├── TestDicAddress.class

│   │   │   │   │   │   ├── TestDicSuffix.class

│   │   │   │   │   │   ├── TestLRS.class

│   │   │   │   │   │   ├── TestTel.class

│   │   │   │   │   │   ├── TestUnknowGrammar.class

│   │   │   │   │   │   ├── TestUnkowAddress.class

│   │   │   │   │   │   └── Text2Dic.class

│   │   │   │   │   ├── poi

│   │   │   │   │   │   ├── TestPOI$1.class

│   │   │   │   │   │   ├── TestPOI.class

│   │   │   │   │   │   ├── TestPOIName.class

│   │   │   │   │   │   └── TestPOITagger.class

│   │   │   │   │   └── similarity

│   │   │   │   │   ├── ComparatorUse.class

│   │   │   │   │   ├── Info.class

│   │   │   │   │   ├── TestCharSim.class

│   │   │   │   │   ├── TestDistance.class

│   │   │   │   │   ├── TestDoc.class

│   │   │   │   │   ├── TestLongStringCom.class

│   │   │   │   │   ├── TestNewsSim.class

│   │   │   │   │   ├── TestSimLongText.class

│   │   │   │   │   ├── TestTextSummary$1.class

│   │   │   │   │   ├── TestTextSummary.class

│   │   │   │   │   ├── TestUnit.class

│   │   │   │   │   └── TestUnstructureData.class

│   │   │   │   └── data

│   │   │   │   ├── FunctionParser.class

│   │   │   │   ├── Test.class

│   │   │   │   ├── TestSort.class

│   │   │   │   └── TestYN.class

│   │   │   ├── testRegular

│   │   │   │   ├── TestMail.class

│   │   │   │   ├── TestRegex2.class

│   │   │   │   └── TestRegex.class

│   │   │   ├── testString

│   │   │   │   ├── IsChina.class

│   │   │   │   ├── TestAll.class

│   │   │   │   ├── TestCharAt.class

│   │   │   │   ├── TestChinaChange.class

│   │   │   │   ├── Test.class

│   │   │   │   ├── TestSort.class

│   │   │   │   ├── TestString.class

│   │   │   │   ├── TestSwitch.class

│   │   │   │   ├── TrieNodeSearch$TrieNode.class

│   │   │   │   └── TrieNodeSearch.class

│   │   │   └── textLong

│   │   │   ├── ComparatorInfo.class

│   │   │   ├── ExampleHashMap.class

│   │   │   ├── ExampleTreeMap.class

│   │   │   ├── Info.class

│   │   │   ├── StringSearch$TreeNode.class

│   │   │   ├── StringSearch.class

│   │   │   ├── StringSearchResult.class

│   │   │   ├── Test12.class

│   │   │   ├── TestArray.class

│   │   │   ├── TestChina.class

│   │   │   ├── Test.class

│   │   │   ├── TestMap.class

│   │   │   ├── TestSearch.class

│   │   │   └── TestString.class

│   │   ├── build.xml

│   │   ├── dic

│   │   │   ├── address.txt

│   │   │   ├── AddSynonym.txt

│   │   │   ├── Adj.txt

│   │   │   ├── biArea.txt

│   │   │   ├── BigramDict.txt

│   │   │   ├── body.txt

│   │   │   ├── cityaa.txt

│   │   │   ├── city.txt

│   │   │   ├── coreDict.sem.txt

│   │   │   ├── coreDict.txt

│   │   │   ├── country.txt

│   │   │   ├── county.txt

│   │   │   ├── c.txt

│   │   │   ├── district.txt

│   │   │   ├── Doc.java

│   │   │   ├── Doc.java.bak

│   │   │   ├── d.txt

│   │   │   ├── Feature.txt

│   │   │   ├── ForeignPlace.txt

│   │   │   ├── function1.txt

│   │   │   ├── function.txt

│   │   │   ├── GuillemetEnd.txt

│   │   │   ├── GuillemetStart.txt

│   │   │   ├── hanzipinyinfreq.txt

│   │   │   ├── hanziPinyin.txt

│   │   │   ├── invalid.txt

│   │   │   ├── KeyWord.txt

│   │   │   ├── landmark.txt

│   │   │   ├── lexical.ctx.txt

│   │   │   ├── matter.txt

│   │   │   ├── nr.ctx.txt

│   │   │   ├── nrTone.txt

│   │   │   ├── nr.txt

│   │   │   ├── ns.ctx.txt

│   │   │   ├── ns.txt

│   │   │   ├── n.txt

│   │   │   ├── nz.ctx.txt

│   │   │   ├── nz.txt

│   │   │   ├── otherAddr.txt

│   │   │   ├── other.txt

│   │   │   ├── out

│   │   │   │   ├── cityout.txt

│   │   │   │   ├── countyout.txt

│   │   │   │   ├── districtout.txt

│   │   │   │   ├── municipalityout.txt

│   │   │   │   ├── provinceout.txt

│   │   │   │   ├── townout.txt

│   │   │   │   └── villageout.txt

│   │   │   ├── pos.train.scale.model

│   │   │   ├── Precursor.txt

│   │   │   ├── province.txt

│   │   │   ├── relatedPos.txt

│   │   │   ├── smallAddress.txt

│   │   │   ├── SmallAdd.txt

│   │   │   ├── source.txt

│   │   │   ├── stopword.txt

│   │   │   ├── street.txt

│   │   │   ├── str.txt

│   │   │   ├── SuffixBuildingUnit.txt

│   │   │   ├── SuffixDistrict.txt

│   │   │   ├── SuffixLandMark.txt

│   │   │   ├── suffixStreet.txt

│   │   │   ├── synonym_2.txt

│   │   │   ├── telcode.txt

│   │   │   ├── test.txt

│   │   │   ├── time.txt

│   │   │   ├── town.txt

│   │   │   ├── tr.ctx.txt

│   │   │   ├── tr.txt

│   │   │   ├── UnknowGrammarPoi.txt

│   │   │   ├── UnknowGrammar.txt

│   │   │   ├── veb.txt

│   │   │   └── village.txt

│   │   ├── result20000.txt

│   │   ├── resultonly2.txt

│   │   ├── src

│   │   │   ├── com

│   │   │   │   ├── ibm

│   │   │   │   │   └── compbio

│   │   │   │   │   ├── Cell.java

│   │   │   │   │   ├── DynamicProgramming.java

│   │   │   │   │   ├── package.html

│   │   │   │   │   └── sequence

│   │   │   │   │   └── LongestCommonSubsequence.java

│   │   │   │   ├── lietu

│   │   │   │   │   ├── address

│   │   │   │   │   │   ├── AddDicData.java

│   │   │   │   │   │   ├── AddDicTypes.java

│   │   │   │   │   │   ├── Address.java

│   │   │   │   │   │   ├── AddressSpan.java

│   │   │   │   │   │   ├── AddressTagger.java

│   │   │   │   │   │   ├── AddressTokenInf.java

│   │   │   │   │   │   ├── AddressToken.java

│   │   │   │   │   │   ├── AddressTokenLinkedList.java

│   │   │   │   │   │   ├── AddressTokenWeight.java

│   │   │   │   │   │   ├── AddressType.java

│   │   │   │   │   │   ├── AddTokenizer.java

│   │   │   │   │   │   ├── AddTypeInf.java

│   │   │   │   │   │   ├── AddTypes.java

│   │   │   │   │   │   ├── AdjList.java

│   │   │   │   │   │   ├── AVLTree.java

│   │   │   │   │   │   ├── ContextStatAddress.java

│   │   │   │   │   │   ├── DicAddress.java

│   │   │   │   │   │   ├── DicSuffix.java

│   │   │   │   │   │   ├── LRS.java

│   │   │   │   │   │   ├── package.html

│   │   │   │   │   │   ├── Production.java

│   │   │   │   │   │   ├── UnknowAddress.java

│   │   │   │   │   │   └── UnknowGrammar.java

│   │   │   │   │   ├── data

│   │   │   │   │   │   ├── AccessManager.java

│   │   │   │   │   │   └── package.html

│   │   │   │   │   ├── hmm

│   │   │   │   │   │   ├── AddDicTypes.java

│   │   │   │   │   │   ├── AddrTagger.java

│   │   │   │   │   │   ├── AdressReliability.java

│   │   │   │   │   │   ├── DicAddress.java

│   │   │   │   │   │   ├── GetAddressEmit.java

│   │   │   │   │   │   ├── NameReliability.java

│   │   │   │   │   │   ├── Node.java

│   │   │   │   │   │   ├── package.html

│   │   │   │   │   │   ├── State.java

│   │   │   │   │   │   ├── StateTable.java

│   │   │   │   │   │   ├── Symbol.java

│   │   │   │   │   │   └── SymbolTable.java

│   │   │   │   │   ├── orgs

│   │   │   │   │   │   ├── AdjList.java

│   │   │   │   │   │   ├── ContextStatPoi.java

│   │   │   │   │   │   ├── DicPois.java

│   │   │   │   │   │   ├── PoiDicTypes.java

│   │   │   │   │   │   ├── PoiSpan.java

│   │   │   │   │   │   ├── PoiTagger.java

│   │   │   │   │   │   ├── PoiTokenInf.java

│   │   │   │   │   │   ├── PoiToken.java

│   │   │   │   │   │   ├── PoiTokenLinkedList.java

│   │   │   │   │   │   ├── PoiTokenWeight.java

│   │   │   │   │   │   ├── PoiTypeInf.java

│   │   │   │   │   │   ├── PoiType.java

│   │   │   │   │   │   ├── PoiTypes.java

│   │   │   │   │   │   ├── Production.java

│   │   │   │   │   │   ├── UnknowKeyword.java

│   │   │   │   │   │   └── UnknowPoi.java

│   │   │   │   │   ├── poi

│   │   │   │   │   │   ├── AVLTree.java

│   │   │   │   │   │   ├── FunctionSet.java

│   │   │   │   │   │   ├── package.html

│   │   │   │   │   │   ├── POI.java

│   │   │   │   │   │   └── UnknowGrammarPoi.java

│   │   │   │   │   ├── simhash

│   │   │   │   │   │   ├── BitUtil.java

│   │   │   │   │   │   ├── CombinationGenerator.java

│   │   │   │   │   │   ├── CopyOfSimHashData1.java

│   │   │   │   │   │   ├── GeneralHashFunctionLibrary.java

│   │   │   │   │   │   ├── Hash.java

│   │   │   │   │   │   ├── JenkinsHash.java

│   │   │   │   │   │   ├── MD5.java

│   │   │   │   │   │   ├── MurmurHash.java

│   │   │   │   │   │   ├── package.html

│   │   │   │   │   │   ├── POISimHash.java

│   │   │   │   │   │   ├── SimHashData1.java

│   │   │   │   │   │   ├── SimHashData.java

│   │   │   │   │   │   ├── SimHashSet4.java

│   │   │   │   │   │   ├── SimHashSet.java

│   │   │   │   │   │   ├── Span.java

│   │   │   │   │   │   ├── SynonymsMap.java

│   │   │   │   │   │   └── TextSimHash.java

│   │   │   │   │   ├── similarity

│   │   │   │   │   │   ├── AddressRelations.java

│   │   │   │   │   │   ├── AddressSimilar.java

│   │   │   │   │   │   ├── AddrSimilar.java

│   │   │   │   │   │   ├── CharSim.java

│   │   │   │   │   │   ├── DicAddress.java

│   │   │   │   │   │   ├── Distance.java

│   │   │   │   │   │   ├── package.html

│   │   │   │   │   │   ├── Record.java

│   │   │   │   │   │   ├── RecordSim.java

│   │   │   │   │   │   └── SmallAddressSim.java

│   │   │   │   │   ├── tel

│   │   │   │   │   │   ├── DicTel.java

│   │   │   │   │   │   ├── package.html

│   │   │   │   │   │   ├── TelNumber.java

│   │   │   │   │   │   └── TelSeg.java

│   │   │   │   │   ├── text

│   │   │   │   │   │   ├── AddressSynonym.java

│   │   │   │   │   │   ├── AdjListDoc.java

│   │   │   │   │   │   ├── BodyType.java

│   │   │   │   │   │   ├── CityRelevance.java

│   │   │   │   │   │   ├── ContextStatDoc.java

│   │   │   │   │   │   ├── DicDoc.java

│   │   │   │   │   │   ├── DocDicTypes.java

│   │   │   │   │   │   ├── DocFactory.java

│   │   │   │   │   │   ├── Doc.java

│   │   │   │   │   │   ├── DocSimHash.java

│   │   │   │   │   │   ├── DocSpan.java

│   │   │   │   │   │   ├── DocTagger.java

│   │   │   │   │   │   ├── DocTokenInf.java

│   │   │   │   │   │   ├── DocToken.java

│   │   │   │   │   │   ├── DocTokenLinkedList.java

│   │   │   │   │   │   ├── DocTypeInf.java

│   │   │   │   │   │   ├── DocType.java

│   │   │   │   │   │   ├── DocTypes.java

│   │   │   │   │   │   ├── MatterSynonym.java

│   │   │   │   │   │   ├── MatterType.java

│   │   │   │   │   │   ├── package.html

│   │   │   │   │   │   ├── SynonymDic.java

│   │   │   │   │   │   ├── Synonym.java

│   │   │   │   │   │   ├── SynonymReplace.java

│   │   │   │   │   │   ├── UnknowDoc.java

│   │   │   │   │   │   ├── UnknowGrammarDoc.java

│   │   │   │   │   │   └── UnknowKeyword.java

│   │   │   │   │   ├── textSim

│   │   │   │   │   │   ├── ComputeSim.java

│   │   │   │   │   │   ├── Document.java

│   │   │   │   │   │   ├── package.html

│   │   │   │   │   │   ├── StopSet.java

│   │   │   │   │   │   └── VectorUtils.java

│   │   │   │   │   ├── unstructured

│   │   │   │   │   │   ├── DateMatcher.java

│   │   │   │   │   │   ├── DicEnd.java

│   │   │   │   │   │   ├── DicSentenceEnd.java

│   │   │   │   │   │   ├── DocSplit.java

│   │   │   │   │   │   ├── FSM.java

│   │   │   │   │   │   ├── Guard.java

│   │   │   │   │   │   ├── InputEvent.java

│   │   │   │   │   │   ├── MatchType.java

│   │   │   │   │   │   ├── News.java

│   │   │   │   │   │   ├── package.html

│   │   │   │   │   │   ├── State.java

│   │   │   │   │   │   └── Transition.java

│   │   │   │   │   └── util

│   │   │   │   │   └── DataBaseUtil.java

│   │   │   │   └── liqiang

│   │   │   │   └── hamming

│   │   │   │   ├── ByteUtil.java

│   │   │   │   ├── ByteUtil.java.bak

│   │   │   │   ├── DictDoc.java

│   │   │   │   ├── FileUtil.java

│   │   │   │   ├── FileUtil.java.bak

│   │   │   │   ├── HammingDistance.java

│   │   │   │   ├── HammingDistance.java.bak

│   │   │   │   ├── Search.java

│   │   │   │   ├── Search.java.bak

│   │   │   │   ├── SimplestSearch.java

│   │   │   │   ├── SimplestSearch.java.bak

│   │   │   │   ├── Sort.java

│   │   │   │   ├── Sort.java.bak

│   │   │   │   ├── StructedData.java

│   │   │   │   ├── StructedData.java.bak

│   │   │   │   ├── TestDataGenerator.java

│   │   │   │   └── TestDataGenerator.java.bak

│   │   │   └── database.properties

│   │   └── test

│   │   ├── com

│   │   │   └── lietu

│   │   │   ├── exchange

│   │   │   │   └── StreetToArea.java

│   │   │   ├── simhash

│   │   │   │   ├── MyObjectOutputStream.java

│   │   │   │   ├── TestBitUtil.java

│   │   │   │   ├── TestCombination.java

│   │   │   │   ├── TestJenkinsHash.java

│   │   │   │   ├── TestMurmurHash.java

│   │   │   │   ├── TestPOICharSim.java

│   │   │   │   ├── TestPOIHash.java

│   │   │   │   ├── TestPOISimHashStructure.java

│   │   │   │   ├── TestPOIStructure.java

│   │   │   │   ├── TestSimHash4.java

│   │   │   │   ├── TestSimHashOther.java

│   │   │   │   ├── TestSimHashSet.java

│   │   │   │   └── TestTextSimHash.java

│   │   │   ├── tbl

│   │   │   │   └── Tbl.java

│   │   │   └── unstructured

│   │   │   ├── Similar.java

│   │   │   ├── TestBody.java

│   │   │   ├── TestData.java

│   │   │   ├── TestDocFactory.java

│   │   │   ├── TestExtract.java

│   │   │   ├── TestGetTime.java

│   │   │   ├── TestHashCode.java

│   │   │   ├── TestMatterSynonym.java

│   │   │   ├── TestSimilarity.java

│   │   │   ├── TestSuffixStreet.java

│   │   │   ├── TestSynonymReplace.java

│   │   │   ├── TestTagger.java

│   │   │   └── TestUnstructuredData.java

│   │   ├── test

│   │   │   ├── com

│   │   │   │   └── lietu

│   │   │   │   ├── address

│   │   │   │   │   ├── AddAnalysis.java

│   │   │   │   │   ├── AddNewWord.java

│   │   │   │   │   ├── TestAddCitycCode.java

│   │   │   │   │   ├── TestAddress.java

│   │   │   │   │   ├── TestAddressSeg.java

│   │   │   │   │   ├── TestDabaAddress.java

│   │   │   │   │   ├── TestDicAddress.java

│   │   │   │   │   ├── TestDicSuffix.java

│   │   │   │   │   ├── TestLRS.java

│   │   │   │   │   ├── TestTel.java

│   │   │   │   │   ├── TestUnknowGrammar.java

│   │   │   │   │   ├── TestUnkowAddress.java

│   │   │   │   │   └── Text2Dic.java

│   │   │   │   ├── poi

│   │   │   │   │   ├── TestPOI.java

│   │   │   │   │   ├── TestPOIName.java

│   │   │   │   │   └── TestPOITagger.java

│   │   │   │   └── similarity

│   │   │   │   ├── TestCharSim.java

│   │   │   │   ├── TestDistance.java

│   │   │   │   ├── TestDoc.java

│   │   │   │   ├── TestLongStringCom.java

│   │   │   │   ├── TestNewsSim.java

│   │   │   │   ├── TestSimLongText.java

│   │   │   │   ├── TestTextSummary.java

│   │   │   │   ├── TestUnit.java

│   │   │   │   └── TestUnstructureData.java

│   │   │   └── data

│   │   │   ├── FunctionParser.java

│   │   │   ├── Test.java

│   │   │   ├── TestSort.java

│   │   │   └── TestYN.java

│   │   ├── testRegular

│   │   │   ├── TestMail.java

│   │   │   ├── TestRegex2.java

│   │   │   └── TestRegex.java

│   │   ├── testString

│   │   │   ├── IsChina.java

│   │   │   ├── TestAll.java

│   │   │   ├── TestCharAt.java

│   │   │   ├── TestChinaChange.java

│   │   │   ├── Test.java

│   │   │   ├── TestSort.java

│   │   │   ├── TestString.java

│   │   │   ├── TestSwitch.java

│   │   │   └── TrieNodeSearch.java

│   │   └── textLong

│   │   ├── ExampleHashMap.java

│   │   ├── ExampleTreeMap.java

│   │   ├── StringSearch.java

│   │   ├── StringSearchResult.java

│   │   ├── Test12.java

│   │   ├── TestArray.java

│   │   ├── TestChina.java

│   │   ├── Test.java

│   │   ├── TestMap.java

│   │   ├── TestSearch.java

│   │   └── TestString.java

│   └── readme.txt

├── Char10

│   ├── 1798Crawler

│   │   ├── classes

│   │   │   ├── com

│   │   │   │   └── lietu

│   │   │   │   ├── db

│   │   │   │   │   └── DBManager.class

│   │   │   │   ├── EventExtract

│   │   │   │   │   ├── AdjList.class

│   │   │   │   │   ├── ContextStatDoc.class

│   │   │   │   │   ├── DicDoc$MatchRet.class

│   │   │   │   │   ├── DicDoc$TSTNode.class

│   │   │   │   │   ├── DicDoc.class

│   │   │   │   │   ├── DocSpan.class

│   │   │   │   │   ├── DocTagger.class

│   │   │   │   │   ├── DocToken.class

│   │   │   │   │   ├── DocTokenInf.class

│   │   │   │   │   ├── DocTokenLinkedList$LinkIterator.class

│   │   │   │   │   ├── DocTokenLinkedList$Node.class

│   │   │   │   │   ├── DocTokenLinkedList.class

│   │   │   │   │   ├── DocType.class

│   │   │   │   │   ├── DocTypes$DocTypeInf.class

│   │   │   │   │   ├── DocTypes$LinkIterator.class

│   │   │   │   │   ├── DocTypes$Node.class

│   │   │   │   │   ├── DocTypes.class

│   │   │   │   │   ├── GetExtractorInfo.class

│   │   │   │   │   ├── UnknowGrammar$MatchRet.class

│   │   │   │   │   ├── UnknowGrammar$TSTNode.class

│   │   │   │   │   └── UnknowGrammar.class

│   │   │   │   ├── index

│   │   │   │   │   ├── DirSpider.class

│   │   │   │   │   ├── IndexMerge.class

│   │   │   │   │   ├── ScenicIndex.class

│   │   │   │   │   ├── TourIndex.class

│   │   │   │   │   ├── TripNewsIndex.class

│   │   │   │   │   └── TripNotesIndex.class

│   │   │   │   ├── IRealTimeSpiderTrip

│   │   │   │   │   └── IRealTimeSpiderTrip.class

│   │   │   │   ├── MainStart

│   │   │   │   │   └── StartSpider.class

│   │   │   │   ├── model

│   │   │   │   │   ├── Scenic.class

│   │   │   │   │   └── TourInfo.class

│   │   │   │   ├── seg

│   │   │   │   │   ├── CnAnalyzer.class

│   │   │   │   │   ├── CnTokenizer.class

│   │   │   │   │   ├── FMMSegment.class

│   │   │   │   │   ├── SingleFilter.class

│   │   │   │   │   ├── SingleQueryParser.class

│   │   │   │   │   ├── StAnalyzer.class

│   │   │   │   │   ├── TernarySearchTrie$TSTNode.class

│   │   │   │   │   └── TernarySearchTrie.class

│   │   │   │   ├── synonym

│   │   │   │   │   ├── AllDocCollector.class

│   │   │   │   │   ├── AnalyzerUtils.class

│   │   │   │   │   ├── SynonymAnalyzer.class

│   │   │   │   │   ├── SynonymAnalyzerTest.class

│   │   │   │   │   ├── SynonymAnalyzerViewer.class

│   │   │   │   │   ├── SynonymEngine.class

│   │   │   │   │   ├── SynonymFilter.class

│   │   │   │   │   ├── TestSynonymEngine.class

│   │   │   │   │   ├── TestUtil.class

│   │   │   │   │   └── WordNetSynonymEngine.class

│   │   │   │   ├── text

│   │   │   │   │   ├── AdjListDoc.class

│   │   │   │   │   ├── ContextStatDoc.class

│   │   │   │   │   ├── DicDoc$MatchRet.class

│   │   │   │   │   ├── DicDoc$TSTNode.class

│   │   │   │   │   ├── DicDoc.class

│   │   │   │   │   ├── DocDicTypes$LinkIterator.class

│   │   │   │   │   ├── DocDicTypes$Node.class

│   │   │   │   │   ├── DocDicTypes$PoiTypeInf1.class

│   │   │   │   │   ├── DocDicTypes.class

│   │   │   │   │   ├── DocSpan.class

│   │   │   │   │   ├── DocTagger.class

│   │   │   │   │   ├── DocToken.class

│   │   │   │   │   ├── DocTokenInf.class

│   │   │   │   │   ├── DocTokenLinkedList$LinkIterator.class

│   │   │   │   │   ├── DocTokenLinkedList$Node.class

│   │   │   │   │   ├── DocTokenLinkedList.class

│   │   │   │   │   ├── DocType.class

│   │   │   │   │   ├── DocTypeInf.class

│   │   │   │   │   ├── DocTypes$LinkIterator.class

│   │   │   │   │   ├── DocTypes$Node.class

│   │   │   │   │   ├── DocTypes.class

│   │   │   │   │   ├── GetData.class

│   │   │   │   │   ├── Tools.class

│   │   │   │   │   ├── UnknowDoc.class

│   │   │   │   │   ├── UnknowGrammarDoc$MatchRet.class

│   │   │   │   │   ├── UnknowGrammarDoc$TSTNode.class

│   │   │   │   │   ├── UnknowGrammarDoc.class

│   │   │   │   │   └── UnknowKeyword.class

│   │   │   │   ├── TextClassified

│   │   │   │   │   ├── Rule.class

│   │   │   │   │   └── RuleClassifier.class

│   │   │   │   ├── tools

│   │   │   │   │   ├── CountWeek.class

│   │   │   │   │   ├── FindDataTools.class

│   │   │   │   │   ├── FomatData.class

│   │   │   │   │   ├── HighFreqTerms.class

│   │   │   │   │   ├── KuXunTools.class

│   │   │   │   │   ├── ReadImage.class

│   │   │   │   │   ├── SimpleThread.class

│   │   │   │   │   ├── StartCityByPhone.class

│   │   │   │   │   ├── StringSearch$TreeNode.class

│   │   │   │   │   ├── StringSearch.class

│   │   │   │   │   ├── Substring.class

│   │   │   │   │   ├── TermInfo.class

│   │   │   │   │   ├── TermInfoQueue.class

│   │   │   │   │   ├── TestSearch.class

│   │   │   │   │   ├── ThreadPool.class

│   │   │   │   │   └── ThreadPoolManager.class

│   │   │   │   ├── TripActivitySpider

│   │   │   │   │   ├── RealTimeSpider0755888.class

│   │   │   │   │   ├── RealTimeSpider163TravelBBS.class

│   │   │   │   │   ├── RealTimeSpider17167.class

│   │   │   │   │   ├── RealTimeSpider1798hw.class

│   │   │   │   │   ├── RealTimeSpider19lou.class

│   │   │   │   │   ├── RealTimeSpider517huwai.class

│   │   │   │   │   ├── RealTimeSpider58city.class

│   │   │   │   │   ├── RealTimeSpider5iucn.class

│   │   │   │   │   ├── RealTimeSpider5yi.class

│   │   │   │   │   ├── RealTimeSpider5zls.class

│   │   │   │   │   ├── RealTimeSpider7uu.class

│   │   │   │   │   ├── RealTimeSpider8246BBS.class

│   │   │   │   │   ├── RealTimeSpider8264U.class

│   │   │   │   │   ├── RealTimeSpiderBBSTemp.class

│   │   │   │   │   ├── RealTimeSpiderDaQi.class

│   │   │   │   │   ├── RealTimeSpiderDouban.class

│   │   │   │   │   ├── RealTimeSpiderDoyouhike.class

│   │   │   │   │   ├── RealTimeSpiderEzeem.class

│   │   │   │   │   ├── RealTimeSpiderFirephoenix.class

│   │   │   │   │   ├── RealTimeSpiderGanJi.class

│   │   │   │   │   ├── RealTimeSpiderGo2eu.class

│   │   │   │   │   ├── RealTimeSpiderHd00.class

│   │   │   │   │   ├── RealTimeSpiderHsw.class

│   │   │   │   │   ├── RealTimeSpiderHuZhuJob.class

│   │   │   │   │   ├── RealTimeSpiderIfindu.class

│   │   │   │   │   ├── RealTimeSpiderKouBei.class

│   │   │   │   │   ├── RealTimeSpiderLvren.class

│   │   │   │   │   ├── RealTimeSpiderLvye.class

│   │   │   │   │   ├── RealTimeSpiderLvyeOrg.class

│   │   │   │   │   ├── RealTimeSpiderLvzhou.class

│   │   │   │   │   ├── RealTimeSpiderMaFengWo.class

│   │   │   │   │   ├── RealTimeSpiderMy835.class

│   │   │   │   │   ├── RealTimeSpiderNf1799.class

│   │   │   │   │   ├── RealTimeSpiderNiwota.class

│   │   │   │   │   ├── RealTimeSpiderPinKe.class

│   │   │   │   │   ├── RealTimeSpiderQdClub.class

│   │   │   │   │   ├── RealTimeSpiderQuYou.class

│   │   │   │   │   ├── RealTimeSpiderSohu.class

│   │   │   │   │   ├── RealTimeSpiderSzBuDao.class

│   │   │   │   │   ├── RealTimeSpiderToursFor.class

│   │   │   │   │   ├── RealTimeSpiderTourye.class

│   │   │   │   │   ├── RealTimeSpiderUuyoyo.class

│   │   │   │   │   ├── RealTimeSpiderUzai.class

│   │   │   │   │   ├── RealTimeSpiderXyjt.class

│   │   │   │   │   ├── RealTimeSpiderYsr8848.class

│   │   │   │   │   └── RetrivePage.class

│   │   │   │   ├── TripAreaInfoSpider

│   │   │   │   │   ├── InfoSpiderCssn.class

│   │   │   │   │   └── InfoSpiderKuxun.class

│   │   │   │   ├── TripNewsSpider

│   │   │   │   │   ├── CecnNewSpiderTrip.class

│   │   │   │   │   ├── ChinaNewsSpiderTrip.class

│   │   │   │   │   ├── CncnNewsSpiderTrip.class

│   │   │   │   │   ├── CntaSpiderTrip.class

│   │   │   │   │   ├── CthyNewsSpiderTrip.class

│   │   │   │   │   ├── FjsenSpiderTrip.class

│   │   │   │   │   ├── GmwNewSpiderTrip.class

│   │   │   │   │   ├── GooTripSpiderTrip.class

│   │   │   │   │   ├── IucnSpiderTrip.class

│   │   │   │   │   ├── LoveTripSpiderTrip.class

│   │   │   │   │   ├── LvMamaSpiderTrip.class

│   │   │   │   │   ├── LvRenNewsSpiderTrip.class

│   │   │   │   │   ├── MiPangSpiderTrip.class

│   │   │   │   │   ├── NewsSpiderTrip.class

│   │   │   │   │   ├── QianLongSpiderTrip.class

│   │   │   │   │   ├── QQNewsSpider.class

│   │   │   │   │   ├── ShangDuSpiderTrip.class

│   │   │   │   │   ├── SpiderTrip163.class

│   │   │   │   │   ├── SpiderTripEu169.class

│   │   │   │   │   ├── TongChengSpiderTrip.class

│   │   │   │   │   ├── TuniuNewsSpiderTrip.class

│   │   │   │   │   ├── TvTourSpiderTrip.class

│   │   │   │   │   ├── WorkrCnSpiderTrip.class

│   │   │   │   │   ├── XinxinSpiderTrip.class

│   │   │   │   │   ├── YouXiaKeSpiderTrip.class

│   │   │   │   │   └── YouYoSpiderTrip.class

│   │   │   │   ├── TripNodesSpider

│   │   │   │   │   ├── ActiveclubNotesSpider.class

│   │   │   │   │   ├── BaiZusNotesSpider.class

│   │   │   │   │   ├── BecodTripNotesSpider.class

│   │   │   │   │   ├── BeiBaoNotesSpider.class

│   │   │   │   │   ├── BookHotelNotesSpider.class

│   │   │   │   │   ├── CcotsNotesSpider.class

│   │   │   │   │   ├── CncnNotesSpider.class

│   │   │   │   │   ├── CnuuNotesSpider.class

│   │   │   │   │   ├── Eu169NodesSpider.class

│   │   │   │   │   ├── FswxwsNotesSpider.class

│   │   │   │   │   ├── GoHuBeiNotesSpider.class

│   │   │   │   │   ├── IFengNotesSpider.class

│   │   │   │   │   ├── IlvPingNodesSpider.class

│   │   │   │   │   ├── IouterNotesSpider.class

│   │   │   │   │   ├── JiaYouNotesSpider.class

│   │   │   │   │   ├── LikefarNotesSpider.class

│   │   │   │   │   ├── LiuZhouNotesSpider.class

│   │   │   │   │   ├── LotourNotesSpider.class

│   │   │   │   │   ├── LotourTripNotesSpider.class

│   │   │   │   │   ├── LoveHwNotesSpider.class

│   │   │   │   │   ├── LvWoNotesSpider.class

│   │   │   │   │   ├── LvyChinaNotesSpider.class

│   │   │   │   │   ├── LvYouLuNotesSpider.class

│   │   │   │   │   ├── LzHwNotesSpider.class

│   │   │   │   │   ├── MangoCityNotesSpider.class

│   │   │   │   │   ├── NewXingZheNotesSpider.class

│   │   │   │   │   ├── NodesSpider163.class

│   │   │   │   │   ├── NoteSpiderTravel163.class

│   │   │   │   │   ├── NotesSpider17u.class

│   │   │   │   │   ├── NotesSpider19lou.class

│   │   │   │   │   ├── NotesSpider21Cn.class

│   │   │   │   │   ├── NotesSpider5166.class

│   │   │   │   │   ├── NotesSpider51766.class

│   │   │   │   │   ├── NotesSpider517HuWai.class

│   │   │   │   │   ├── NotesSpider571Holiday.class

│   │   │   │   │   ├── NotesSpider5zls.class

│   │   │   │   │   ├── NotesSpider7uu.class

│   │   │   │   │   ├── NotesSpider8246BBS.class

│   │   │   │   │   ├── NotesSpiderT960.class

│   │   │   │   │   ├── NotesSpiderTravel169.class

│   │   │   │   │   ├── OnlyLadyNotesSpider.class

│   │   │   │   │   ├── OutDoorsBbsNotesSpider.class

│   │   │   │   │   ├── QiangGenNotesSpider.class

│   │   │   │   │   ├── QuNarNotesSpider.class

│   │   │   │   │   ├── RedNetNotesSpider.class

│   │   │   │   │   ├── SfhwNotesSpider.class

│   │   │   │   │   ├── SinaNotesSpider.class

│   │   │   │   │   ├── SinzerNotesSpider.class

│   │   │   │   │   ├── SouthNotesSpider.class

│   │   │   │   │   ├── SyjLbNotesSpider.class

│   │   │   │   │   ├── TencentNotesSpider.class

│   │   │   │   │   ├── TraveBbsNotesSpider.class

│   │   │   │   │   ├── TravelQQNodesSpader.class

│   │   │   │   │   ├── TravelWuhanNotesSpider.class

│   │   │   │   │   ├── TrendsNodesSpider.class

│   │   │   │   │   ├── TuniuTripNotesSpider.class

│   │   │   │   │   ├── TvtourNotesSpider.class

│   │   │   │   │   ├── UheNanNotesSpider.class

│   │   │   │   │   ├── UutuuNotesSpider.class

│   │   │   │   │   ├── UuyoyoNotesSpider.class

│   │   │   │   │   ├── UzaiNodesSpider.class

│   │   │   │   │   ├── YahooNotesSpider.class

│   │   │   │   │   ├── YjglNotesSpider.class

│   │   │   │   │   ├── ZctripNotesSpider.class

│   │   │   │   │   ├── ZouBarNotesSpider_2.class

│   │   │   │   │   └── ZouBarNotesSpider.class

│   │   │   │   └── TripTourSpider

│   │   │   │   ├── ByecityTourSpiderTrip.class

│   │   │   │   ├── CareTourSpiderTrip.class

│   │   │   │   ├── CncnTourSpiderTrip.class

│   │   │   │   ├── CnXianLuTourSpiderTrip.class

│   │   │   │   ├── CtripTourSpiderTrip.class

│   │   │   │   ├── KuXunTourSpiderTrip.class

│   │   │   │   ├── LvXingTourSpiderTrip.class

│   │   │   │   ├── MiPangTourSpiderTrip.class

│   │   │   │   ├── TuniuTourSpiderTrip.class

│   │   │   │   └── WuYiQiTourSpiderTrip.class

│   │   │   ├── conf.properties

│   │   │   ├── ext_stopword.dic

│   │   │   ├── IKAnalyzer.cfg.xml

│   │   │   ├── logback.xml

│   │   │   ├── result.txt

│   │   │   ├── scenic.dic

│   │   │   ├── SDIC.txt

│   │   │   ├── SynonymWord.txt

│   │   │   └── TestCrawler

│   │   │   ├── CrawlerPhoneToDB.class

│   │   │   ├── startSpider.bak

│   │   │   ├── Test3.class

│   │   │   ├── TestAnalyzer.class

│   │   │   ├── Test.class

│   │   │   ├── TestStartNewsSpider.class

│   │   │   ├── TestStartSpider.class

│   │   │   └── URLEncoding.class

│   │   ├── src

│   │   │   ├── com

│   │   │   │   └── lietu

│   │   │   │   ├── db

│   │   │   │   │   └── DBManager.java

│   │   │   │   ├── EventExtract

│   │   │   │   │   ├── AdjList.java

│   │   │   │   │   ├── ContextStatDoc.java

│   │   │   │   │   ├── DicDoc.java

│   │   │   │   │   ├── DocSpan.java

│   │   │   │   │   ├── DocTagger.java

│   │   │   │   │   ├── DocTokenInf.java

│   │   │   │   │   ├── DocToken.java

│   │   │   │   │   ├── DocTokenLinkedList.java

│   │   │   │   │   ├── DocType.java

│   │   │   │   │   ├── DocTypes.java

│   │   │   │   │   ├── GetExtractorInfo.java

│   │   │   │   │   └── UnknowGrammar.java

│   │   │   │   ├── index

│   │   │   │   │   ├── DirSpider.java

│   │   │   │   │   ├── IndexMerge.java

│   │   │   │   │   ├── ScenicIndex.java

│   │   │   │   │   ├── TourIndex.java

│   │   │   │   │   ├── TripNewsIndex.java

│   │   │   │   │   └── TripNotesIndex.java

│   │   │   │   ├── IRealTimeSpiderTrip

│   │   │   │   │   └── IRealTimeSpiderTrip.java

│   │   │   │   ├── MainStart

│   │   │   │   │   └── StartSpider.java

│   │   │   │   ├── model

│   │   │   │   │   ├── Scenic.java

│   │   │   │   │   └── TourInfo.java

│   │   │   │   ├── seg

│   │   │   │   │   ├── CnAnalyzer.java

│   │   │   │   │   ├── CnTokenizer.java

│   │   │   │   │   ├── FMMSegment.java

│   │   │   │   │   ├── SingleFilter.java

│   │   │   │   │   ├── SingleQueryParser.java

│   │   │   │   │   ├── StAnalyzer.java

│   │   │   │   │   └── TernarySearchTrie.java

│   │   │   │   ├── synonym

│   │   │   │   │   ├── AllDocCollector.java

│   │   │   │   │   ├── AnalyzerUtils.java

│   │   │   │   │   ├── SynonymAnalyzer.java

│   │   │   │   │   ├── SynonymAnalyzerTest.java

│   │   │   │   │   ├── SynonymAnalyzerViewer.java

│   │   │   │   │   ├── SynonymEngine.java

│   │   │   │   │   ├── SynonymFilter.java

│   │   │   │   │   ├── TestSynonymEngine.java

│   │   │   │   │   ├── TestUtil.java

│   │   │   │   │   └── WordNetSynonymEngine.java

│   │   │   │   ├── text

│   │   │   │   │   ├── AdjListDoc.java

│   │   │   │   │   ├── ContextStatDoc.java

│   │   │   │   │   ├── DicDoc.java

│   │   │   │   │   ├── DocDicTypes.java

│   │   │   │   │   ├── DocSpan.java

│   │   │   │   │   ├── DocTagger.java

│   │   │   │   │   ├── DocTokenInf.java

│   │   │   │   │   ├── DocToken.java

│   │   │   │   │   ├── DocTokenLinkedList.java

│   │   │   │   │   ├── DocTypeInf.java

│   │   │   │   │   ├── DocType.java

│   │   │   │   │   ├── DocTypes.java

│   │   │   │   │   ├── GetData.java

│   │   │   │   │   ├── Tools.java

│   │   │   │   │   ├── UnknowDoc.java

│   │   │   │   │   ├── UnknowGrammarDoc.java

│   │   │   │   │   └── UnknowKeyword.java

│   │   │   │   ├── TextClassified

│   │   │   │   │   ├── RuleClassifier.java

│   │   │   │   │   └── Rule.java

│   │   │   │   ├── tools

│   │   │   │   │   ├── CountWeek.java

│   │   │   │   │   ├── FindDataTools.java

│   │   │   │   │   ├── FomatData.java

│   │   │   │   │   ├── HighFreqTerms.java

│   │   │   │   │   ├── KuXunTools.java

│   │   │   │   │   ├── ReadImage.java

│   │   │   │   │   ├── SimpleThread.java

│   │   │   │   │   ├── StartCityByPhone.java

│   │   │   │   │   ├── StringSearch.java

│   │   │   │   │   ├── Substring.java

│   │   │   │   │   ├── TestSearch.java

│   │   │   │   │   ├── ThreadPool.java

│   │   │   │   │   └── ThreadPoolManager.java

│   │   │   │   ├── TripActivitySpider

│   │   │   │   │   ├── RealTimeSpider0755888.java

│   │   │   │   │   ├── RealTimeSpider163TravelBBS.java

│   │   │   │   │   ├── RealTimeSpider17167.java

│   │   │   │   │   ├── RealTimeSpider1798hw.java

│   │   │   │   │   ├── RealTimeSpider19lou.java

│   │   │   │   │   ├── RealTimeSpider517huwai.java

│   │   │   │   │   ├── RealTimeSpider58city.java

│   │   │   │   │   ├── RealTimeSpider5iucn.java

│   │   │   │   │   ├── RealTimeSpider5yi.java

│   │   │   │   │   ├── RealTimeSpider5zls.java

│   │   │   │   │   ├── RealTimeSpider7uu.java

│   │   │   │   │   ├── RealTimeSpider8246BBS.java

│   │   │   │   │   ├── RealTimeSpider8264U.java

│   │   │   │   │   ├── RealTimeSpiderBBSTemp.java

│   │   │   │   │   ├── RealTimeSpiderDaQi.java

│   │   │   │   │   ├── RealTimeSpiderDouban.java

│   │   │   │   │   ├── RealTimeSpiderDoyouhike.java

│   │   │   │   │   ├── RealTimeSpiderEzeem.java

│   │   │   │   │   ├── RealTimeSpiderFirephoenix.java

│   │   │   │   │   ├── RealTimeSpiderGanJi.java

│   │   │   │   │   ├── RealTimeSpiderGo2eu.java

│   │   │   │   │   ├── RealTimeSpiderHd00.java

│   │   │   │   │   ├── RealTimeSpiderHsw.java

│   │   │   │   │   ├── RealTimeSpiderHuZhuJob.java

│   │   │   │   │   ├── RealTimeSpiderIfindu.java

│   │   │   │   │   ├── RealTimeSpiderKouBei.java

│   │   │   │   │   ├── RealTimeSpiderLvren.java

│   │   │   │   │   ├── RealTimeSpiderLvye.java

│   │   │   │   │   ├── RealTimeSpiderLvyeOrg.java

│   │   │   │   │   ├── RealTimeSpiderLvzhou.java

│   │   │   │   │   ├── RealTimeSpiderMaFengWo.java

│   │   │   │   │   ├── RealTimeSpiderMy835.java

│   │   │   │   │   ├── RealTimeSpiderNf1799.java

│   │   │   │   │   ├── RealTimeSpiderNiwota.java

│   │   │   │   │   ├── RealTimeSpiderPinKe.java

│   │   │   │   │   ├── RealTimeSpiderQdClub.java

│   │   │   │   │   ├── RealTimeSpiderQuYou.java

│   │   │   │   │   ├── RealTimeSpiderSohu.java

│   │   │   │   │   ├── RealTimeSpiderSzBuDao.java

│   │   │   │   │   ├── RealTimeSpiderToursFor.java

│   │   │   │   │   ├── RealTimeSpiderTourye.java

│   │   │   │   │   ├── RealTimeSpiderUuyoyo.java

│   │   │   │   │   ├── RealTimeSpiderUzai.java

│   │   │   │   │   ├── RealTimeSpiderXyjt.java

│   │   │   │   │   ├── RealTimeSpiderYsr8848.java

│   │   │   │   │   └── RetrivePage.java

│   │   │   │   ├── TripAreaInfoSpider

│   │   │   │   │   ├── InfoSpiderCssn.java

│   │   │   │   │   └── InfoSpiderKuxun.java

│   │   │   │   ├── TripNewsSpider

│   │   │   │   │   ├── CecnNewSpiderTrip.java

│   │   │   │   │   ├── ChinaNewsSpiderTrip.java

│   │   │   │   │   ├── CncnNewsSpiderTrip.java

│   │   │   │   │   ├── CntaSpiderTrip.java

│   │   │   │   │   ├── CthyNewsSpiderTrip.java

│   │   │   │   │   ├── FjsenSpiderTrip.java

│   │   │   │   │   ├── GmwNewSpiderTrip.java

│   │   │   │   │   ├── GooTripSpiderTrip.java

│   │   │   │   │   ├── IucnSpiderTrip.java

│   │   │   │   │   ├── LoveTripSpiderTrip.java

│   │   │   │   │   ├── LvMamaSpiderTrip.java

│   │   │   │   │   ├── LvRenNewsSpiderTrip.java

│   │   │   │   │   ├── MiPangSpiderTrip.java

│   │   │   │   │   ├── NewsSpiderTrip.java

│   │   │   │   │   ├── QianLongSpiderTrip.java

│   │   │   │   │   ├── QQNewsSpider.java

│   │   │   │   │   ├── ShangDuSpiderTrip.java

│   │   │   │   │   ├── SpiderTrip163.java

│   │   │   │   │   ├── SpiderTripEu169.java

│   │   │   │   │   ├── TongChengSpiderTrip.java

│   │   │   │   │   ├── TuniuNewsSpiderTrip.java

│   │   │   │   │   ├── TvTourSpiderTrip.java

│   │   │   │   │   ├── WorkrCnSpiderTrip.java

│   │   │   │   │   ├── XinxinSpiderTrip.java

│   │   │   │   │   ├── YouXiaKeSpiderTrip.java

│   │   │   │   │   └── YouYoSpiderTrip.java

│   │   │   │   ├── TripNodesSpider

│   │   │   │   │   ├── ActiveclubNotesSpider.java

│   │   │   │   │   ├── BaiZusNotesSpider.java

│   │   │   │   │   ├── BecodTripNotesSpider.java

│   │   │   │   │   ├── BeiBaoNotesSpider.java

│   │   │   │   │   ├── BookHotelNotesSpider.java

│   │   │   │   │   ├── CcotsNotesSpider.java

│   │   │   │   │   ├── CncnNotesSpider.java

│   │   │   │   │   ├── CnuuNotesSpider.java

│   │   │   │   │   ├── Eu169NodesSpider.java

│   │   │   │   │   ├── FswxwsNotesSpider.java

│   │   │   │   │   ├── GoHuBeiNotesSpider.java

│   │   │   │   │   ├── IFengNotesSpider.java

│   │   │   │   │   ├── IlvPingNodesSpider.java

│   │   │   │   │   ├── IouterNotesSpider.java

│   │   │   │   │   ├── JiaYouNotesSpider.java

│   │   │   │   │   ├── LikefarNotesSpider.java

│   │   │   │   │   ├── LiuZhouNotesSpider.java

│   │   │   │   │   ├── LotourNotesSpider.java

│   │   │   │   │   ├── LotourTripNotesSpider.java

│   │   │   │   │   ├── LoveHwNotesSpider.java

│   │   │   │   │   ├── LvWoNotesSpider.java

│   │   │   │   │   ├── LvyChinaNotesSpider.java

│   │   │   │   │   ├── LvYouLuNotesSpider.java

│   │   │   │   │   ├── LzHwNotesSpider.java

│   │   │   │   │   ├── MangoCityNotesSpider.java

│   │   │   │   │   ├── NewXingZheNotesSpider.java

│   │   │   │   │   ├── NodesSpider163.java

│   │   │   │   │   ├── NoteSpiderTravel163.java

│   │   │   │   │   ├── NotesSpider17u.java

│   │   │   │   │   ├── NotesSpider19lou.java

│   │   │   │   │   ├── NotesSpider21Cn.java

│   │   │   │   │   ├── NotesSpider5166.java

│   │   │   │   │   ├── NotesSpider51766.java

│   │   │   │   │   ├── NotesSpider517HuWai.java

│   │   │   │   │   ├── NotesSpider571Holiday.java

│   │   │   │   │   ├── NotesSpider5zls.java

│   │   │   │   │   ├── NotesSpider7uu.java

│   │   │   │   │   ├── NotesSpider8246BBS.java

│   │   │   │   │   ├── NotesSpiderT960.java

│   │   │   │   │   ├── NotesSpiderTravel169.java

│   │   │   │   │   ├── OnlyLadyNotesSpider.java

│   │   │   │   │   ├── OutDoorsBbsNotesSpider.java

│   │   │   │   │   ├── QiangGenNotesSpider.java

│   │   │   │   │   ├── QuNarNotesSpider.java

│   │   │   │   │   ├── RedNetNotesSpider.java

│   │   │   │   │   ├── SfhwNotesSpider.java

│   │   │   │   │   ├── SinaNotesSpider.java

│   │   │   │   │   ├── SinzerNotesSpider.java

│   │   │   │   │   ├── SouthNotesSpider.java

│   │   │   │   │   ├── SyjLbNotesSpider.java

│   │   │   │   │   ├── TencentNotesSpider.java

│   │   │   │   │   ├── TraveBbsNotesSpider.java

│   │   │   │   │   ├── TravelQQNodesSpader.java

│   │   │   │   │   ├── TravelWuhanNotesSpider.java

│   │   │   │   │   ├── TrendsNodesSpider.java

│   │   │   │   │   ├── TripNodesSpider.zip

│   │   │   │   │   ├── TuniuTripNotesSpider.java

│   │   │   │   │   ├── TvtourNotesSpider.java

│   │   │   │   │   ├── UheNanNotesSpider.java

│   │   │   │   │   ├── UutuuNotesSpider.java

│   │   │   │   │   ├── UuyoyoNotesSpider.java

│   │   │   │   │   ├── UzaiNodesSpider.java

│   │   │   │   │   ├── YahooNotesSpider.java

│   │   │   │   │   ├── YjglNotesSpider.java

│   │   │   │   │   ├── ZctripNotesSpider.java

│   │   │   │   │   ├── ZouBarNotesSpider_2.java

│   │   │   │   │   └── ZouBarNotesSpider.java

│   │   │   │   └── TripTourSpider

│   │   │   │   ├── ByecityTourSpiderTrip.java

│   │   │   │   ├── CareTourSpiderTrip.java

│   │   │   │   ├── CncnTourSpiderTrip.java

│   │   │   │   ├── CnXianLuTourSpiderTrip.java

│   │   │   │   ├── CtripTourSpiderTrip.java

│   │   │   │   ├── KuXunTourSpiderTrip.java

│   │   │   │   ├── LvXingTourSpiderTrip.java

│   │   │   │   ├── MiPangTourSpiderTrip.java

│   │   │   │   ├── TuniuTourSpiderTrip.java

│   │   │   │   └── WuYiQiTourSpiderTrip.java

│   │   │   ├── conf.properties

│   │   │   ├── ext_stopword.dic

│   │   │   ├── IKAnalyzer.cfg.xml

│   │   │   ├── logback.xml

│   │   │   ├── result.txt

│   │   │   ├── scenic.dic

│   │   │   ├── SDIC.txt

│   │   │   └── SynonymWord.txt

│   │   └── test

│   │   └── TestCrawler

│   │   ├── CrawlerPhoneToDB.java

│   │   ├── startSpider.bak

│   │   ├── Test3.java

│   │   ├── TestAnalyzer.java

│   │   ├── Test.java

│   │   ├── TestStartNewsSpider.java

│   │   ├── TestStartSpider.java

│   │   └── URLEncoding.java

│   ├── 1798so

│   │   ├── src

│   │   │   ├── categoryCount

│   │   │   │   ├── BitDocSet.java

│   │   │   │   ├── BitSetCount.java

│   │   │   │   ├── BitSetIterator.java

│   │   │   │   ├── BitUtil.java

│   │   │   │   ├── DocIterator.java

│   │   │   │   ├── DocList.java

│   │   │   │   ├── DocSetHitCollector.java

│   │   │   │   ├── DocSet.java

│   │   │   │   ├── HashDocSet.java

│   │   │   │   ├── OpenBitSet.java

│   │   │   │   ├── Spindle.java

│   │   │   │   ├── Test1.java

│   │   │   │   └── TestPopCount.java

│   │   │   ├── chapter3

│   │   │   │   └── ip

│   │   │   │   ├── IPEntry.java

│   │   │   │   ├── IPLocation.java

│   │   │   │   ├── IPSeeker.java

│   │   │   │   ├── IPTest.java

│   │   │   │   ├── LogFactory.java

│   │   │   │   ├── Message.java

│   │   │   │   └── Util.java

│   │   │   ├── com

│   │   │   │   ├── bitmechanic

│   │   │   │   │   └── listlib

│   │   │   │   │   ├── HasNextTag.java

│   │   │   │   │   ├── HasNoResultsTag.java

│   │   │   │   │   ├── HasPrevTag.java

│   │   │   │   │   ├── HasResultsTag.java

│   │   │   │   │   ├── HasSuggestTag.java

│   │   │   │   │   ├── InitTagExtraInfo.java

│   │   │   │   │   ├── InitTag.java

│   │   │   │   │   ├── IteratePropTag.java

│   │   │   │   │   ├── IterateTag.java

│   │   │   │   │   ├── ListBaseBodyTag.java

│   │   │   │   │   ├── ListBaseTag.java

│   │   │   │   │   ├── ListContainer.java

│   │   │   │   │   ├── ListCreator.java

│   │   │   │   │   ├── NextLinkTag.java

│   │   │   │   │   ├── PrevLinkTag.java

│   │   │   │   │   ├── PropTag.java

│   │   │   │   │   └── RelatedTag.java

│   │   │   │   ├── lietu

│   │   │   │   │   ├── action

│   │   │   │   │   │   ├── FeedbackAction.java

│   │   │   │   │   │   └── SearchAction.java

│   │   │   │   │   ├── dao

│   │   │   │   │   │   ├── FeedbackDao.java

│   │   │   │   │   │   └── HotMessagesDao.java

│   │   │   │   │   ├── db

│   │   │   │   │   │   ├── Base64.java

│   │   │   │   │   │   ├── BasicDataSourceImpl.java

│   │   │   │   │   │   ├── DBManager.java

│   │   │   │   │   │   ├── IpCountList.java

│   │   │   │   │   │   ├── ManageUserInfo.java

│   │   │   │   │   │   ├── SearchCountList.java

│   │   │   │   │   │   └── SearchPlaceList.java

│   │   │   │   │   ├── filter

│   │   │   │   │   │   └── AdminLoginFilter.java

│   │   │   │   │   ├── hibernate

│   │   │   │   │   │   └── HibernateSessionFactory.java

│   │   │   │   │   ├── logmining

│   │   │   │   │   │   └── IPCounter.java

│   │   │   │   │   ├── model

│   │   │   │   │   │   ├── DIC_Province.hbm.xml

│   │   │   │   │   │   ├── DIC_Province.java

│   │   │   │   │   │   ├── DotmetrixInfo.hbm.xml

│   │   │   │   │   │   ├── DotmetrixInfo.java

│   │   │   │   │   │   ├── IpCount.hbm.xml

│   │   │   │   │   │   ├── IpCount.java

│   │   │   │   │   │   ├── SearchLogAnalysis.hbm.xml

│   │   │   │   │   │   ├── SearchLogAnalysis.java

│   │   │   │   │   │   ├── S_logining.hbm.xml

│   │   │   │   │   │   ├── S_logining.java

│   │   │   │   │   │   ├── Suggestions.java

│   │   │   │   │   │   └── TourInfo.java

│   │   │   │   │   ├── search

│   │   │   │   │   │   ├── ListDesc.java

│   │   │   │   │   │   └── RelatedEngine.java

│   │   │   │   │   └── tools

│   │   │   │   │   ├── CheckIP.java

│   │   │   │   │   ├── GetEncoding.java

│   │   │   │   │   ├── HighFreqTerms.java

│   │   │   │   │   ├── SearchByQuery.java

│   │   │   │   │   └── URLEncoding.java

│   │   │   │   └── test

│   │   │   │   ├── ExportDB.java

│   │   │   │   ├── HibernateUtils.java

│   │   │   │   ├── IP.java

│   │   │   │   ├── SearchLog.java

│   │   │   │   ├── test1.java

│   │   │   │   ├── TestIP.java

│   │   │   │   ├── Test.java

│   │   │   │   └── testNm.java

│   │   │   ├── conf.properties

│   │   │   ├── dbOperate

│   │   │   │   └── DBCon.java

│   │   │   ├── hibernate.cfg.xml

│   │   │   ├── logback.xml

│   │   │   ├── mysqldb.properties

│   │   │   └── struts.xml

│   │   └── WebRoot

│   │   ├── admin

│   │   │   ├── bottom.jsp

│   │   │   ├── menu.jsp

│   │   │   ├── searchCount.jsp

│   │   │   ├── searchIp.jsp

│   │   │   ├── searchPlace.jsp

│   │   │   ├── skip.jsp

│   │   │   └── top.jsp

│   │   ├── css

│   │   │   ├── calendar.js

│   │   │   ├── calendar-setup.js

│   │   │   ├── calendar-sys.css

│   │   │   ├── calendar-zh.js

│   │   │   ├── img

│   │   │   │   ├── beta.jpg

│   │   │   │   ├── calendar.gif

│   │   │   │   ├── edituser_2.gif

│   │   │   │   ├── edituser_3.gif

│   │   │   │   ├── favicon.ico

│   │   │   │   ├── home.gif

│   │   │   │   ├── logo.jpg

│   │   │   │   ├── search_index_active.png

│   │   │   │   ├── search_index_hotword.png

│   │   │   │   ├── search_index_input.png

│   │   │   │   ├── search_index_logo.png

│   │   │   │   ├── search_index_query.png

│   │   │   │   ├── search_indx_arrow.png

│   │   │   │   ├── search_sub_btm.png

│   │   │   │   ├── search_sub_down_go.png

│   │   │   │   ├── search_sub_top.png

│   │   │   │   ├── search_sub_up_go.png

│   │   │   │   ├── t01.jpg

│   │   │   │   ├── t02.jpg

│   │   │   │   ├── t03.jpg

│   │   │   │   ├── t04.jpg

│   │   │   │   ├── t05.jpg

│   │   │   │   └── t06.jpg

│   │   │   └── index.css

│   │   ├── failed.jsp

│   │   ├── feedback.jsp

│   │   ├── index.html

│   │   ├── index.jsp

│   │   ├── login.jsp

│   │   ├── META-INF

│   │   │   └── MANIFEST.MF

│   │   ├── result.jsp

│   │   ├── server.xml

│   │   ├── sub.html

│   │   ├── success.jsp

│   │   └── WEB-INF

│   │   ├── classes

│   │   │   ├── categoryCount

│   │   │   │   ├── BitDocSet$1.class

│   │   │   │   ├── BitDocSet.class

│   │   │   │   ├── BitSetCount.class

│   │   │   │   ├── BitSetIterator.class

│   │   │   │   ├── BitUtil.class

│   │   │   │   ├── DocIterator.class

│   │   │   │   ├── DocList.class

│   │   │   │   ├── DocSetBase.class

│   │   │   │   ├── DocSet.class

│   │   │   │   ├── DocSetHitCollector.class

│   │   │   │   ├── HashDocSet$1.class

│   │   │   │   ├── HashDocSet.class

│   │   │   │   ├── OpenBitSet.class

│   │   │   │   ├── Test1.class

│   │   │   │   └── TestPopCount.class

│   │   │   ├── chapter3

│   │   │   │   └── ip

│   │   │   │   ├── IPEntry.class

│   │   │   │   ├── IPLocation.class

│   │   │   │   ├── IPSeeker.class

│   │   │   │   ├── IPTest.class

│   │   │   │   ├── LogFactory.class

│   │   │   │   ├── Message.class

│   │   │   │   └── Util.class

│   │   │   ├── com

│   │   │   │   ├── bitmechanic

│   │   │   │   │   └── listlib

│   │   │   │   │   ├── HasNextTag.class

│   │   │   │   │   ├── HasNoResultsTag.class

│   │   │   │   │   ├── HasPrevTag.class

│   │   │   │   │   ├── HasResultsTag.class

│   │   │   │   │   ├── HasSuggestTag.class

│   │   │   │   │   ├── InitTag.class

│   │   │   │   │   ├── InitTagExtraInfo.class

│   │   │   │   │   ├── IteratePropTag.class

│   │   │   │   │   ├── IterateTag.class

│   │   │   │   │   ├── ListBaseBodyTag.class

│   │   │   │   │   ├── ListBaseTag.class

│   │   │   │   │   ├── ListContainer.class

│   │   │   │   │   ├── ListCreator.class

│   │   │   │   │   ├── NextLinkTag.class

│   │   │   │   │   ├── PrevLinkTag.class

│   │   │   │   │   ├── PropTag.class

│   │   │   │   │   └── RelatedTag.class

│   │   │   │   ├── lietu

│   │   │   │   │   ├── action

│   │   │   │   │   │   ├── FeedbackAction.class

│   │   │   │   │   │   └── SearchAction.class

│   │   │   │   │   ├── dao

│   │   │   │   │   │   ├── FeedbackDao.class

│   │   │   │   │   │   └── HotMessagesDao.class

│   │   │   │   │   ├── db

│   │   │   │   │   │   ├── Base64.class

│   │   │   │   │   │   ├── BasicDataSourceImpl.class

│   │   │   │   │   │   ├── DBManager.class

│   │   │   │   │   │   ├── IpCountList.class

│   │   │   │   │   │   ├── ManageUserInfo.class

│   │   │   │   │   │   ├── SearchCountList.class

│   │   │   │   │   │   └── SearchPlaceList.class

│   │   │   │   │   ├── filter

│   │   │   │   │   │   └── AdminLoginFilter.class

│   │   │   │   │   ├── hibernate

│   │   │   │   │   │   └── HibernateSessionFactory.class

│   │   │   │   │   ├── logmining

│   │   │   │   │   │   └── IPCounter.class

│   │   │   │   │   ├── model

│   │   │   │   │   │   ├── DIC_Province.class

│   │   │   │   │   │   ├── DIC_Province.hbm.xml

│   │   │   │   │   │   ├── DotmetrixInfo.class

│   │   │   │   │   │   ├── DotmetrixInfo.hbm.xml

│   │   │   │   │   │   ├── IpCount.class

│   │   │   │   │   │   ├── IpCount.hbm.xml

│   │   │   │   │   │   ├── SearchLogAnalysis.class

│   │   │   │   │   │   ├── SearchLogAnalysis.hbm.xml

│   │   │   │   │   │   ├── S_logining.class

│   │   │   │   │   │   ├── S_logining.hbm.xml

│   │   │   │   │   │   ├── Suggestions.class

│   │   │   │   │   │   └── TourInfo.class

│   │   │   │   │   ├── search

│   │   │   │   │   │   ├── ListDesc.class

│   │   │   │   │   │   └── RelatedEngine.class

│   │   │   │   │   └── tools

│   │   │   │   │   ├── CheckIP.class

│   │   │   │   │   ├── GetEncoding$CharType.class

│   │   │   │   │   ├── GetEncoding.class

│   │   │   │   │   ├── HighFreqTerms.class

│   │   │   │   │   ├── SearchByQuery.class

│   │   │   │   │   ├── TermInfo.class

│   │   │   │   │   ├── TermInfoQueue.class

│   │   │   │   │   └── URLEncoding.class

│   │   │   │   └── test

│   │   │   │   ├── ExportDB.class

│   │   │   │   ├── HibernateUtils.class

│   │   │   │   ├── IP.class

│   │   │   │   ├── SearchLog.class

│   │   │   │   ├── test1.class

│   │   │   │   ├── Test.class

│   │   │   │   ├── TestIP.class

│   │   │   │   └── testNm.class

│   │   │   ├── conf.properties

│   │   │   ├── dbOperate

│   │   │   │   └── DBCon.class

│   │   │   ├── hibernate.cfg.xml

│   │   │   ├── logback.xml

│   │   │   ├── mysqldb.properties

│   │   │   └── struts.xml

│   │   ├── c-rt.tld

│   │   ├── c.tld

│   │   ├── fmt-rt.tld

│   │   ├── fmt.tld

│   │   ├── jsp

│   │   │   ├── listlib.tld

│   │   │   └── pager-taglib.tld

│   │   ├── permittedTaglibs.tld

│   │   ├── scriptfree.tld

│   │   ├── server.xml

│   │   ├── sql-rt.tld

│   │   ├── sql.tld

│   │   ├── web.xml

│   │   ├── x-rt.tld

│   │   └── x.tld

│   └── readme.txt

└── mkse

├── 199801.txt

├── ahoCorasick

│   ├── POSInf.java

│   ├── SearchTrie.java

│   ├── StringSearch.java

│   ├── StringSearchResult.java

│   ├── Test.java

│   ├── TestSearch.java

│   └── TSTNode.java

├── analyzer

│   ├── CompanyAnalyzer.java

│   ├── ComTokenizer.java

│   ├── URLAnalyzer.java

│   └── UrlTokenizer.java

├── atomwords.txt

├── autoComplete

│   ├── SuggestTree.java

│   ├── TestSuggestTree.java

│   ├── Trie.java

│   └── TrieNode.java

├── basic

│   ├── BinarySearch.java

│   ├── CharType.java

│   ├── GoodsInfo.java

│   ├── LucenePhraseQuery.java

│   ├── Merge.java

│   ├── News.java

│   ├── SimpleHashSet.java

│   ├── SortSearch.java

│   ├── TestBasicBooleanQuery.java

│   ├── TestBooleanQ2.java

│   ├── TestBQNum.java

│   ├── TestFuzzyQuery.java

│   ├── TestMethod.java

│   ├── TestPrefixquery.java

│   ├── TestSpanQuery.java

│   ├── TestStringBuilder.java

│   ├── TestString.java

│   ├── TestWildcardquery.java

│   ├── URLEncoding.java

│   ├── WordCounter.java

│   └── WriteTextFile.java

├── bayes

│   ├── BayesClassifier.java

│   ├── FMMSegment.java

│   ├── PriorProbability.java

│   ├── StopWordsHandler.java

│   ├── TernarySearchTrie.java

│   └── TrainingData.java

├── bdb

│   ├── Berkeley.java

│   └── URLDB.java

├── bigramSeg

│   ├── AdjList.java

│   ├── CnToken.java

│   ├── CnTokenLinkedList.java

│   ├── Segmenter.java

│   ├── TernarySearchTrie.java

│   ├── TestAdjList.java

│   ├── TestSegmenter.java

│   └── WordEntry.java

├── bseg

│   ├── AtomTernarySearchTrie.java

│   ├── ChineseSpliter.java

│   ├── CnTokenizer.java

│   ├── TernarySearchTrie.java

│   └── TestDic.java

├── classify

│   ├── Categories.java

│   ├── CrawlerCategory.java

│   ├── Trie.java

│   ├── TrieNode.java

│   └── WordRelation.java

├── cnClassify

│   └── TernarySearchTrie.java

├── cnDep

│   ├── DependencyInstance.java

│   ├── DependencyRelation.java

│   ├── DepTree.java

│   ├── PartOfSpeech.java

│   ├── TermNode.java

│   ├── TestDep.java

│   ├── Token.java

│   ├── TreeInf.java

│   └── TreeNode.java

├── enDep

│   ├── GrammaticalRelation.java

│   ├── TermNode.java

│   ├── TestDep.java

│   ├── Token.java

│   ├── TreeConverter.java

│   ├── TreeInf.java

│   └── TreeNode.java

├── extract

│   ├── IDocument.java

│   ├── IFilter.java

│   └── TestPDF.java

├── extractDate

│   └── TestExtractDate.java

├── hmm

│   ├── HMMDecoder.java

│   ├── Node.java

│   ├── StateIDTable.java

│   ├── State.java

│   ├── StateTable.java

│   ├── Symbol.java

│   ├── SymbolList.java

│   └── SymbolTable.java

├── htmlParser

│   ├── ConnectionAccess.java

│   ├── db1.mdb

│   ├── FetchTable.java

│   ├── LoadDriver.java

│   ├── TestHtmlParser.java

│   ├── TestIFRAME.java

│   ├── TestReadData.java

│   └── TestStringParser.java

├── index

│   ├── Analyzer.java

│   ├── BuildSettings.java

│   ├── DatabaseConsumer.java

│   ├── DocConsumer.java

│   ├── DocumentData.java

│   ├── DocumentIndex.java

│   ├── Index.java

│   ├── IndexSearcher.java

│   ├── InvertedIndex.java

│   ├── PriorityQueue.java

│   ├── Query.java

│   ├── ScoreDoc.java

│   └── Scorer.java

├── java.policy.applet

├── jrip

│   ├── Antd.java

│   ├── ArffLoader.java

│   ├── Attribute.java

│   ├── AttributeLocator.java

│   ├── AttributeStats.java

│   ├── FastVector.java

│   ├── Filter.java

│   ├── Instance.java

│   ├── Instances.java

│   ├── JRip.java

│   ├── NominalAntd.java

│   ├── NumericAntd.java

│   ├── ProtectedProperties.java

│   ├── Queue.java

│   ├── RelationalLocator.java

│   ├── RipperRule.java

│   ├── Rule.java

│   ├── RuleStats.java

│   ├── Stats.java

│   ├── StringLocator.java

│   ├── TestJRip.java

│   └── Utils.java

├── linkAnalysis

│   ├── Matrix.java

│   ├── PageRank.java

│   └── StdArrayIO.java

├── luceneTest

│   ├── SynonymAnalyzer.java

│   └── TestSimple.java

├── newsExtract

│   ├── AdjList.java

│   ├── ContextStatDoc.java

│   ├── DicDoc.java

│   ├── DocSpan.java

│   ├── DocTagger.java

│   ├── DocTokenInf.java

│   ├── DocToken.java

│   ├── DocTokenLinkedList.java

│   ├── DocType.java

│   ├── DocTypes.java

│   ├── Entities.java

│   ├── Extractor.java

│   ├── IntHashMap.java

│   ├── NewsInfo.java

│   ├── TestTitle.java

│   └── UnknowGrammar.java

├── nlp

│   ├── InformationEnt.java

│   ├── StopWordsSet.java

│   ├── TBL.java

│   └── Translate.java

├── number

│   └── Test.java

├── org

│   └── json

│   ├── CDL.java

│   ├── Cookie.java

│   ├── CookieList.java

│   ├── HTTP.java

│   ├── HTTPTokener.java

│   ├── JSONArray.java

│   ├── JSONException.java

│   ├── JSONML.java

│   ├── JSONObject.java

│   ├── JSONStringer.java

│   ├── JSONString.java

│   ├── JSONTokener.java

│   ├── JSONWriter.java

│   ├── Test.java

│   ├── TestJSONArray.java

│   ├── XML.java

│   └── XMLTokener.java

├── package.html

├── package.html.bak

├── pageRank

│   ├── DirectedGraph.java

│   ├── Edge.java

│   ├── Page.java

│   ├── PageRank.java

│   ├── PageRankManager.java

│   ├── RankablePageFactory.java

│   └── RankablePage.java

├── parser

│   ├── Grammar.java

│   ├── NonTerminal.java

│   ├── NonTerminalProduction.java

│   ├── Parser.java

│   ├── Production.java

│   ├── RecursiveDescentParser.java

│   ├── ShiftReduceParser.java

│   ├── ShiftReduceParserTest.java

│   ├── Symbol.java

│   ├── Terminal.java

│   ├── TerminalProduction.java

│   ├── TimeFliesGrammarCNF.java

│   └── TimeFliesGrammar.java

├── poiExtract

│   ├── DocNode.java

│   ├── DocSpan.java

│   ├── DocType.java

│   ├── POIInfo.java

│   └── UnknowGrammar.java

├── posTagger

│   ├── Constant.java

│   ├── coreDict.txt

│   ├── PartOfSpeech.java

│   ├── POSSem.java

│   ├── POSTransFreq.txt

│   ├── Tagger.java

│   ├── TransProb.java

│   ├── WordTokenInf.java

│   └── WordTypes.java

├── price

│   └── TestParse.java

├── probSeg

│   ├── AdjList.java

│   ├── CalcProb.java

│   ├── CnToken.java

│   ├── CnTokenLinkedList.java

│   ├── Segmenter.java

│   ├── TernarySearchTrie.java

│   ├── TestAdjList.java

│   ├── TestSegResult.java

│   ├── TestTokenList.java

│   └── WordEntry.java

├── probTagger

│   ├── AdjList.java

│   ├── ContextStatDoc.java

│   ├── DicDoc.java

│   ├── DocSpan.java

│   ├── DocTagger.java

│   ├── DocTokenInf.java

│   ├── DocToken.java

│   ├── DocTokenLinkedList.java

│   ├── DocTypes.java

│   ├── DumpPOS.java

│   ├── PartOfSpeech.java

│   ├── POSNameMap.java

│   ├── TestContextStat.java

│   └── UnknowGrammar.java

├── queryLexer

│   ├── CharStream.java

│   ├── FastCharStream.java

│   ├── QueryParserConstants.java

│   ├── QueryParserSite.jj

│   ├── QueryParserTokenManager.java

│   ├── TestLexer.java

│   ├── Token.java

│   └── TokenMgrError.java

├── rangeSearch

│   ├── NumberUtils.java

│   └── TestDateSearch.java

├── rss

│   └── FeedReader.java

├── rule

│   ├── RuleClassifier.java

│   ├── Rule.java

│   └── rule.zip

├── scorer

│   ├── Binomial.java

│   ├── Plottable.java

│   ├── SciGraph.java

│   ├── TestBasicBooleanQuery.java

│   └── TestCoord.java

├── seg

│   ├── ChineseSpliter.java

│   ├── FMMSegmentC.java

│   ├── FMMSegment.java

│   ├── Segmenter.java

│   ├── TernarySearchTrieC.java

│   ├── TernarySearchTrie.java

│   ├── TestSegmenter.java

│   ├── TestSegSentence.java

│   ├── TestWordBreak.java

│   └── WordLinkedList.java

├── sentimentMiner

│   ├── OpinionGrammar.java

│   ├── OpinionSpan.java

│   └── OpinionType.java

├── simHash

│   ├── BitUtil.java

│   ├── CombinationGenerator.java

│   ├── MatterType.java

│   ├── package.html

│   ├── SimHashData.java

│   ├── SimHashSet4.java

│   ├── SimHashSet.java

│   ├── Span.java

│   └── TestSimHash.java

├── similarity

│   ├── LCS.java

│   └── LongestCommonSubsequence.java

├── simpleProbSeg

│   ├── Segmenter.java

│   ├── SuffixTrie.java

│   └── WordType.java

├── skipList

│   └── AndSkipList.java

├── spell

│   ├── DFAMinmal.java

│   ├── Distance.java

│   ├── levenshteinAutomata

│   │   ├── DFA.java

│   │   ├── NFA.java

│   │   ├── StateSet.java

│   │   ├── TestDFA.java

│   │   ├── Trie.java

│   │   └── TrieNode.java

│   ├── levenshteinAutomata.1.zip

│   ├── levenshteinAutomata.2.zip

│   ├── levenshteinAutomata.zip

│   └── TestJaro.java

├── spider

│   ├── BloomFilter.java

│   ├── ChangeIp.java

│   ├── CharsetTest.java

│   ├── ConcurrentSpider.java

│   ├── Entities.java

│   ├── ExtractPhone.java

│   ├── GetAllMp3.java

│   ├── GetInformation.java

│   ├── GetIPAddress.java

│   ├── Html2Text.java

│   ├── ImFeelingLucky2.java

│   ├── ImgResize.java

│   ├── IntHashMap.java

│   ├── MainPage.java

│   ├── ModifyDate.java

│   ├── MyCrawler.java

│   ├── package.html

│   ├── ReadImage.java

│   ├── RealURL.java

│   ├── RetrieveMp3.java

│   ├── RetrivePage.java

│   ├── SGet.java

│   ├── SHead.java

│   ├── SimpleBloomFilter.java

│   ├── SocketChannelSelector.java

│   ├── SocketHead.java

│   ├── spidergui.java

│   ├── SyDown.java

│   ├── TestCookie.java

│   ├── TestExtractURL.java

│   ├── TestURL.java

│   ├── TopicCrawler.java

│   ├── URLParser.java

│   └── URLSeen.java

├── statemachine

│   ├── FSMDate.java

│   ├── FSMTel.java

│   ├── Guard.java

│   ├── InputEvent.java

│   ├── MatchType.java

│   ├── State.java

│   ├── TelMatcher.java

│   ├── TestFSM.java

│   └── Transition.java

├── svm

│   └── Example.java

├── synonym

│   ├── MySimilarity.java

│   ├── SynonymAnalyzer.java

│   ├── SynonymAnalyzerTest.java

│   ├── SynonymPayloadFilter.java

│   ├── SynonymSearchTest.java

│   ├── TestFST.java

│   └── TestSynonymCoord.java

├── tbl

│   ├── PartOfSpeech.java

│   ├── RuleSet.java

│   └── TrieNode.java

├── trainHMM

│   ├── CorpusToDic.java

│   ├── CountPOS.java

│   ├── CountTrans.java

│   ├── PartOfSpeech.java

│   ├── Probability.java

│   ├── TestProbability.java

│   └── Word.java

├── trainUnknow

│   └── ExtractPersonName.java

├── trie

│   └── TelTrieSearch.java

├── trigramSeg

│   ├── AdjList.java

│   ├── CnToken.java

│   ├── CnTokenLinkedList.java

│   ├── Node.java

│   ├── Segmenter.java

│   ├── TernarySearchTrie.java

│   ├── TestAdjList.java

│   ├── TestSegmenter.java

│   └── WordEntry.java

├── ui

│   └── URLEncoding.java

├── unigrambigramSeg

│   ├── BigramMap.java

│   ├── Segmenter.java

│   ├── SuffixTrie.java

│   ├── TestBigramMap.java

│   ├── TestWordBigram.java

│   ├── WordBigram.java

│   └── WordType.java

├── UnigramDic.txt

├── unigramSeg

│   ├── Segmenter.java

│   ├── SuffixTrie.java

│   └── WordEntry.java

├── unknowRule

│   ├── AdjListDoc.java

│   ├── ContextStatDoc.java

│   ├── DicDoc.java

│   ├── DocDicTypes.java

│   ├── Doc.java

│   ├── DocSpan.java

│   ├── DocTagger.java

│   ├── DocTokenInf.java

│   ├── DocToken.java

│   ├── DocTokenLinkedList.java

│   ├── DocTypeInf.java

│   ├── DocType.java

│   ├── DocTypes.java

│   └── UnknowGrammarDoc.java

├── userRank

│   └── SlopeOne.java

├── viterbi

│   └── Viterbi.java

└── WordList.txt

532 directories, 3078 files

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值