<rss version="2.0" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:trackback="http://madskills.com/public/xml/rss/module/trackback/" xmlns:wfw="http://wellformedweb.org/CommentAPI/" xmlns:slash="http://purl.org/rss/1.0/modules/slash/"><channel><title>黑马王子专栏 - 搜索引擎</title><link>http://blog.csdn.net/fzw98/category/358557.aspx</link><description /><dc:language>zh-CN</dc:language><lastUpdateTime>Fri, 18 Apr 2008 17:09:30 GMT</lastUpdateTime><ttl>60</ttl><item><dc:creator>黑马王子</dc:creator><title>Lucene倒排索引原理</title><link>http://blog.csdn.net/fzw98/archive/2008/01/21/2057115.aspx</link><pubDate>Mon, 21 Jan 2008 17:18:00 GMT</pubDate><guid>http://blog.csdn.net/fzw98/archive/2008/01/21/2057115.aspx</guid><wfw:comment>http://blog.csdn.net/fzw98/comments/2057115.aspx</wfw:comment><comments>http://blog.csdn.net/fzw98/archive/2008/01/21/2057115.aspx#Feedback</comments><slash:comments>0</slash:comments><wfw:commentRss>http://blog.csdn.net/fzw98/comments/commentRss/2057115.aspx</wfw:commentRss><trackback:ping>http://tb.blog.csdn.net/TrackBack.aspx?PostId=2057115</trackback:ping><description>Lucene是一个高性能的java全文检索工具包，它使用的是倒排文件索引结构。该结构及相应的生成算法如下：
　　
　&lt;img src ="http://blog.csdn.net/fzw98/aggbug/2057115.aspx" width = "1" height = "1" /&gt;</description></item><item><dc:creator>黑马王子</dc:creator><title>做SEO的学会了"釜底抽薪",你就等于掌握了SEO基本法则！</title><link>http://blog.csdn.net/fzw98/archive/2008/01/15/2045093.aspx</link><pubDate>Tue, 15 Jan 2008 13:37:00 GMT</pubDate><guid>http://blog.csdn.net/fzw98/archive/2008/01/15/2045093.aspx</guid><wfw:comment>http://blog.csdn.net/fzw98/comments/2045093.aspx</wfw:comment><comments>http://blog.csdn.net/fzw98/archive/2008/01/15/2045093.aspx#Feedback</comments><slash:comments>0</slash:comments><wfw:commentRss>http://blog.csdn.net/fzw98/comments/commentRss/2045093.aspx</wfw:commentRss><trackback:ping>http://tb.blog.csdn.net/TrackBack.aspx?PostId=2045093</trackback:ping><description>

	&amp;nbsp;　　大家好 今天上海SEO（SWJ）,为大家一起来探讨下SEO技术的关键，为什么不叫核心呢 因为SEO根本没有所谓的核心，其实。 　　而外面那些所谓的SEO核心SWJ认为就是：多做站 多实践 多积累 多学习！四多政策而已！而今天SWJ与大家探讨的SEO技术关键也只是一个框架与概念而已，但绝对不会是那种很含糊的 忽悠大家的内容！ 　　SEO需要“釜底抽薪”，只要你学会了这招 我想目前的搜索引擎来说是没什么问题的了特别是国内的SE，其实搞SEO的人，说难听点就是：”玩弄搜索引擎”而已，更多的靠自己的自觉与职业道德方面的约束，但在中国说这些等于放屁！在国外可能还可以！比较“绅士”一点把。 为什么那么多搞SEO的 却没一个站出来说话的 都是在闭门造车！当然“枪打出头鸟！”SWJ也是知道的 所以我只是会略微的告知大家一点道理 更多的靠自己去领悟！企业不是慈善机构更不是福利机构！百度更加如此! 百度不是就靠我们这些草根站长发达起来的嘛！（其中最重要的因素之一！） 　　好了SWJ说了那么多 还没教大家怎样来“釜底抽薪 玩弄百度”呢！ 　　在之前还请看一段SWJ自述：其实这个世界本&lt;img src ="http://blog.csdn.net/fzw98/aggbug/2045093.aspx" width = "1" height = "1" /&gt;</description></item><item><dc:creator>黑马王子</dc:creator><title>中文搜索引擎免费登录口</title><link>http://blog.csdn.net/fzw98/archive/2008/01/15/2044974.aspx</link><pubDate>Tue, 15 Jan 2008 12:19:00 GMT</pubDate><guid>http://blog.csdn.net/fzw98/archive/2008/01/15/2044974.aspx</guid><wfw:comment>http://blog.csdn.net/fzw98/comments/2044974.aspx</wfw:comment><comments>http://blog.csdn.net/fzw98/archive/2008/01/15/2044974.aspx#Feedback</comments><slash:comments>0</slash:comments><wfw:commentRss>http://blog.csdn.net/fzw98/comments/commentRss/2044974.aspx</wfw:commentRss><trackback:ping>http://tb.blog.csdn.net/TrackBack.aspx?PostId=2044974</trackback:ping><description>下面所有的登录口都可以登录，我都是亲自试过的。不像网上有很多的登录集合，有很多但大部分都是不能登录。想提高访问量的朋友可以去看看。&lt;img src ="http://blog.csdn.net/fzw98/aggbug/2044974.aspx" width = "1" height = "1" /&gt;</description></item><item><dc:creator>黑马王子</dc:creator><title>seo学习笔记</title><link>http://blog.csdn.net/fzw98/archive/2008/01/14/2043416.aspx</link><pubDate>Mon, 14 Jan 2008 15:05:00 GMT</pubDate><guid>http://blog.csdn.net/fzw98/archive/2008/01/14/2043416.aspx</guid><wfw:comment>http://blog.csdn.net/fzw98/comments/2043416.aspx</wfw:comment><comments>http://blog.csdn.net/fzw98/archive/2008/01/14/2043416.aspx#Feedback</comments><slash:comments>0</slash:comments><wfw:commentRss>http://blog.csdn.net/fzw98/comments/commentRss/2043416.aspx</wfw:commentRss><trackback:ping>http://tb.blog.csdn.net/TrackBack.aspx?PostId=2043416</trackback:ping><description>

	&amp;nbsp;　　1.域名影响 　　a.如果你所使用二级域名的主域名受到惩罚，那么你的网站也会受到牵连； 　　解决办法:可以注册顶级域名进行域名转发. 　　b.也可借用主域名资源,使排名快速提升 　　如:百度空间,Google Blogger 　　c.二级域名会影响主域名的PR值,使用主域名的二级域名来提升PR值. 　　2.seo中心策略:关键词优化 　　关键词分析: 　　a.分析各大搜索门户风向标数据 　　http://top.baidu.com/ 　　http://cn.buzz.yahoo.com/bd_index_top.html 　　http://www.google.cn/rebang/home 　　http://www.sogou.com/top/ 　　b.让客户提供他们曾经搜索的关键字 　　c.查看日志,分析用户行为 　　关键词选择: 　　a.将关键词扩展成一系列词组，如：人参→长白山人参→长白山人参价格。 　　b.将关键词进行多重排列组合 　　组合的方式有：同义词、拼错词、拼音、位置颠倒、增加辅助词等。 　　实例： 　　越狱 -&amp;gt;《越狱》 ：关键词增加引号&lt;img src ="http://blog.csdn.net/fzw98/aggbug/2043416.aspx" width = "1" height = "1" /&gt;</description></item><item><dc:creator>黑马王子</dc:creator><title>Lucene使用项向量进行模糊查询</title><link>http://blog.csdn.net/fzw98/archive/2008/01/14/2043361.aspx</link><pubDate>Mon, 14 Jan 2008 14:46:00 GMT</pubDate><guid>http://blog.csdn.net/fzw98/archive/2008/01/14/2043361.aspx</guid><wfw:comment>http://blog.csdn.net/fzw98/comments/2043361.aspx</wfw:comment><comments>http://blog.csdn.net/fzw98/archive/2008/01/14/2043361.aspx#Feedback</comments><slash:comments>0</slash:comments><wfw:commentRss>http://blog.csdn.net/fzw98/comments/commentRss/2043361.aspx</wfw:commentRss><trackback:ping>http://tb.blog.csdn.net/TrackBack.aspx?PostId=2043361</trackback:ping><description>

	　　TermVector是Lucene 1.4新增的 它提供一种向量机制来进行模糊查询,TermVector保存Token.getPositionIncrement() 和Token.startOffset() 以及Token.endOffset() 信息. 　　 　　Field.TermVector.NO:不保存term vectors 　　Field.TermVector.YES:保存term vectors 　　Field.TermVector.WITH_POSITIONS:保存term vectors.(保存值和token位置信息) 　　Field.TermVector.WITH_OFFSETS:保存term vectors.(保存值和Token的offset) 　　Field.TermVector.WITH_POSITIONS_OFFSETS:保存term vectors.(保存值和token位置信息和Token的offset) 　　 　　下面是个简单的例子: 　　Analyzer analyzer = new StandardAnalyzer(); 　　 　　RAM&lt;img src ="http://blog.csdn.net/fzw98/aggbug/2043361.aspx" width = "1" height = "1" /&gt;</description></item><item><dc:creator>黑马王子</dc:creator><title>Lucene使用项向量提高高亮显示性能</title><link>http://blog.csdn.net/fzw98/archive/2008/01/14/2043356.aspx</link><pubDate>Mon, 14 Jan 2008 14:44:00 GMT</pubDate><guid>http://blog.csdn.net/fzw98/archive/2008/01/14/2043356.aspx</guid><wfw:comment>http://blog.csdn.net/fzw98/comments/2043356.aspx</wfw:comment><comments>http://blog.csdn.net/fzw98/archive/2008/01/14/2043356.aspx#Feedback</comments><slash:comments>0</slash:comments><wfw:commentRss>http://blog.csdn.net/fzw98/comments/commentRss/2043356.aspx</wfw:commentRss><trackback:ping>http://tb.blog.csdn.net/TrackBack.aspx?PostId=2043356</trackback:ping><description>

	&amp;nbsp;　　Lucene增加高亮显示后结果更高明显了,但是返回结果的速度比较慢.原因是Lucene做每一篇文档的相关关键词的高亮显示时,在运行时执行了很多遍的分词操作,降低了性能. 　　TermVector保存Token.getPositionIncrement() 和Token.startOffset() 以及Token.endOffset() 信息。利用Lucene中新增加的Token信息的保存结果以后，就不需要为了高亮显示而在运行时解析每篇文档。通过Field方法控制是否保存该信息 　　 　　public void searcher() throws IOException{ 　　 　　IndexReader reader = IndexReader.open(directory); 　　 　　IndexSearcher searcher = new IndexSearcher(directory); 　　 　　TermQuery query = new TermQuery(new Term("subject","java")); 　　 　　Hits hits = s&lt;img src ="http://blog.csdn.net/fzw98/aggbug/2043356.aspx" width = "1" height = "1" /&gt;</description></item><item><dc:creator>黑马王子</dc:creator><title>教你使用solr搭建你的全文检索</title><link>http://blog.csdn.net/fzw98/archive/2008/01/14/2043350.aspx</link><pubDate>Mon, 14 Jan 2008 14:43:00 GMT</pubDate><guid>http://blog.csdn.net/fzw98/archive/2008/01/14/2043350.aspx</guid><wfw:comment>http://blog.csdn.net/fzw98/comments/2043350.aspx</wfw:comment><comments>http://blog.csdn.net/fzw98/archive/2008/01/14/2043350.aspx#Feedback</comments><slash:comments>0</slash:comments><wfw:commentRss>http://blog.csdn.net/fzw98/comments/commentRss/2043350.aspx</wfw:commentRss><trackback:ping>http://tb.blog.csdn.net/TrackBack.aspx?PostId=2043350</trackback:ping><description>

	&amp;nbsp;　　Solr 是一个可供企业使用的、基于 Lucene 的开箱即用的搜索服务器。对Lucene不熟？那么建议先看看下面两篇文档： 　　实战Lucene，第 1 部分： 初识 Lucene：http://www.ibm.com/developerworks/cn/java/j-lo-lucene1/ 　　用Lucene加速Web搜索应用程序的开发：http://www.ibm.com/developerworks/cn/web/wa-lucene2/ 　　一、 solr介绍 　　solr是基于Lucene Java搜索库的企业级全文搜索引擎，目前是apache的一个项目。它的官方网址在http://lucene.apache.org/solr/ .solr需要运行在一个servlet 容器里，例如tomcat5.5.solr在lucene的上层提供了一个基于HTTP/XML的Web Services，我们的应用需要通过这个服务与solr进行交互。 　　二、 solr安装和配置 　　关于solr的安装和配置，这里也有两篇非常好的文档，作者同时也是 Lucene Java&lt;img src ="http://blog.csdn.net/fzw98/aggbug/2043350.aspx" width = "1" height = "1" /&gt;</description></item><item><dc:creator>黑马王子</dc:creator><title>Lucene1.4与Lucene2.0的Field</title><link>http://blog.csdn.net/fzw98/archive/2008/01/14/2043268.aspx</link><pubDate>Mon, 14 Jan 2008 14:01:00 GMT</pubDate><guid>http://blog.csdn.net/fzw98/archive/2008/01/14/2043268.aspx</guid><wfw:comment>http://blog.csdn.net/fzw98/comments/2043268.aspx</wfw:comment><comments>http://blog.csdn.net/fzw98/archive/2008/01/14/2043268.aspx#Feedback</comments><slash:comments>0</slash:comments><wfw:commentRss>http://blog.csdn.net/fzw98/comments/commentRss/2043268.aspx</wfw:commentRss><trackback:ping>http://tb.blog.csdn.net/TrackBack.aspx?PostId=2043268</trackback:ping><description>

	&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp; Field的改进 　　Lucene1.4主要提供下列四种不同类型的Field: 　　Keyword,UnStored,UnIndexed,Text 　　在Lucene2.0中是通过三个内部类Field.Index,Field.Store,Field.termVector(项向量)的组合来区分Field的具体类型.具体如下: 　　Field.Store.COMPRESS:压缩保存,用于长文本或二进制数据 　　Field.Store.YES:保存 　　Field.Store.NO:不保存 　　Field.Index.NO:不建立索引 　　Field.Index.TOKENIZED:分词,建索引 　　Field.Index.UN_TOKENIZED:不分词,建索引 　　Field.Index.NO_NORMS:不分词,建索引.但是Field的值不像通常那样被保存，而是只取一个byte，这样节约存储空间 　　Field.TermVector.NO:不保存term vectors 　　Field.Ter&lt;img src ="http://blog.csdn.net/fzw98/aggbug/2043268.aspx" width = "1" height = "1" /&gt;</description></item><item><dc:creator>黑马王子</dc:creator><title>我是如何空手套百度的</title><link>http://blog.csdn.net/fzw98/archive/2008/01/10/2033131.aspx</link><pubDate>Thu, 10 Jan 2008 10:03:00 GMT</pubDate><guid>http://blog.csdn.net/fzw98/archive/2008/01/10/2033131.aspx</guid><wfw:comment>http://blog.csdn.net/fzw98/comments/2033131.aspx</wfw:comment><comments>http://blog.csdn.net/fzw98/archive/2008/01/10/2033131.aspx#Feedback</comments><slash:comments>0</slash:comments><wfw:commentRss>http://blog.csdn.net/fzw98/comments/commentRss/2033131.aspx</wfw:commentRss><trackback:ping>http://tb.blog.csdn.net/TrackBack.aspx?PostId=2033131</trackback:ping><description>

	&amp;nbsp;　　这是一个难以想象的话题，因为之前要不是有人提示了我，我也想不起来，”百度空间”这个名字所有站长可能都很熟悉，曾经几乎都调戏过这么一位纯洁而幼小的孩子。记得经常听人说起：打不过你，我打你儿子。这句话很经典，也很真实。那好站长们你们总说百度欺负你们，那你们有没有想过反抗?有的话，今天我们就来欺负一下他的儿子。 　　玩百度的高火时期是在一个假期的每个夜晚，记得那时有个连续剧“18禁不禁”貌似很火，闲来无事就复制了一份并做了点手脚放在了自己的空间里，三天之后发现流量从10几个一下子狂飑到一万多!这是我玩空间所感觉到最自豪的一个数字。难道统计错了?没有我看过了，我也相信网民。既然没错那我们就来分析下这个流量如何来的。 　　流量的来路： 　　我一直记得百度有“搜索风云榜”由于自己无聊所以对什么东西都感兴趣!总是靠着这个风云榜来从百度有事没事偷点流量，如果大家有时间的话，我见意大家仔细了解和研究百度，把它当作一个软件来学习研究，下面将有两种从百度弄流量的方式，如果你有更好的方式，欢迎发表更强的补充文章。 　　混杂式： 　　这个方式很好搞，你只要盯着“搜索风云榜”只做上过榜的关&lt;img src ="http://blog.csdn.net/fzw98/aggbug/2033131.aspx" width = "1" height = "1" /&gt;</description></item><item><dc:creator>黑马王子</dc:creator><title>Google十大 搜索秘技</title><link>http://blog.csdn.net/fzw98/archive/2008/01/10/2033004.aspx</link><pubDate>Thu, 10 Jan 2008 09:21:00 GMT</pubDate><guid>http://blog.csdn.net/fzw98/archive/2008/01/10/2033004.aspx</guid><wfw:comment>http://blog.csdn.net/fzw98/comments/2033004.aspx</wfw:comment><comments>http://blog.csdn.net/fzw98/archive/2008/01/10/2033004.aspx#Feedback</comments><slash:comments>0</slash:comments><wfw:commentRss>http://blog.csdn.net/fzw98/comments/commentRss/2033004.aspx</wfw:commentRss><trackback:ping>http://tb.blog.csdn.net/TrackBack.aspx?PostId=2033004</trackback:ping><description>

	&amp;nbsp;　　以下文章为译索网(elanso.com)翻译提供。 　　也许你已经知道了搜索指定网站内容的技巧，比如“site:jandan.net gmail”(搜索内容不包括引号，下同)是在煎蛋搜索有关 gmail 的内容;但是 Google 总是强大到我们难以想象，以下这些诀窍你很可能未曾听说： 　　10、获取任意地点的当前时间 　　曾经我电脑时间不准的时候，去常泡的论坛回个贴，然后根据回帖的显示时间来对时。其实不用这么麻烦的，你只要用“what time is it”跟所在城市搜索就行了。比如我搜索深圳现在几点，“what time is it shenzhen”，得到的提示是： 　　10:14 AM Thursday (CST) - Time in Shenzhen, China 　　 　　 　　9、查询航班状态 　　输入航班号即可。 　　 　　 　　8、计算货币及度量 　　格式为“数额”“币种”in“目标币种”，比如要查询100元人民币可兑换多少美元，就用 Google 搜索“100 rmb in u.s. dollar”，返回结果为： 　　100 Chinese &lt;img src ="http://blog.csdn.net/fzw98/aggbug/2033004.aspx" width = "1" height = "1" /&gt;</description></item></channel></rss>