排序:
默认
按更新时间
按访问量

solr中为pdf word excel等文档做索引和存诸时如何把回车空格等去掉

当用solr为pdf 或 word 或excel 等文件做索引时,当高亮时总会出现很多回车或空格占了很多空间,让搜索结果时长时短很不好看,而配设中又没有配置可以完成这项目功能,唯一可以实现的就是改源码! 我用的是solr4.7.2的源码去改,源码在以下网址找到 http://grepcode....

2015-10-20 17:45:19

阅读数:1124

评论数:0

孩子出事了,父母怎么能不管呢!

今天好像csdn的微博有点问题,我有一句就只能在这里说了!我觉得我们平时写的代码就像我们的孩子一样,孩子出事了,父母怎么能不管呢!      就算其它人不把我当成是一个科学家,但我自己还是把自己当成是一个科学家!      程序员写的程序,就应该像厨师对待自己做的每一道菜,像医生对待自己的病人...

2012-05-11 12:41:38

阅读数:505

评论数:0

纠结了一晚想到的东西

我们这些做网站项目的前期都要投入大量的钱和劳动去吸引眼球,先让用户习惯你的产品、觉得你的产品好用、有口碑、认同你项目的价值。然后再想办法搞资金循环。让项目越做越大。       在过去我所参与过的项目都是过份地强调前者而突略后者,我从事互联网已6年多。今天回想过去,不免会为某些东西觉得惋惜!...

2012-04-28 23:27:04

阅读数:562

评论数:0

最简单的json联级下拉框(我自己写的)

我在网上找了很多json与联级下拉框(父子下拉框)结合的例子,有的用jquery去实现,但我觉得不用那么复习,其实可以简单点的! 最简单的json联级下拉框 var json=[{"CS_Id":"1","CS_FileType"...

2011-12-18 19:11:24

阅读数:716

评论数:0

ThreadGroup其实比ExecutorService更好

用java做抓取的时候免不了要用到多线程的了,因为要同时抓取多个网站或一条线程抓取一个网站的话实在太慢,而且有时一条线程抓取同一个网站的话也比较浪费CPU资源。要用到多线程的等方面,也就免不了对线程的控制或用到线程池。…… 后来发现ExecutorService的功能没有想像中的那么好,而且最...

2011-04-18 01:39:00

阅读数:573

评论数:0

我的职业

<br />      程序员,程序员是干什么的呢?形像一点说就是:跟电脑沟通的人,把人家的工作或需求描述给电脑听,让电脑能自动帮我们工作、或自动帮我们按排一些事务。这个过程就叫做编程。 <br />      后来我终于明白,其实人生就是一个无止境的编程过程,一个不段地...

2011-04-14 11:45:00

阅读数:354

评论数:0

求职回想

<br /><br />    3月25日星期五傍晚,我从广州坐轻铁回珠海,由于太夜,珠海北站没有公车.于是我打的回香洲,回到香洲后也是由于太夜没有车回井岸。我决定先走一段路然后找一间旅馆来休息一下,其实我很享受一个闲逛的感觉,这样会让我的心情很平静,我从车站那一条路一直向...

2011-04-08 02:16:00

阅读数:430

评论数:0

几个NoSQL数据库的对比

<br /> <br />   随着云计算的推进,Key/value的NoSQL数据库开始受到业界的重视,但市面上有很多NoSQL的开<br />源项目,那究竟那一个NoSQL的数据库最适合你用呢?我们来看看下面的一些对比。<br /> <br...

2011-01-28 07:35:00

阅读数:894

评论数:0

我的java数据抓取经验

<br />本人担任职友集的java工程师五年,其中抓取数据占主要的一部分,抓取的信息只要有两部分,职位和简历,其中职位的抓取量为日均插入量为30万,更新量为60万,抓取全国300多个人才网站。职友集(现在改名为跳哪网)现在是全国职位量最高的垂直搜索引擎。月均广告收入约20万左右。当然...

2010-12-20 23:42:00

阅读数:1624

评论数:2

提示
确定要删除当前文章?
取消 删除
关闭
关闭