自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

推荐两本Java书籍【计算机操作系统】【Java并发编程实战】

吐槽:现在所谓的java工程师太水,一般都是培训机构出来的。 做web的只会写什么ifelse业务代码。或者干脆实施web一起干。。 最近被项目总监好好的上了一课。。。,认真拜读【Java并发编程实战】中。。闭关一个月。。勿扰。推荐两本书最近在看的书:1:大学教材:【计算机操作系统】 2:【Java并发编程实战】...

2015-03-28 17:18:00 162

用Stanford Parse(智能语言处理)去实现分词器

昨天研究学习了一下Stanford Parse ,想利用Stanford Parse 智能切词的效果结合到lucene 分词器中的想法;由于项目时间仓促,部分研究没有完成。代码还存在bug,希望有这方面想法的小伙伴们,能完善。。 lucene版本:lucene4.10.3,引入jar包:stanford-parser-3.3.0-models.jar ,stanford-parser.j...

2015-03-26 12:03:00 159

试用Stanford Parser处理中文语句

最近在研究一段时间的NLP。。试用Stanford Parser初体验。。 先说下本人对语义这一块看法,欢迎打脸。。个人感觉国内很多此类方向的研究,方向和技术层面确实很先进,但真正不能实际应用到项目中。很多只是个噱头罢了。上一次研究的Ontology的语义检索。。就当学习吧。 Stanford Parser 最新版本下载地址:http://nlp.stanford.edu/sof...

2015-03-26 11:34:00 350

解决solr4.x搭建ik不能智能分词

下载IKAnalyzer-2012FF_hf1之后。与solr4.x匹配,但其文档中介绍的useSmart一直无法使用和生效。schema配置如下:<span style="font-size:14px;"> <!--配置IK分词器--> <fieldType name="text_ik" class="solr.TextField"> ..

2015-03-24 17:13:00 271

2015年4月3日,北京欢迎你!致:胡慧清(胡慧超的姐姐)!

老姐要来北京玩咯,看望下苦逼的北漂弟弟。。2015年4月3日,北京欢迎你!致:胡慧清(胡慧超的姐姐)!百度头条表示热烈欢迎,热烈!!

2015-03-20 16:01:00 127

nutch的定时增量爬取

译文来着:http://wiki.apache.org/nutch/Crawl介绍(Introduction)注意:脚本中没有直接使用Nutch的爬去命令(bin/nutch crawl或者是“Crawl”类),所以url过滤的实现并不依赖“conf/crawl-urlfilter.txt”,而是应该在“regex-urlfilter.txt”中设定实现。爬取步骤(Steps)...

2015-03-19 16:55:00 70

不在JPA 的 persistence.xml 文件中配置Entity class的解决办法

在Spring 集成 Hibernate 的JPA方式中,需要在persistence配置文件中定义每一个实体类,这样非常地不方便,2种方法可以解决此问题:这2种方式都可以实现不用在persistence.xml文件中配置每一个实体类,从而免去每个Entity都要在persistence.xml文件中配置的烦恼,但是这种方式Entity实体类的主键字段注解@ID要放到 getXXX()...

2015-03-19 10:08:00 118

爬虫nutch

爬虫,基本可以分三类: 1.分布式爬虫:Nutch 2.JAVA单机爬虫:Crawler4j、WebMagic、WebCollector 3. 非JAVA单机爬虫:scrapy Nutch:分布式爬虫 nutch背景:Apache基金会Hadoop之父Doug Cutting,发起开源项目lucene、nutch、hadoop,同时在hadoop领域称之had...

2015-03-18 19:36:00 174

软件工程师的属性与发展

工作近十年了,[软件工程师] 一直是我职业 title 的中心词,只是前面的修饰语在不断变化,从初级、中级、高级到资深。 其实 [软件工程师] 是一个很泛化的定义,工作现实中软件工程师是被具体分工的,形成了具体定义的工程师。定义软件工程师是下面这些具体工程师的总体概括:开发工程师测试工程师UI工程师(又称设计师)产品工程师(虽然现在多称产品经理,但实际的工作内容更偏...

2015-03-16 15:36:00 218

Nutch相关框架安装使用最佳指南

一、nutch1.2二、nutch1.5.1三、nutch2.0四、配置SSH五、安装Hadoop Cluster(伪分布式运行模式)并运行Nutch六、安装Hadoop Cluster(分布式运行模式)并运行Nutch七、配置Ganglia监控Hadoop集群和HBase集群八、Hadoop配置Snappy压缩九、Hadoop配置Lzo压缩十、配置zookeeper集群以运行hbase十一、配置...

2015-03-13 17:57:00 103

Solr 地理空间搜索实践(Spatial Search)

在移动开发中越来越多的App都有周边搜索,有找附近的人的,附近的酒店,附近的餐馆的。。越来越多的人和企业都使用位置感知的搜索服务。创建位置感知搜索服务通常属于昂贵的专用解决方案的一部分,并且一般由地理空间专家完成。。本文实现了搜索服务器solr的地理感知这批数据。 构建一个常见的业务场景: 搜索周边5KM以内的宾馆,且按照距离排序。 利用Solr来实现空间...

2015-03-10 14:18:00 358

P2P模式:房产抵押借款如何运营

当下,以P2P网贷为代表的互联网金融火爆,但逾期、坏账的频发也让该理财途径饱受煎熬。此时,含有易于变现抵押品的低风险产品成为P2P投资者的首选,一些嗅觉灵敏的P2P平台也不失时机地推出诸多房产抵押借款项目。投资期限从1个月到1年不等,募集金额为数十万元至上千万元不等,年化收益率大约在15%左右。据某P2P平台的负责人介绍,该平台近日发了一个融资金额为50万的房产抵押标,在不到两分钟的时...

2015-03-06 11:07:00 225

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除