- 博客(8)
- 资源 (2)
- 收藏
- 关注
原创 ansj词典加载及简要分词过程
粗略看了点ansj源代码,记录备忘。 词典等配置文件加载类(以调用NlpAnalysis分词类为例):1, MyStaticValue初始化NlpAnalysis中static的静态变量splitword时调用了MyStaticValue类,该类中几乎所有变化、方法均是静态的。包括以ResourceBundle.getBundle("library")获取library.pr...
2015-07-03 09:38:23 483
原创 struts理解
找工作的时候老是会被问java框架熟悉吗,用哪个框架等等。表示我没用到过,趁现在闲着来粗粗学习下。 struts源码重要的两个部分是core和xwork-core,前者依赖后者。使用struts有两个配置文件很重要,struts.xml和web-inf/web.xml。struts.xml配置struts的package/action等。org.apache.struts2.co...
2014-01-07 14:29:17 118
原创 使用thrift执行跨语言的远程过程调用
thrift是个跨语言的远程过程调用(RPC)服务,支持client和server以多种语言通讯。 可以在源代码lib/java中获得jar包。代码、接口示例可参考thrift源代码中的tutorial/tutorial.thrift,tutorial/java。使用: 一、定义接口IDL:xxx.thrift。支持的数据类型有:bool;byte: 有符号字节;i16...
2013-12-03 13:58:05 332
原创 【转载】Mongodb VS Hbase
转载自http://hi.baidu.com/i1see1you/item/783a701f39a87549e75e06ea1.Mongodb bson文档型数据库,整个数据都存在磁盘中,hbase是列式数据库,集群部署时每个familycolumn保存在单独的hdfs文件中。2.Mongodb 主键是“_id”,主键上面可以不建索引,记录插入的顺序和存放的顺序一样,hbase的主键就...
2013-12-02 21:26:50 145
原创 java itext解析pdf
解析pdf的java开源包有itext、pdfbox、xpdf等。据说pdfbox对中文支持不好,xpdf是用命令行调用,还一堆七七八八的配置,没用过。itext一般来说是生成pdf比较容易,解析比较麻烦,效果感觉还是可以的。但是。 标准pdf文件是根据pdf规范设计的。pdf文件中的文字、页面、页眉页脚、图、线等都是一个个对象。总的来说就是一个pdf对应一个文档,文档中有若干页...
2013-12-02 21:03:57 787
原创 junit几点
junit.framework与org.juint.1.对testcase,junit.framework是junit3的写法,org.unit是junit4的写法。2.junit.framework。测试类继承自TestCase,函数名固定setUp()、tearDown()、testXXXX()....org.unit,@Before、@After、@Testjunit.frame...
2013-12-02 15:12:31 144
原创 java解析html
java有很多解析html的开源包,有htmlparser、cobra、jsoup、html4j、htmlclean等,http://www.open-open.com/30.htm 项目中使用的是cobra,其他的没用过。cobra能解析javascript和css,项目中没有用这两项,也没研究过这块的代码。也是因为支持这些,如果不禁用,会占用相当大的内存,比如每个节点都会含有...
2013-11-28 15:53:32 137
原创 jdk安装
发现电脑上木有jdk/jre了,重新下了个jdk。 第一次仔细看jdk的安装过程,开发工具+源代码+独立运行的jre 以前也不曾好好看过安装过后都有些什么,也纠结过为什么明明只装了1次jdk,会有多个jre呢?是不是装其他软件的时候被安装的.... 其实安装jdk是会装两个jre的,一个在jdk目录下,一个在其他地址,默认C盘,是jdk本身java程序运行的j...
2013-11-27 10:49:23 89
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人