- 博客(2)
- 资源 (5)
- 收藏
- 关注
原创 利用PDFBox读取pdf文件文本
PDFBox下载地址:http://sourceforge.net/projects/pdfbox/postdownload?source=dlp 解压下载到的rar .拿到源码中bin文件夹下的 四个dll IKVM.GNU.Classpath.dll IKVM.Runtime.dll PDFBox-0.7.3.dll FontBox-0.1.0-dev.dll 在使
2014-01-22 17:42:20 1446
原创 中文 “着”与“著”
在中文分词过程中遇到的问题,现在总结一下 ”著名“ 转为简体之后变成了“着名” 先介绍一下什么叫通假字? 通假字是有本字的假借,也叫通借字或同音字,是古人书写某词时,没有写本字,而是借了一个音同或音近的字来代替。如早晨的“早”写成了“蚤”。“蚤”的本义是跳蚤,因为二者声音相同而得以通用。对于这种通假字,古书注解一般用“通”或“读为”、“读曰”来表示。“通”或“读为”、“读曰”前的字是通
2014-01-10 14:11:46 1475
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人