- 博客(4)
- 资源 (9)
- 收藏
- 关注
转载 判断一个char*是不是utf8编码
原文链接: http://www.cppblog.com/izualzhy/archive/2012/12/03/195933.html这里我修改了一下, 纯ASCII编码的字符串也返回true, 因为UTF8和ASCII兼容int utf8_check(const char* str, size_t length) { size_t i; int nBytes; u
2016-07-17 22:42:40 3140
原创 lucene学习记录(3) - 结果排序, 范围查询
前言推荐Lucene文章, 也是本人上一篇博客里提到的这次是系列文章>, 传送门结果排序应业务需求, 要把上一篇文章中的结果按照排序(文字的发布时间)所以Document要增加一个time字段对于时间上的比较, 本人倾向于用时间戳, 毕竟文本的表达方式比较起来效率不高SO, 规定time为long型, 意义为unixTime然后在search的时候f
2016-07-06 13:37:13 3593 1
原创 lucene学习记录(2) - 实时索引,中文分词
实时索引在lucene中, Directory和IndexWriter都是线程安全的, IndexReader也是但reader不能实时反应writer的修改, 必须重新打开reader才可以目前本人采用的办法是每次都打开一个新的reader, 虽然效率上会受影响但目前数据量也就是在5W以内, 且索引在内存中, 尚可接受中文分词自带的StandardAnalyzer对于中文
2016-07-03 23:34:56 1586
原创 lucene学习记录(1) - 初识神器
在内存中建立索引, 90W条数据占用约1.5G内存public class AppInst { private static AppInst ourInstance = new AppInst(); public static AppInst getInstance() { return ourInstance; } private AppI
2016-07-01 17:35:15 601 1
RSA加解密实现,修改自RSAEuro
2014-09-06
Linux中CodeBlocks开发环境全套RPM包
2011-12-05
IOCP封装类,用VC6.0封装的
2011-02-08
自己实现的IOCP封装类
2011-02-04
VC助手1738破解版
2010-08-31
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人