综合技术
文章平均质量分 56
haha0515
这个作者很懒,什么都没留下…
展开
-
对mencache和tokyocabinet缓存的一点点遐想
mencache内存缓存。 tokyocabinet硬盘缓存。 当大家都在热衷于是用TC的时候,虽然速度不相上下。 但是大家有没有考虑到,电脑的I/O问题。 硬盘能不能长期承受TC的高速算法。 最近公司的新搜索框架上线以后,我们曾经把内存缓存,改成TC的硬盘缓存。 但是机器无缘无故在一周内,出现了多次硬盘故障问题。 TC的高速算法与硬盘的承受能力, 还有me...2009-09-22 11:46:57 · 130 阅读 · 0 评论 -
[转]中文分词入门之最大匹配法
中文分词在中文信息处理中是最最基础的,无论机器翻译亦或信息检索还是其他相关应用,如果涉及中文,都离不开中文分词,因此中文分词具有极高的地位。中 文分词入门最简单应该是最大匹配法了,当年师兄布置给我的第一个学习任务就是实现最大匹配法的分词算法(正向、逆向)。记得当时对自己参考学习最有帮助的 是北大詹卫东老师“中文信息处理基础”的课件和源程序,不过他实现的是mfc程序,词表存储在数据库里。自己...原创 2010-10-20 11:39:29 · 192 阅读 · 0 评论 -
【转】字符编码详解——彻底理解掌握编码知识,“乱码”不复存在
每一个程序员都不可避免的遇到字符编码的问题,特别是做Web开发的程序员,“乱码问题”一直是让人头疼的问题,也许您已经很少遇到“乱码”问 题,然而,对解决乱码的方法的内在原理,您是否明白?本人作为一个程序员,在字符编码方面同样遇到不少问题,而且一直对各种编码懵懵懂懂、不清不楚;在工 作中也曾经遇到一个很烦人的编码问题。这两天在网上收集了大量编码方面的资料,对字符编码算是理解的比较清楚了。下面把...原创 2010-09-20 15:15:44 · 256 阅读 · 0 评论 -
[转]字符编码笔记:ASCII,Unicode和UTF-8
今天中午,我突然想搞清楚Unicode和UTF-8之间的关系,于是就开始在网上查资料。 结果,这个问题比我想象的复杂,从午饭后一直看到晚上9点,才算初步搞清楚。 下面就是我的笔记,主要用来整理自己的思路。但是,我尽量试图写得通俗易懂,希望能对其他朋友有用。毕竟,字符编码是计算机技术的基石,想要熟练使用计算机,就必须懂得一点字符编码的知识。 1. ASCII码 我们知道,在计算机...原创 2010-09-20 15:08:44 · 102 阅读 · 0 评论 -
很是困惑,如何有效快速地选取分类器的样例测试文档?
如题,大家有什么好的高见,欢迎留言~~2010-09-15 17:38:25 · 101 阅读 · 0 评论 -
小工具--dos下批量生成文件
@echo off for /l %%i in (1,1,24) do cd.> D:\样例文档\%%i.txt cmd 简单生成一堆空文档!原创 2010-09-15 10:32:02 · 384 阅读 · 0 评论 -
【转】数据库中乐观锁与悲观锁的概念
前些日子在程序中用到select ... for update的语句,但是发觉,着语句用着就是不爽。感觉整个程序有点慢。郁闷之中,就找了点大学时候的概念好好恶补恶补。 ==================================================== 数据库中乐观锁与悲观锁的概念 锁( locking ) 业务逻辑的实现过程中,往往需要保证数据访问的排他性。如在...原创 2010-09-14 14:28:05 · 94 阅读 · 0 评论 -
【转】算法的时间复杂度(计算实例)
算法的时间复杂度 2007年12月02日 星期日 01:17 定义:如果一个问题的规模是n,解这一问题的某一算法所需要的时间为T(n),它是n的某一函数 T(n)称为这一算法的“时间复杂性”。 当输入量n逐渐加大时,时间复杂性的极限情形称为算法的“渐近时间复杂性”。 我 们常用大O表示法表示时间复杂性,注意它是某一个算法的时间复杂性。大O表示只是说有上界,由定义如果f(n...原创 2010-06-04 18:37:18 · 169 阅读 · 0 评论 -
Java SE 5服务周期已终结
转自InfoQ,作者 Charles Humble 译者 张龙 本月3日Sun的J2SE 5.0实现已终结服务周期(End of Service Life,即EOSL),这一天也是最后的一次5.0更新发布日期(J2SE 5.0 Update 22)。寻求Sun支持的用户可以选择升级到Java 6或是订阅Sun的 Java for Business 程序。 Su...原创 2009-11-21 12:28:16 · 130 阅读 · 0 评论 -
[转]java正则表达式匹配标点符号
str = str.replaceAll("[\\pP‘’“”]", ""); Unicode 编码并不只是为某个字符简单定义了一个编码,而且还将其进行了归类。\pP 其中的小写 p 是 property 的意思,表示 Unicode 属性,用于 Unicode 正表达式的前缀。大写 P 表示 Unicode 字符集七个字符属性之一:标点字符。其他六个是L:字母;M:标记符号(一般不会单独...原创 2013-08-15 10:30:38 · 2099 阅读 · 0 评论