- 博客(9)
- 资源 (10)
- 收藏
- 关注
原创 KTDictSeg 分词组件1.3版本 新增功能列表及下载位置
1、 修改字典格式,提高字典加载速度 2、 增加对英文专业名词的支持 如C++,C#等只要加入字典就可以被分出来 3、 增加词频判断功能,在无法取舍时根据词频取舍 4、 增加优先优先词频选项,通过这个选项动态决定分词粒度 需打开 FreqFirst 5、 增加中文人名前后缀统计和根据该统计定位人名的功能 6、 增加中文人名和未登录词出现频率统计功能 7、 增加自
2008-05-30 08:25:00
1794
12
原创 KTDictSeg 分词组件1.3版本 部分算法讨论 -- 中文姓名识别和未登录词识别
作者 肖波 中文姓名识别和未登录词识别是中文分词中的难点,具体为什么是难点,很多文章都有叙述,这里不再多讲。主要介绍一下 1.3版本是如何对中文姓名和未登录词进行识别的。 中文姓名识别 中文姓名千变万化,我们不可能在字典中把所有的中文人名都列出来。1.2版本对中文人名进行了比较复杂的判断,但效果依然不理想。所以1.3版本干脆简化 了算法。1.3版本的算法主要基于中文人名的前
2008-05-30 07:37:00
1376
原创 KTDictSeg 分词组件1.3版本 部分算法讨论 -- 分词粒度
作者:肖波 KTDictSeg 分词组件1.3版本已经接近完成,只剩下最后的一点功能。在KTDictSeg 分词组件1.3版本的开发过程中,得到了很多朋友的关注和支持,特别是一些分词方面的专家提出了很多很好的意见,也对我的分词算法给出了很多中肯的建议, 在此向他们表示由衷的感谢。1.3版本的预分词算法还是沿用了之前版本的变相的最大匹配算法,这个算法有着本质的缺陷,未来的2.0版本可能会
2008-05-30 07:36:00
1157
2
原创 通过编程管理windows 防火墙
作者:肖波 最近项目中需要通过程序自动设置windows 防火墙,查了一下资料,可以通过命令行netsh firewall来实现。封装了一个类来实现对允许放开的程序(Allowed program)进行管理。管理其他内容比如放开端口等方法是类似的。 程序中用到一个公共类 RunProcess,这个类可从我的另一篇文章 一个C#写的调用外部进程类 获得 Code high
2008-05-30 07:33:00
852
原创 如何获取 Exception 的 HResult 值
在编程中往往需要获取Exception 的HResult值以得到具体的错误原因。但这个值是一个保护类型的属性,无法直接读取。可通过 System.Runtime.InteropServices.Marshal.GetHRForException 这个函数来获取。
2008-05-16 10:23:00
1454
1
原创 设置 NULL DACL 权限描述符解决ASP.NET 通过 FileMapping 与其他进程通信问题
最近做了一个采用FileMapping进行进程间通信的程序,目的是希望通过这个程序实现WebService和我写的其他服务之间通信,实现安全隔离以及一些状态的跟踪、保持和管理。做好后,先用两个普通的Windows 进程测试了一下,在1.8G双核笔记本电脑上,每秒钟可以发送3万个1000字节大小的消息,效率基本达到我的要求(我没有把效率优化到极致,效率瓶颈和优化方法我基本知道,就是人懒,现在的方案已
2008-05-14 20:58:00
1141
2
原创 IIS ASP.NET 安装顺序
如果先安装IIS再安装 .Net Framework。一切OK,不需要做任何事情。如果先安装 .Net Framework再安装IIS,则 .Net Framework不会自动注册到IIS,必须执行 .Net Framework下的 apsnet_regiis.exe 来注册注册方法是 apsnet_regiis - i
2008-05-08 08:14:00
3976
原创 修改 highlighter.net-1.4.0 一处Bug
最近在做KTDictSeg 的 1.3 版本,在这个版本中做了一个用Lucene.net 搜索新闻的例子,其中生成关键词摘要用了highlighter.net-1.4.0版本,发现中文关键词摘要生成结果总是不对,但英文的结果是对的。没办法,只得把highlighter.net的源码拿出来调了一遍,最终发现问题在TokenGroup类的IsDistinct函数上。该函数源码如下 i
2008-05-06 19:01:00
905
2
原创 ConfigurationPattern V1.1.1 版本发布
ConfigurationPattern V1.1.1 版本发布作者:肖波 V1.1.1 版本增加一个配置模式 RegistryKeyPattern,用于帮助调用者自动读写注册表配置。另外该版本将IConfigurationPattern 接口的parameter 参数类型有String改为Object,以便更加通用。 注册表配置的使用:Code highlight
2008-05-06 17:47:00
691
1
KTDictSeg 1.4 Beta 漏发布的SingleWords.txt文件
2008-10-20
C#代码动态编译、动态执行、动态调试
2008-10-17
KTDictSeg 1.4.01_Beta版本
2008-10-09
支持三态的TreeView控件(C# 编写)
2008-09-26
KTDictSeg V1.3 版本
2008-07-01
ktdictseg_v1.2.02
2007-08-12
安全证书登录组件SecUser
2007-08-12
WebCommV1.0.1
2007-07-09
KTDictSeg 中英文分词组件 V1.0.01版本
2007-05-24
KTDictSeg 中英文分词组件
2007-05-24
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人