- 博客(9)
- 资源 (10)
- 论坛 (18)
- 收藏
- 关注
原创 KTDictSeg 分词组件1.3版本 新增功能列表及下载位置
1、 修改字典格式,提高字典加载速度 2、 增加对英文专业名词的支持 如C++,C#等只要加入字典就可以被分出来 3、 增加词频判断功能,在无法取舍时根据词频取舍 4、 增加优先优先词频选项,通过这个选项动态决定分词粒度 需打开 FreqFirst 5、 增加中文人名前后缀统计和根据该统计定位人名的功能 6、 增加中文人名和未登录词出现频率统计功能 7、 增加自
2008-05-30 08:25:00
1736
12
原创 KTDictSeg 分词组件1.3版本 部分算法讨论 -- 中文姓名识别和未登录词识别
作者 肖波 中文姓名识别和未登录词识别是中文分词中的难点,具体为什么是难点,很多文章都有叙述,这里不再多讲。主要介绍一下 1.3版本是如何对中文姓名和未登录词进行识别的。 中文姓名识别 中文姓名千变万化,我们不可能在字典中把所有的中文人名都列出来。1.2版本对中文人名进行了比较复杂的判断,但效果依然不理想。所以1.3版本干脆简化 了算法。1.3版本的算法主要基于中文人名的前
2008-05-30 07:37:00
1267
原创 KTDictSeg 分词组件1.3版本 部分算法讨论 -- 分词粒度
作者:肖波 KTDictSeg 分词组件1.3版本已经接近完成,只剩下最后的一点功能。在KTDictSeg 分词组件1.3版本的开发过程中,得到了很多朋友的关注和支持,特别是一些分词方面的专家提出了很多很好的意见,也对我的分词算法给出了很多中肯的建议, 在此向他们表示由衷的感谢。1.3版本的预分词算法还是沿用了之前版本的变相的最大匹配算法,这个算法有着本质的缺陷,未来的2.0版本可能会
2008-05-30 07:36:00
1120
2
原创 通过编程管理windows 防火墙
作者:肖波 最近项目中需要通过程序自动设置windows 防火墙,查了一下资料,可以通过命令行netsh firewall来实现。封装了一个类来实现对允许放开的程序(Allowed program)进行管理。管理其他内容比如放开端口等方法是类似的。 程序中用到一个公共类 RunProcess,这个类可从我的另一篇文章 一个C#写的调用外部进程类 获得 Code high
2008-05-30 07:33:00
721
原创 如何获取 Exception 的 HResult 值
在编程中往往需要获取Exception 的HResult值以得到具体的错误原因。但这个值是一个保护类型的属性,无法直接读取。可通过 System.Runtime.InteropServices.Marshal.GetHRForException 这个函数来获取。
2008-05-16 10:23:00
1332
1
原创 设置 NULL DACL 权限描述符解决ASP.NET 通过 FileMapping 与其他进程通信问题
最近做了一个采用FileMapping进行进程间通信的程序,目的是希望通过这个程序实现WebService和我写的其他服务之间通信,实现安全隔离以及一些状态的跟踪、保持和管理。做好后,先用两个普通的Windows 进程测试了一下,在1.8G双核笔记本电脑上,每秒钟可以发送3万个1000字节大小的消息,效率基本达到我的要求(我没有把效率优化到极致,效率瓶颈和优化方法我基本知道,就是人懒,现在的方案已
2008-05-14 20:58:00
1081
2
原创 IIS ASP.NET 安装顺序
如果先安装IIS再安装 .Net Framework。一切OK,不需要做任何事情。如果先安装 .Net Framework再安装IIS,则 .Net Framework不会自动注册到IIS,必须执行 .Net Framework下的 apsnet_regiis.exe 来注册注册方法是 apsnet_regiis - i
2008-05-08 08:14:00
3917
原创 修改 highlighter.net-1.4.0 一处Bug
最近在做KTDictSeg 的 1.3 版本,在这个版本中做了一个用Lucene.net 搜索新闻的例子,其中生成关键词摘要用了highlighter.net-1.4.0版本,发现中文关键词摘要生成结果总是不对,但英文的结果是对的。没办法,只得把highlighter.net的源码拿出来调了一遍,最终发现问题在TokenGroup类的IsDistinct函数上。该函数源码如下 i
2008-05-06 19:01:00
793
2
原创 ConfigurationPattern V1.1.1 版本发布
ConfigurationPattern V1.1.1 版本发布作者:肖波 V1.1.1 版本增加一个配置模式 RegistryKeyPattern,用于帮助调用者自动读写注册表配置。另外该版本将IConfigurationPattern 接口的parameter 参数类型有String改为Object,以便更加通用。 注册表配置的使用:Code highlight
2008-05-06 17:47:00
647
1
C#代码动态编译、动态执行、动态调试
2008-10-17
KTDictSeg 1.4.01_Beta版本
2008-10-09
WebCommV1.0.1
2007-07-09
支持三态的TreeView控件(C# 编写)
2008-09-26
安全证书登录组件SecUser
2007-08-12
KTDictSeg V1.3 版本
2008-07-01
KTDictSeg 中英文分词组件
2007-05-24
KTDictSeg 中英文分词组件 V1.0.01版本
2007-05-24
ktdictseg_v1.2.02
2007-08-12
KTDictSeg 1.4 Beta 漏发布的SingleWords.txt文件
2008-10-20
用C#开发的开源中文分词组件,附源码,供大家参考,共同学习
发表于 2007-06-02 最后回复 2008-08-05
Remoting 的服务器侧如何获知Client的IP地址
发表于 2006-08-14 最后回复 2007-02-12
Uri 相对路径转换的问题
发表于 2006-07-14 最后回复 2006-08-13
如何列出可执行文件调用的所有配件
发表于 2006-08-13 最后回复 2006-08-13
Button 弹出新窗体
发表于 2006-07-04 最后回复 2006-07-04
HttpWebRequest GetResponse 问题(急)
发表于 2006-02-18 最后回复 2006-02-18
反序列化出错,不知如何解决
发表于 2004-11-14 最后回复 2004-11-27
如何通过程序给TQuery增加一个CalcFields
发表于 2004-04-12 最后回复 2004-04-12
如何通过程序给TQuery增加一个CalcFields
发表于 2004-04-12 最后回复 2004-04-12
如何编写程序默认方式打开文件
发表于 2004-04-06 最后回复 2004-04-07
如何通过程序设置 visual studio .net 的include 路径
发表于 2004-02-29 最后回复 2004-03-02
如何修改RichEdit控件某一行的背景颜色
发表于 2001-09-29 最后回复 2002-06-20
用VC++写的ACTIVEX控件在ASP服务器侧调用时总是说灾难性错误,而在客户端运行正常。请高手指教.
发表于 2000-04-14 最后回复 2001-09-06
delphi中如何在程序中得到当前所在的函数名?
发表于 2000-11-28 最后回复 2001-06-01
急!asp中 SET FILEOBJECT = SERVER.CREATEOBJECT("SCRIPTING.FILESYSTEMOBJECT")时出错,请高手帮助解决
发表于 2000-09-18 最后回复 2000-09-18
关于在PHP中调用Sybase函数的问题
发表于 2000-04-30 最后回复 2000-07-01
关于在PHP中调用Sybase函数的问题,急!
发表于 2000-04-29 最后回复 2000-04-29
关于超链接的一个问题,请指教(难度较高!)
发表于 2000-04-04 最后回复 2000-04-05
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人 TA的粉丝