自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 资源 (10)
  • 收藏
  • 关注

原创 KTDictSeg 分词组件1.3版本 新增功能列表及下载位置

1、 修改字典格式,提高字典加载速度  2、 增加对英文专业名词的支持 如C++,C#等只要加入字典就可以被分出来  3、 增加词频判断功能,在无法取舍时根据词频取舍  4、 增加优先优先词频选项,通过这个选项动态决定分词粒度 需打开 FreqFirst  5、 增加中文人名前后缀统计和根据该统计定位人名的功能  6、 增加中文人名和未登录词出现频率统计功能  7、 增加自

2008-05-30 08:25:00 1794 12

原创 KTDictSeg 分词组件1.3版本 部分算法讨论 -- 中文姓名识别和未登录词识别

作者 肖波     中文姓名识别和未登录词识别是中文分词中的难点,具体为什么是难点,很多文章都有叙述,这里不再多讲。主要介绍一下 1.3版本是如何对中文姓名和未登录词进行识别的。     中文姓名识别     中文姓名千变万化,我们不可能在字典中把所有的中文人名都列出来。1.2版本对中文人名进行了比较复杂的判断,但效果依然不理想。所以1.3版本干脆简化 了算法。1.3版本的算法主要基于中文人名的前

2008-05-30 07:37:00 1376

原创 KTDictSeg 分词组件1.3版本 部分算法讨论 -- 分词粒度

作者:肖波     KTDictSeg 分词组件1.3版本已经接近完成,只剩下最后的一点功能。在KTDictSeg 分词组件1.3版本的开发过程中,得到了很多朋友的关注和支持,特别是一些分词方面的专家提出了很多很好的意见,也对我的分词算法给出了很多中肯的建议, 在此向他们表示由衷的感谢。1.3版本的预分词算法还是沿用了之前版本的变相的最大匹配算法,这个算法有着本质的缺陷,未来的2.0版本可能会

2008-05-30 07:36:00 1157 2

原创 通过编程管理windows 防火墙

作者:肖波     最近项目中需要通过程序自动设置windows 防火墙,查了一下资料,可以通过命令行netsh firewall来实现。封装了一个类来实现对允许放开的程序(Allowed program)进行管理。管理其他内容比如放开端口等方法是类似的。     程序中用到一个公共类 RunProcess,这个类可从我的另一篇文章 一个C#写的调用外部进程类 获得 Code high

2008-05-30 07:33:00 852

原创 如何获取 Exception 的 HResult 值

在编程中往往需要获取Exception 的HResult值以得到具体的错误原因。但这个值是一个保护类型的属性,无法直接读取。可通过 System.Runtime.InteropServices.Marshal.GetHRForException 这个函数来获取。

2008-05-16 10:23:00 1454 1

原创 设置 NULL DACL 权限描述符解决ASP.NET 通过 FileMapping 与其他进程通信问题

最近做了一个采用FileMapping进行进程间通信的程序,目的是希望通过这个程序实现WebService和我写的其他服务之间通信,实现安全隔离以及一些状态的跟踪、保持和管理。做好后,先用两个普通的Windows 进程测试了一下,在1.8G双核笔记本电脑上,每秒钟可以发送3万个1000字节大小的消息,效率基本达到我的要求(我没有把效率优化到极致,效率瓶颈和优化方法我基本知道,就是人懒,现在的方案已

2008-05-14 20:58:00 1141 2

原创 IIS ASP.NET 安装顺序

如果先安装IIS再安装 .Net Framework。一切OK,不需要做任何事情。如果先安装 .Net Framework再安装IIS,则 .Net Framework不会自动注册到IIS,必须执行 .Net Framework下的 apsnet_regiis.exe 来注册注册方法是 apsnet_regiis - i

2008-05-08 08:14:00 3976

原创 修改 highlighter.net-1.4.0 一处Bug

最近在做KTDictSeg 的 1.3 版本,在这个版本中做了一个用Lucene.net 搜索新闻的例子,其中生成关键词摘要用了highlighter.net-1.4.0版本,发现中文关键词摘要生成结果总是不对,但英文的结果是对的。没办法,只得把highlighter.net的源码拿出来调了一遍,最终发现问题在TokenGroup类的IsDistinct函数上。该函数源码如下        i

2008-05-06 19:01:00 905 2

原创 ConfigurationPattern V1.1.1 版本发布

ConfigurationPattern V1.1.1 版本发布作者:肖波    V1.1.1 版本增加一个配置模式 RegistryKeyPattern,用于帮助调用者自动读写注册表配置。另外该版本将IConfigurationPattern 接口的parameter 参数类型有String改为Object,以便更加通用。      注册表配置的使用:Code highlight

2008-05-06 17:47:00 691 1

KTDictSeg 1.4 Beta 漏发布的SingleWords.txt文件

KTDictSeg 1.4 Beta 版本漏发布了一个记录单字的文件,没有这个文件,将导致多元分词的结果不够理想。

2008-10-20

C#代码动态编译、动态执行、动态调试

前几天看到一篇关于.net动态编译的文章 .NET中的动态编译 ,很受启发。在此基础上我做了一些封装,为使调用更加简单,并增加了对动态代码调试的支持,相同代码只编译一次的支持,代码改动自动重新编译,代码引用文件的自动加载和手工加载等功能。 http://blog.csdn.net/eaglet/archive/2008/10/17/3091385.aspx http://www.cnblogs.com/eaglet/archive/2008/10/17/1313384.html

2008-10-17

KTDictSeg 1.4.01_Beta版本

V1.4.01 1、 增加对Asp.net的支持 2、 增加多元分词 3、 配置文件中增加对相对路径的支持(winform 和 asp.net) 4、 字典工具增加根据词性和单词长度查找功能。 5、 字典工具增加单词导出功能,用于构件停用词表。 6、 增加ASP.NET 的例子 7、 输出结果中增加词性,权重等信息 8、 增加一个高亮显示组件,模仿highlighter.net的调用接口,并为KTDictSeg量身定做。

2008-10-09

支持三态的TreeView控件(C# 编写)

已经推出 1.4.1 版本,请到下面地址下载 http://download.csdn.net/source/677245 http://blog.csdn.net/eaglet/archive/2008/09/26/2982366.aspx http://www.cnblogs.com/eaglet/archive/2008/09/26/1299430.html .Net framework提供了TreeView 控件,但该控件不支持三态的形式。所谓三态就是带CheckBox的TreeView每个Node都有三种状态,即选中,未选中和部分选中(指该Node的字节点并非全部选中)。 该控件支持三态的TreeView,并且支持当某个节点的Checkbox 状态发生改变时,自动回溯子节点和父节点。 使用该控件需要注意的是,必须使用AddTreeNode方法增加Node. 不能用Nodes.Add来增加。 该控件还提供了下面两个方法来获取和设置Node的Checkbox 状态:GetTreeNodeCheckBoxChecked,SetTreeNodeCheckBoxChecked 当Checkbox状态发生改变时,该控件提供一个 CheckBoxStateChanged 事件来截获状态的变化。 如果你觉得Checkbox 的图形不好看,你可以通过 CheckBoxStateImageList 属性来修改Checkbox 的图形

2008-09-26

KTDictSeg V1.3 版本

KTDictSeg 是一个开源的C#.net编写的,分词准确率大于90%,分词速度非常快,支持人名识别,词性标注,词频判断,未登录词识别,字典管理,Lucene.net接口。<br>http://www.cnblogs.com/eaglet/archive/2008/05/29/1209646.html

2008-07-01

ktdictseg_v1.2.02

比V1.0版本增加如下功能<br>1、 增加中文人名判断 <br>2、 增加了正向匹配分词和反向匹配分词的选项 <br>3、 增加了停用词过滤 <br>4、 增加了词性标注

2007-08-12

安全证书登录组件SecUser

安全证书登录组件SecUser,后简称SecUser是www.kaitoo.com开发的一款基于.Net的开放源码的安全证书登录组件,该组件可以帮助用户构建一个类似于银行的网上银行系统的基于证书验证的Web应用系统。该组件封装了证书的管理功能,验证功能,以及登录后Web应用系统的安全认证功能,为开发者提供一个方便易用且高度可扩展的安全证书系统支撑平台。

2007-08-12

WebCommV1.0.1

一款轻量级的Web通讯组件,调用者只需调用一个函数就可以将桌面应用程序中需要通讯的对象发送到Web应用程序中,并可以从Web应用程序获得其响应的对象,如果调用者需要发送加密消息,该组件提供了发送加密消息的方法,同样是非常简单。

2007-07-09

KTDictSeg 中英文分词组件 V1.0.01版本

KTDictSeg 简介: KTDictSeg 是由KaiToo搜索开发的一款基于字典的简单中英文分词算法<br/>主要功能: 中英文分词,未登录词识别,多元歧义自动识别,全角字符识别能力<br/>主要性能指标:<br/>分词准确度:90%以上(有待专家的权威评测)<br/>处理速度: 600KBytes/s<br/><br/>版本: V1.0.01 Bata<br/>Copyright(c) 2007 http://www.kaitoo.com <br/>作者:肖波<br/>授权: 开源GPL<br/>公司网站: http://www.kaitoo.com

2007-05-24

KTDictSeg 中英文分词组件

KTDictSeg 简介: KTDictSeg 是由KaiToo搜索开发的一款基于字典的简单中英文分词算法<br/>主要功能: 中英文分词,未登录词识别,多元歧义自动识别,全角字符识别能力<br/>主要性能指标:<br/>分词准确度:90%以上(有待专家的权威评测)<br/>处理速度: 600KBytes/s<br/> <br/>版本: V1.0 Bata<br/>Copyright(c) 2007 http://www.kaitoo.com <br/>作者:肖波<br/>授权: 开源GPL<br/>公司网站: http://www.kaitoo.com

2007-05-24

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除