自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 资源 (10)
  • 收藏
  • 关注

原创 如何确定中文字符串的相似度

如何确定中文字符串的相似度 作者:肖波个人博客:http://blog.csdn.net/eagletEmail:blog.eaglet@gmail.com2007/4 南京 摘要在数据挖掘的研究中,我们往往需要判断文章是否雷同,对类似文章或短句进行归类处理等,这其中就会遇到这样的问题:如何确定两个字符串之间的相似程度。本文综合作者的实际工作经验和数据挖掘理论,

2007-04-28 15:22:00 5518 8

转载 windows系统如何设置自动登录

首先单击“开始 运行”,在输入框中键入“regedit”打开注册表编辑器,然后在注册表编辑器左方控制台中依次单击展开“HKEY_LOCAL_MACHINE/SOFTWARE/Microsoft/Windows NT/Current Version/Winlogon”,再选择“编辑 添加 字符串值”,在数值名称中键入“AutoAdminLogon”,然后在窗口中的空白位置上点一下,再双击刚新建的字符

2007-04-20 23:04:00 1632

原创 如何通过命令行注销网络共享

net use //computername/sharename /del如:net use //xxx.xxx.xxx.xxx/IPC$ /del 

2007-04-20 22:59:00 2220

原创 如何配置 windows 安装盘需要拷贝的文件

如果需要自制一个windows安装盘,将一些自己的软件定制到安装盘中,从而实现安装完windows就可以自动将自己的软件安装到系统中。为达到这个目的可以通过修改i386/txtsetup.sif 这个文件来实现。

2007-04-20 22:58:00 1014

原创 对于时间格式 08/21 08:21 用 MM/dd HH:mm 格式无法进行匹配的问题

DateTime 类型可以指定格式进行字符串转换,但对于 08/21 08:21 这样的时间格式,用按说应该用 MM/dd HH:mm 这样的格式串指定格式,但总是无法匹配。后来我发现 “/” 这个字符是特殊字符,必须通过“/”转义才能被正确识别。将格式字符串该为MM//dd HH:mm 后,问题解决 eaglet2007-4-20 

2007-04-20 22:53:00 1126

原创 如何打开SQL Server的性能统计开关

在查询分析器中执行如下语句,可以打开SQL Server 的性能统计开关,之后再执行查询语句,将打印相应的性能统计报告。set statistics time onset statistics io onset statistics profile on eaglet2007-4-20 

2007-04-20 22:42:00 1456

原创 解决通过identity字段关联的多个数据表插入问题

在数据库设计中经常要用到自动增长字段(identity) ,在使用自动增长字段做多表关联时往往会遇到这样一个问题,当向主表插入数据后同时需要向与之关联的表插入相关的数据比如用户基本信息表记录用户基本信息,它通过自动增长字段UserId和用户扩展信息表关联。当向用户基本信息表插入一条用户信息后,我们需要同时向用户扩展信息表插入于这个用户相关的扩展信息,由于我们无法知道刚被插入的这条用

2007-04-20 22:39:00 1521

原创 怎样去掉word中首字母的大写功能

在 菜单 工具-自动更正选项-自动更正 中 设置,取消选择 句首字母大写,确定退出 

2007-04-20 21:53:00 3481

原创 Word CPU 占有率100%问题的解决

Word的CPU占用率是比较高的,在打开或编辑一篇较长的文档时,Word的CPU占用率便会直线上升,总是占到百分之九十几甚至是百分之百。Word的CPU占用率高的根源在于Word的拼写和语法检查功能。在默认情况下,Word会对文档中的内容进行拼写和语法检查,就是它导致了CPU占用率的居高不下。  解决:进入Word,执行“工具→选项”菜单命令,在出现的对话框中点击“拼写和语法”选项卡,

2007-04-20 21:49:00 6055 1

原创 如何设置Excel单元格以某行或列为边界

选中该行或列对应的单元格,然后在窗口菜单中选择窗口冻结即可 

2007-04-16 08:40:00 4427

原创 如何备份和恢复outlook通讯录

通讯录文件在如下目录下:Documents and Settings/username/Application Data/Microsoft/Address Book 拷贝出来进行备份恢复时复制到对应目录下 

2007-04-16 08:37:00 5953 1

原创 如何备份和恢复outlook信箱

outlook 的信箱文件在如下目录下:Documents and Settings/username/Local Settings/Application Data/Identities/{3B9E6DE6-0994-4CA8-98F6-DB971CBE0CF4}/Microsoft/Outlook Express 把它拷贝出来进行备份。恢复时拷贝到对应目录下

2007-04-16 08:33:00 1209

KTDictSeg 1.4 Beta 漏发布的SingleWords.txt文件

KTDictSeg 1.4 Beta 版本漏发布了一个记录单字的文件,没有这个文件,将导致多元分词的结果不够理想。

2008-10-20

C#代码动态编译、动态执行、动态调试

前几天看到一篇关于.net动态编译的文章 .NET中的动态编译 ,很受启发。在此基础上我做了一些封装,为使调用更加简单,并增加了对动态代码调试的支持,相同代码只编译一次的支持,代码改动自动重新编译,代码引用文件的自动加载和手工加载等功能。 http://blog.csdn.net/eaglet/archive/2008/10/17/3091385.aspx http://www.cnblogs.com/eaglet/archive/2008/10/17/1313384.html

2008-10-17

KTDictSeg 1.4.01_Beta版本

V1.4.01 1、 增加对Asp.net的支持 2、 增加多元分词 3、 配置文件中增加对相对路径的支持(winform 和 asp.net) 4、 字典工具增加根据词性和单词长度查找功能。 5、 字典工具增加单词导出功能,用于构件停用词表。 6、 增加ASP.NET 的例子 7、 输出结果中增加词性,权重等信息 8、 增加一个高亮显示组件,模仿highlighter.net的调用接口,并为KTDictSeg量身定做。

2008-10-09

支持三态的TreeView控件(C# 编写)

已经推出 1.4.1 版本,请到下面地址下载 http://download.csdn.net/source/677245 http://blog.csdn.net/eaglet/archive/2008/09/26/2982366.aspx http://www.cnblogs.com/eaglet/archive/2008/09/26/1299430.html .Net framework提供了TreeView 控件,但该控件不支持三态的形式。所谓三态就是带CheckBox的TreeView每个Node都有三种状态,即选中,未选中和部分选中(指该Node的字节点并非全部选中)。 该控件支持三态的TreeView,并且支持当某个节点的Checkbox 状态发生改变时,自动回溯子节点和父节点。 使用该控件需要注意的是,必须使用AddTreeNode方法增加Node. 不能用Nodes.Add来增加。 该控件还提供了下面两个方法来获取和设置Node的Checkbox 状态:GetTreeNodeCheckBoxChecked,SetTreeNodeCheckBoxChecked 当Checkbox状态发生改变时,该控件提供一个 CheckBoxStateChanged 事件来截获状态的变化。 如果你觉得Checkbox 的图形不好看,你可以通过 CheckBoxStateImageList 属性来修改Checkbox 的图形

2008-09-26

KTDictSeg V1.3 版本

KTDictSeg 是一个开源的C#.net编写的,分词准确率大于90%,分词速度非常快,支持人名识别,词性标注,词频判断,未登录词识别,字典管理,Lucene.net接口。<br>http://www.cnblogs.com/eaglet/archive/2008/05/29/1209646.html

2008-07-01

ktdictseg_v1.2.02

比V1.0版本增加如下功能<br>1、 增加中文人名判断 <br>2、 增加了正向匹配分词和反向匹配分词的选项 <br>3、 增加了停用词过滤 <br>4、 增加了词性标注

2007-08-12

安全证书登录组件SecUser

安全证书登录组件SecUser,后简称SecUser是www.kaitoo.com开发的一款基于.Net的开放源码的安全证书登录组件,该组件可以帮助用户构建一个类似于银行的网上银行系统的基于证书验证的Web应用系统。该组件封装了证书的管理功能,验证功能,以及登录后Web应用系统的安全认证功能,为开发者提供一个方便易用且高度可扩展的安全证书系统支撑平台。

2007-08-12

WebCommV1.0.1

一款轻量级的Web通讯组件,调用者只需调用一个函数就可以将桌面应用程序中需要通讯的对象发送到Web应用程序中,并可以从Web应用程序获得其响应的对象,如果调用者需要发送加密消息,该组件提供了发送加密消息的方法,同样是非常简单。

2007-07-09

KTDictSeg 中英文分词组件 V1.0.01版本

KTDictSeg 简介: KTDictSeg 是由KaiToo搜索开发的一款基于字典的简单中英文分词算法<br/>主要功能: 中英文分词,未登录词识别,多元歧义自动识别,全角字符识别能力<br/>主要性能指标:<br/>分词准确度:90%以上(有待专家的权威评测)<br/>处理速度: 600KBytes/s<br/><br/>版本: V1.0.01 Bata<br/>Copyright(c) 2007 http://www.kaitoo.com <br/>作者:肖波<br/>授权: 开源GPL<br/>公司网站: http://www.kaitoo.com

2007-05-24

KTDictSeg 中英文分词组件

KTDictSeg 简介: KTDictSeg 是由KaiToo搜索开发的一款基于字典的简单中英文分词算法<br/>主要功能: 中英文分词,未登录词识别,多元歧义自动识别,全角字符识别能力<br/>主要性能指标:<br/>分词准确度:90%以上(有待专家的权威评测)<br/>处理速度: 600KBytes/s<br/> <br/>版本: V1.0 Bata<br/>Copyright(c) 2007 http://www.kaitoo.com <br/>作者:肖波<br/>授权: 开源GPL<br/>公司网站: http://www.kaitoo.com

2007-05-24

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除