自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

相生昌专栏

忠心愿为中国的软件事业贡献自己一份微薄的力量! 年轻而追求理想,智慧而永不满足,执着而勇于进取,触角敏锐但不随波逐流!

  • 博客(11)
  • 资源 (3)
  • 收藏
  • 关注

原创 关于切词程序的一点启发

文本切词是中文信息处理的基础,除了英文以外大多和语言如中文、韩文、日文都是需要切词的。由于不同的编码形式给我们的切词带来了不便,ANS码是一个字符一个字符,而GB2312等都是两个字节表示一个字符。一般一个字符是否是多字节编码可以通过最高位来判断,如果最高位是0则是ANS码,否则多字节编码。通常人们进行切词都是将待切分文本转换成Unicode再进行切分,在实际中我经过实验这种方法其实不是很好,效率

2006-04-30 15:13:00 2198 3

原创 搜索引擎开发日志

这两天一直在构思关于图片搜索的的实现,在目前蜘蛛的基础上增加图片抓取和Flash抓取的功能,这样就可以实现图片搜索和Flash搜索功能。对于图片的抓取已经实现,而对Flash的实现相对来说是比较麻烦一些,不过也不是太难。对这些对象我都是以二进制对象的形式存储到数据库中去了,目前采用的是中国知网的KBase系统,通过简单的功能性测试已经通过了,由于图片数据都可能比网面数据大,因则我在蜘蛛里抓取时采用

2006-04-27 16:52:00 1582

原创 网络蚂蚁与FlashGet的文件多线程下载原理

最近自己写了一个类似网络蚂蚁和FlashGet一样的程序,主要是为了自己能学点东西,不过还好,已经有点样子了,已经实现了类似它们的界面风格和功能,只是里面的下载任务、错误任务、已完成任务、中止任务的调度问题还没有详细去做,通过IE右键菜单的传参数还没有解决,IE右键菜单已经现,已经能够取到鼠标位置的URL,只是不知如何将取得的一个URL传给下载程序,还有待解决。现在将多线程下载同一个文件的原理讲述

2006-04-24 15:15:00 6573

原创 界面与后台工作线程分离的实现方案

在我们实际应用中,常常会遇到界面与后台工作线程分离的情况。特别是在写多线程的服务程序和批处理程序时经常用到的,随着技术的发展,人们已经不满足于命令行的服务程序,需要具有更好的可视化的、图形化的界面服务程序,能够实时监控各个后台工作线程的状态。经过一些实践我在这里总结一些将后工作线程与显示界面分离的较好的实现方案,供大家参考,希望能够给大家一些启示:首先,假设我们的系统由一个或者多个工作线程,这

2006-04-13 12:21:00 2652

原创 关于二维绘图时拾取某一直线的代码

这里是我在以前的实践中编写一个函数,主要是拾取平面上的一条直线,通过判断点是否是直线附近来判断,通过点与直线的距离在给定的半径之内则认为是在直线之上。这需要对直线和拾取时点进行旋转,旋转到直线与X轴平行,其主要的代码如下://检查一点是否在一条直线附近//Spoint是直线起点,Epoint是些终端点,Mpoint是拾取点,nRadius是半径bool CLine::Pick(CPoint S

2006-04-11 22:13:00 1674

转载 一个女生写的经典程序

刚才一个朋友给发了一段很特别的程序,觉得挺有意思,所以发上来和大家共享,一个女生写的经典程序result love(boy, girl) {    if( boy.有房() and boy.有车() )    {         boy.set(nothing);   return girl.嫁给(boy);  }  if( girl.愿意等() )   {    while(!(boy.赚钱 >

2006-04-10 13:18:00 1482

原创 对于搜索引擎未来的一种设想

人们都说21世纪是搜索的世界,确实搜索引擎已经是我们生活中的一种必备工具了,在四五年前搜索引擎对大多数人来说都是一种很神秘的东西,而如今搜索引擎却成了大众工作和办公的一种必须品,就象办公软件office、金山词霸一样的深入人心。各大搜索巨头都在展开激烈的竞争,都想在这一大市场中占领一席之地。这对广大用户来说是一种好事,毕竟会得到更好的搜索服务。而传统的搜索引擎已经不能完全满足用户的搜索需求,那么下

2006-04-08 21:09:00 2027 2

原创 用Socket的接受数据线程来捕获所连客户端的掉线问题

判断Socket是否断线是我们经常用到的,但是有时的一些异常,比如机器突然死机,客户端Socket断线之类难以断定,我在实际的开发过程中用数据接受线程来监控,一旦发现断线会及时通知主应用程序。在实际的应用中效果还不错,其代码如下:(希望对大家有所帮助)/**********************************************///接受数据线程/***************

2006-04-07 16:03:00 1701

原创 海量数据的管理及增量索引(全文检索系统)

对于分布式的全文检索系统,海量数据的管理与增量索引策略显得尤为重要,因为很多用户时时地对数据进行检索,而后台又有多个子系统在时时地往总库写数据,而各客户端需要对添加到库里的数据实时地查询到。而对于全文检索系统用户查询到的提前必须对入到库里的数据进行索引,这样用户才能看到数据。而且每天的数据量多的时候可能有好几十万条,每一条数据基本上都是在70K以上,因为好几个字段都是全文字段。这让我在设计方案时颇

2006-04-06 16:04:00 2373 1

原创 模式对话框不宜调试

今天在写程序时发现一个问题,模式对话框不宜调试,就是说当你在程序中弹出一个模式对话框,然后在对话框的DoModal()之后紧接着打了一个断点,想跟踪,但是我试了好多次都是程序反应奇慢无比,好象是死机了似的,刚开始是以为机器有有毛病了,重启动了几次还是这样,后来我又想了想,才恍然大悟,原来是模式对话框捣的鬼,是由于DoModal()将程序挂起,等待用户操作的消息,这样当进入断点时由于程序主窗口可能还

2006-04-05 14:56:00 1327

原创 搜索引擎经验总结

这里是一点我在学习和开发搜索引擎过程中的一点学习和经验总结,文中讲述了蜘蛛、切词、索引、查询器等名模块的一些概述和细节,希望能给搜索引擎中的初学点的一点帮助,对于那些高手也能够带来一点点启发的帮助!这是我在2004年学习和开发搜索引擎相关东西时的一点总结,可能比较肤浅,最近还是一直在搞这方面的研究,相对于这篇文章又有了一些新的总结,等以后有时间再写一篇和大家分享!(有些图是没有办法显示的,因为

2006-04-03 14:39:00 14362 8

MFCAppTest-自绘动画窗口.rar

VS2017代码,MFC自绘制窗口:以动态形式实现自绘制窗口的淡入和淡出,主要知识点包括:SetTimer、OnEraseBkgnd、MoveWindow、KillTimer等函数的应用

2020-03-28

OpeExcel.rar

VC++操作Excel的示例代码,包括读取Excel表格内容和输出内容到Excel表格,在VS2017下编写并编译通过,能够兼容office2003及以上的版本,欢迎大家使用

2020-03-28

搜索引擎系统学习与开发总结(最好的入门级教材)

搜索引擎系统学习与开发总结(最好的入门级教材),包括爬虫、切词、索引、检索等各模块的实现原理.写了好多年了,分享出来供大家学习!

2009-02-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除