- 博客(9)
- 资源 (1)
- 收藏
- 关注
原创 ICTCLAS
ICTCLAS分词系统是由中科院计算所的张华平、刘群所开发的一套获得广泛好评的分词系统,该版的Free版开放了源代码,为初学者提供了宝贵的学习材料。我们可以在“http://sewm.pku.edu.cn/QA/”找到FreeICTCLASLinux.tar的C++代码。可是目前该版本的ICTCLAS并没有提供完善的文档,所以阅读起来有一定的难度,所幸网上可以找到一些对ICTCLAS进行代码分
2007-10-29 20:49:00 1569 1
原创 调用dll vc++(转自msdn)
在本演练中,您将创建一个动态链接库 (DLL),其中包含可供其他应用程序使用的有用例程。使用 DLL 是一种重用代码的绝佳方式。您不必在自己创建的每个程序中重新实现这些例程,而只需对这些例程编写一次,然后从需要该功能的应用程序引用它们即可。本演练使用本机 C++。有关使用本机 C++ 创建静态库的演练,请参见演练:创建和使用静态库。有关使用面向公
2007-10-29 20:05:00 1215 2
原创 通过代理服务器验证后在抓取网页内容
C#用HttpWebRequest通过代理服务器验证后抓取网页内容 。。。。。 string urlStr = "http://www.domain.com"; //設定要獲取的地址HttpWebRequest hwr = (HttpWebRequest)HttpWebRequest.Create(urlStr); //建立
2007-10-23 12:46:00 1094
原创 c#多线程抓取网页内容(转)
蜘蛛/爬虫程序的多线程控制(C#语言) 在《爬虫/蜘蛛程序的制作(C#语言)》一文中,已经介绍了爬虫程序实现的基本方法,可以说,已经实现了爬虫的功能。只是它存在一个效率问题,下载速度可能很慢。这是两方面的原因造成的:1. 分析和下载不能同步进行。在《爬虫/蜘蛛程序的制作(C#语言)》中已经介绍了爬虫程序的两个步骤:分析和下载。在单线程的程序中,两者是无法同时进行
2007-10-23 12:44:00 5924 1
转载 c# html2txt(转载)
using System;public class Html2Text{ public static void Main(string[] args) { if (args.Length 1) { Console.WriteLine("usage: Htm2Txt xxxx.htm [target.txt]"); }
2007-10-22 15:34:00 1402
转载 htm2txt c#源代码(转载)
using System;public class Html2Text{ public static void Main(string[] args) { if (args.Length 1) { Console.WriteLine("usage: Htm2Txt xxxx.htm [target.txt]"); }
2007-10-22 15:12:00 639
转载 (转)加速sql查询的特征函数法
http://www.chinaitlab.com/www/news/article_show.asp?id=1455 1. 查询问题的挑战 关系数据库的查询优化始终是一个重要而实际的问题,在那些以查询为主的应用系统中, 这几乎是一个成败攸关的问题。但迄今为止,关
2007-10-13 21:00:00 860
转载 lucene.net的一些基本使用方法和概念
<!--google_ad_client = "pub-8908527459010687";google_ad_width = 728;google_ad_height = 90;google_ad_format = "728x90_as";google_ad_type = "text_image";google_ad_channel = "";google
2007-10-10 20:47:00 737
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人