自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

狐狸的博客

进击的狐狸的程序人生

  • 博客(8)
  • 资源 (1)
  • 问答 (2)
  • 收藏
  • 关注

原创 VB脚本编写的小题库程序

把Excel也当成一个数据库,只不过这个数据库只支持文本。程序可以改变和增加Excel里面的题目内容,题库也会相应增大,注意总题数也要改成和实际题目数目相应的数字。

2016-02-07 18:54:52 3237 1

原创 C#读写文本文件并导入Excel(二)

跟上一篇类似的思想,只是这次多利用了C#中几个好用的字符串函数string.indexof()和string.substring()

2016-02-07 18:36:19 750

原创 C# 读写文本文件并导入Excel(一)

利用ReadAllText和WriteAllText方法读写文本文件,并且把他们以逗号分隔,形成能被Excel直接导入并且分列的数据。

2016-02-07 18:15:03 3636

原创 C# 多线程编程基础——怎么创建和执行多个线程

主要介绍怎么用C#动态创建若干个线程,并且执行他们。

2016-02-07 16:43:25 4672

原创 C#小技巧(二) 用List.Contains方法筛除重复项

此程序主要是把List<T>列表类对象中的所有重复项都删除并输出,如果有需要,也可以把重复的项另外输出来供研究。

2016-02-07 12:09:58 5858

原创 C#小技巧(一)循环的Remove方法

用循环的Remove方法实现RemoveAll的部分功能

2016-02-07 11:19:24 7571 2

原创 C# 拆分数组的方法

本程序主要是把一个数组拆分成若干块

2016-02-07 10:58:39 15772

原创 由C#编写的多线程异步抓取网页的网络爬虫控制台程序

主程序编写作者:大黑 (WebPage类编写者另有其人,类Link的定义在他博文的留言区,这是他的博文地址http://blog.csdn.net/yysyangyangyangshan/article/details/6661886) 描述:由C#编写的多线程异步抓取网页的网络爬虫控制台程序 功能:目前只能提取网络链接

2016-02-06 21:43:39 5565

由C#编写的多线程异步抓取网页的网络爬虫控制台程序

描述:由C#编写的多线程异步抓取网页的网络爬虫控制台程序 功能:目前只能提取网络链接,所用的两个记录文件并不需要很大。网页文本、图片、视频和html代码暂时不能抓取,请见谅。 但需要注意,网页的数目是非常庞大的,如下代码理论上大概可以把整个互联网网页链接都抓下来。 但事实上,由于处理器功能和网络条件(主要是网速)限制,一般的家用电脑最多能胜任12个线程左右的抓取任务,抓取速度有限。可以抓取,但需要时间和耐心。 当然,这个程序把所有链接抓下来是可能的,因为链接占系统空间并不多,而且有记录文件的帮助,已抓取网页的数量可以堆积下去, 甚至可以把所有的互联网网络链接都存取下来,当然,最好是分批次。建议设置maxNum为500-1000左右,慢慢累积下去。 另外因为是控制台程序,有时候显示字符过多会系统会暂停显示,这时候只要点击控制台按下回车键就可以了。程序假死的时候,可以按回车键(Enter)试试。 /// 使用本程序,请确保已创建相应的记录文件,出于简化代码的考虑,本程序做的并不健壮,请见谅。 /// 默认的文件创建在E盘根目录“已抓取网址.txt”和“待抓取网址.txt”这两个文本文件中,使用者需要自行创建这两个文件,注意后缀名不要搞错。 这两个文件里面的链接基本都是有效链接,可以单独处理使用。 本爬虫程序的速度如下: 10线程最快大概500个链接每分钟 6-8线程最快大概400-500个链接每分钟 2-4线程最快大概200-400个链接每分钟 单线程最快大概70-100个链接每分钟 之所以用多线程异步抓取完全是出于效率考虑,本程序多线程同步并不能带来速度的提升,只要抓取的网页不要太多重复和冗余就可以,异步并不意味着错误。

2016-02-06

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除