自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

九茶

强者自强,厚积薄发。

  • 博客(2)
  • 资源 (12)
  • 问答 (1)
  • 收藏
  • 关注

原创 分布式多爬虫系统——架构设计

前言:在爬虫的开发过程中,有些业务场景需要同时抓取几百个甚至上千个网站,此时就需要一个支持多爬虫的框架。在设计时应该要注意以下几点:代码复用,功能模块化。如果针对每个网站都写一个完整的爬虫,那其中必定包含了许多重复的工作,不仅开发效率不高,而且到后期整个爬虫项目会变得臃肿、难以管理。易扩展。多爬虫框架,这最直观的需求就是方便扩展,新增一个待爬的目标网站,我只需要写少量 必要的内容(如抓取规则、解

2017-02-12 23:52:06 27609 13

原创 Python爬虫——DNS解析缓存

前言:这是Python爬虫中DNS解析缓存模块中的核心代码,是去年的代码了,现在放出来 有兴趣的可以看一下。 一般一个域名的DNS解析时间在10~60毫秒之间,这看起来是微不足道,但是对于大型一点的爬虫而言这就不容忽视了。例如我们要爬新浪微博,同个域名下的请求有1千万(这已经不算多的了),那么耗时在10~60万秒之间,一天才86400秒。也就是说单DNS解析这一项就用了好几天时间,此时加上DNS解

2017-02-12 12:21:20 10422 3

SpringBoot实战,丁雪丰 译

别人20个积分放这个资源好贵呀,很多人都下不起,现上传一份供大伙使用。

2018-03-20

Python2.7.14 for windows64位 最新版下载

Python2.7.14,适用64位Windows系统,官网的下载速度特别慢,所以传一份到CSDN,欢迎下载。

2017-10-19

phantomjs-2.1.1-linux-x86_64.tar.bz2

Linux下使用PhantomJS,方法见http://blog.csdn.net/bone_ace/article/details/53213779 第一条评论。

2016-11-25

SublimeText3工具箱

包括文件:Sublime Text Build 3083 x64 Setup.exe、Sublime_Text_CN_3083.zip、 pylint-1.5.2.tar.gz、 Theme - Cobalt2、 使用说明.txt 更多情况请见博客:http://blog.csdn.net/Bone_ACE/article/details/50434050

2015-12-30

FP-Growth算法python实现(完整代码)

包含两个文件,一个是刚构造好FP-tree的代码,另一个是FP-Growth算法python实现的完全代码。更多的介绍请见博客:http://blog.csdn.net/bone_ace/article/details/46746727

2015-07-04

广工离散数学试卷集合

大广工离散数学07/08/12/13年试卷集合

2015-06-16

广工软件工程试卷+各种图

大广工软件工程试卷若干+类图、数据流图、顺序图、状态图、用例图

2015-06-16

广工计算机网络试卷大集合

广工计算机网络07/08/09/12年试题,加上二十几份练习试卷、考纲、知识点、课后答案等等,这些资料考个网络完全够了!

2015-06-16

广工数据结构试卷

大广工05年到10年数据结构试卷集合

2015-06-16

广工数值计算方法试卷

广工数值计算方法试卷5份

2015-06-16

广工Java实验+课设

广工2013年Java实验、课设、蜘蛛纸牌详细设计两份、Java学习笔记。含代码。

2015-06-16

广工数据挖掘12、13、14年试题+课后答案+知识点总结+上课PPT+课外资料

广工数据挖掘12、13、14年试题,课后习题及答案,数据挖掘知识点总结,数据挖掘上课PPT,数据挖掘课外资料

2015-06-15

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除