2016年05月_峰峰jack

07月 06月 05月 04月 03月 02月 01月

原创爬虫系列1：python简易爬虫分析

讲爬虫的基本原理和简易示例，包括单个网页和多网页爬虫的分析。

2016-05-29 16:58:25 2335 1

难点：1） scrapy如何动态加载所有“下一页”：要知道scrapy本身是不支持js操作的。2）如何确保页面内容加载完成后再进行爬取：由于内容是通过js加载的，如果不加控制，很可能出现爬到空页面的情况。处理方法：1）scrapy+selenium模拟浏览器点击：通过模拟浏览器点击的方式进行翻页，从而获取每一页内部的有效链接。2）使用WebDriverWait()等待数据加载：即确保对应内容加载完成后，在进行相应爬取任务。

2016-05-29 16:12:12 21893 1

原创 python编码问题分析

主要介绍：1、编码转换的基本原理；2、将列表中的数字、字符串、Unicode都转换为string；3、将编码为A的数据，输出到编码为B的文件。

2016-05-28 17:32:00 847

R语言与网站分析：数据集样例及分类算法实现

针对《R语言与网站分析》一书未提供数据集和源代码的情况，自己动手整理了一个可用于其中分类算法的数据集，并且基于该数据集实现了朴素贝叶斯、SVM和人工神经网络等分类算法。附件中数据集、源程序和简要的说明文档。详细说明可参考：http://blog.csdn.net/elecjack/article/details/50726686

2016-02-23

GBT7354 局放检测国家标准

IEC60270对应的局放检测国家标准，主要是脉冲电流法测量局放

2010-11-08

旅行商问题最近插入法

旅行商问题最近插入法 TSP nearest insertion DEV C++ 29个城市节点

2009-12-27

matlab源程序牛顿插值法三次样条插值法

牛顿插值法和三次样条插值法的matlab源程序，附件中有详细的例题、算法说明、数据分析以及源程序

2009-12-20

Linux基本技能教程｛适合Linux初学者｝

Linux基本技能教程｛适合Linux初学者｝Linux基本技能教程｛适合Linux初学者｝

2009-09-29

Linux命令大全简明版

Linux命令大全简明版 Linux命令大全简明版

2009-09-29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

JackFeng's Blog

原创爬虫系列1：python简易爬虫分析

原创 scrapy爬取动态分页内容

原创 python编码问题分析

R语言与网站分析：数据集样例及分类算法实现

GBT7354 局放检测国家标准

旅行商问题最近插入法

matlab源程序牛顿插值法三次样条插值法

Linux基本技能教程｛适合Linux初学者｝

Linux命令大全简明版

空空如也

原创 爬虫系列1：python简易爬虫分析

原创 scrapy爬取动态分页内容

原创 python编码问题分析

R语言与网站分析：数据集样例及分类算法实现

GBT7354 局放检测国家标准

旅行商问题 最近插入法

matlab源程序 牛顿插值法 三次样条插值法

Linux基本技能教程｛适合Linux初学者｝

Linux命令大全 简明版

空空如也

原创爬虫系列1：python简易爬虫分析

旅行商问题最近插入法

matlab源程序牛顿插值法三次样条插值法

Linux命令大全简明版