自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

JackFeng's Blog

数据挖掘分析

  • 博客(3)
  • 资源 (6)
  • 收藏
  • 关注

原创 爬虫系列1:python简易爬虫分析

讲爬虫的基本原理和简易示例,包括单个网页和多网页爬虫的分析。

2016-05-29 16:58:25 2335 1

原创 scrapy爬取动态分页内容

难点:1) scrapy如何动态加载所有“下一页”:要知道scrapy本身是不支持js操作的。2) 如何确保页面内容加载完成后再进行爬取:由于内容是通过js加载的,如果不加控制,很可能出现爬到空页面的情况。处理方法:1)scrapy+selenium模拟浏览器点击:通过模拟浏览器点击的方式进行翻页,从而获取每一页内部的有效链接。2)使用WebDriverWait()等待数据加载:即确保对应内容加载完成后,在进行相应爬取任务。

2016-05-29 16:12:12 21893 1

原创 python编码问题分析

主要介绍:1、编码转换的基本原理;2、将列表中的数字、字符串、Unicode都转换为string;3、将编码为A的数据,输出到编码为B的文件。

2016-05-28 17:32:00 847

R语言与网站分析:数据集样例及分类算法实现

针对《R语言与网站分析》一书未提供数据集和源代码的情况,自己动手整理了一个可用于其中分类算法的数据集,并且基于该数据集实现了朴素贝叶斯、SVM和人工神经网络等分类算法。附件中数据集、源程序和简要的说明文档。 详细说明可参考:http://blog.csdn.net/elecjack/article/details/50726686

2016-02-23

GBT7354 局放检测国家标准

IEC60270对应的局放检测国家标准,主要是脉冲电流法测量局放

2010-11-08

旅行商问题 最近插入法

旅行商问题 最近插入法 TSP nearest insertion DEV C++ 29个城市节点

2009-12-27

matlab源程序 牛顿插值法 三次样条插值法

牛顿插值法和三次样条插值法的matlab源程序,附件中有详细的例题、算法说明、数据分析以及源程序

2009-12-20

Linux基本技能教程{适合Linux初学者}

Linux基本技能教程{适合Linux初学者}Linux基本技能教程{适合Linux初学者}

2009-09-29

Linux命令大全 简明版

Linux命令大全 简明版 Linux命令大全 简明版

2009-09-29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除