自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

困而学之,学思并重

学而不思则罔,思而不学则殆。

  • 博客(9)
  • 资源 (2)
  • 问答 (1)
  • 收藏
  • 关注

原创 时间序列实战(一)

导入数据,并转化为时间序列#coding:utf-8import numpy as npimport pandas as pdfrom datetime import datetimeimport matplotlib.pylab as pltplt.rcParams['font.sans-serif']=['SimHei']from matplotlib.pylab import rc

2016-07-31 18:12:15 25156 5

原创 时间序列分析

时间序列的特点序列中的数据或数据点的位置依赖于时间,即数据的取值依赖于时间的变化,但不一定是时间t的严格函数。每一时刻的取值或数据点的位置具有一定的随机性,不可能完全准确地用历史数据预测。前后时刻(不一定是相邻时刻)的数值或数据点的位置有一定的相关性,这种相关性就是系统的动态规律性。从整体上看,时间序列往往呈现出某种趋势性或出现周期性变化的现象。 因此,建立时间序列模型,首先应当仔细分析对

2016-07-30 14:41:11 10992 1

原创 爬虫例子——多页、函数模板

爬取地址:http://bj.xiaozhu.com/ 包含信息:多页;每页24个链接 爬取要求:爬取每个链接的标题、地址、价格、图片链接、主人名称、主人性别from bs4 import BeautifulSoupimport requestsdef get_info(page_number): urls = get_page_link(page_number) for ur

2016-07-21 18:17:36 1830

原创 使用爬虫抓取网站异步加载数据

什么是异步加载? 向网站进行一次请求,一次只传部分数据。如:有些网页不需要点击下一页,其内容也可以源源不断地加载。如何发现异步加载? 1、打开浏览器,右键选择“检查” 2、点击“Network”、“XHR” 这样在网页进行不断下拉的过程中,显示器会记录全部动作。可以看到不断加载新的页。如何加载异步数据? 具体例子:from bs4 import BeautifulSoupimpor

2016-07-15 13:48:50 19956 3

原创 爬取贴吧上的图片到本地

获取整个页面数据#coding=utf-8import urllibdef getHtml(url): page = urllib.urlopen(url) html = page.read() return htmlhtml = getHtml("http://tieba.baidu.com/p/2738151262")print htmlurllib 模块提供了读取w

2016-07-11 13:09:54 6896

原创 python网络刷博器爬虫

主要面临三个问题: * 如何打开浏览器 * 如何刷“阅读次数” * 如何关闭浏览器import webbrowser as webimport time import osimport randomcount = random.randint(20,40)#随机产生一个20 到40 之间的随机数j = 0while j < count: i = 0 while i

2016-07-11 10:11:51 539

原创 爬虫笔记

在python中打开网页import webbrowser as webweb.open_new_tab('http://www.baidu.com')获取网页状态码#coding:utf-8import urlliburl = 'http://www.baidu.com'html = urllib.urlopen(url)print html.getcode()输出:200HTTP状态码

2016-07-11 09:31:55 2903

原创 Python爬虫——下载韩寒博客文章

韩寒新浪博客:http://blog.sina.com.cn/s/articlelist_1191258123_0_1.html 提醒:韩寒的新浪博客文章共有316篇,共7页。爬取第一页的前十篇文章,并下载到本机#coding:utf-8import urllibimport timeurl = ['']*10 con = urllib.urlopen('http://blog.si

2016-07-08 19:28:19 2150 2

原创 java中的集合框架(一)

集合框架概述集合的概念 现实生活中的集合:很多的事物凑在一起 数学中的集合:具有共同属性的事物的总体 java中的集合类:是一种工具类,就像是容器,存储任意数量的具有共同属性的对象集合的作用 1.在类的内部,对数据进行组织; 2.简单而快速的搜索大数量的条目; 3.有的集合接口,提供了一系列排列有序的元素,并且可以在序列中间快速插入或者删除有关元素; 3.有的集合接口,提供了映射关

2016-07-08 17:33:18 407

蓝牙协议的体系结构

主要包括两方面内容: 1、蓝牙技术 介绍蓝牙的起源、实质和蓝牙的技术特。 2、蓝牙协议体系 介绍蓝牙协议、蓝牙协议的体系结构以及核心协议。

2016-05-02

Hadoop2.6.0集群环境搭建

1.linux系统:Ubuntu14.04 2.hadoop版本:hadoop-2.2.0 3.JDK版本:Jdk1.8.0_74

2016-04-28

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除