- 博客(9)
- 资源 (2)
- 问答 (1)
- 收藏
- 关注
原创 时间序列实战(一)
导入数据,并转化为时间序列#coding:utf-8import numpy as npimport pandas as pdfrom datetime import datetimeimport matplotlib.pylab as pltplt.rcParams['font.sans-serif']=['SimHei']from matplotlib.pylab import rc
2016-07-31 18:12:15 25156 5
原创 时间序列分析
时间序列的特点序列中的数据或数据点的位置依赖于时间,即数据的取值依赖于时间的变化,但不一定是时间t的严格函数。每一时刻的取值或数据点的位置具有一定的随机性,不可能完全准确地用历史数据预测。前后时刻(不一定是相邻时刻)的数值或数据点的位置有一定的相关性,这种相关性就是系统的动态规律性。从整体上看,时间序列往往呈现出某种趋势性或出现周期性变化的现象。 因此,建立时间序列模型,首先应当仔细分析对
2016-07-30 14:41:11 10992 1
原创 爬虫例子——多页、函数模板
爬取地址:http://bj.xiaozhu.com/ 包含信息:多页;每页24个链接 爬取要求:爬取每个链接的标题、地址、价格、图片链接、主人名称、主人性别from bs4 import BeautifulSoupimport requestsdef get_info(page_number): urls = get_page_link(page_number) for ur
2016-07-21 18:17:36 1830
原创 使用爬虫抓取网站异步加载数据
什么是异步加载? 向网站进行一次请求,一次只传部分数据。如:有些网页不需要点击下一页,其内容也可以源源不断地加载。如何发现异步加载? 1、打开浏览器,右键选择“检查” 2、点击“Network”、“XHR” 这样在网页进行不断下拉的过程中,显示器会记录全部动作。可以看到不断加载新的页。如何加载异步数据? 具体例子:from bs4 import BeautifulSoupimpor
2016-07-15 13:48:50 19956 3
原创 爬取贴吧上的图片到本地
获取整个页面数据#coding=utf-8import urllibdef getHtml(url): page = urllib.urlopen(url) html = page.read() return htmlhtml = getHtml("http://tieba.baidu.com/p/2738151262")print htmlurllib 模块提供了读取w
2016-07-11 13:09:54 6896
原创 python网络刷博器爬虫
主要面临三个问题: * 如何打开浏览器 * 如何刷“阅读次数” * 如何关闭浏览器import webbrowser as webimport time import osimport randomcount = random.randint(20,40)#随机产生一个20 到40 之间的随机数j = 0while j < count: i = 0 while i
2016-07-11 10:11:51 539
原创 爬虫笔记
在python中打开网页import webbrowser as webweb.open_new_tab('http://www.baidu.com')获取网页状态码#coding:utf-8import urlliburl = 'http://www.baidu.com'html = urllib.urlopen(url)print html.getcode()输出:200HTTP状态码
2016-07-11 09:31:55 2903
原创 Python爬虫——下载韩寒博客文章
韩寒新浪博客:http://blog.sina.com.cn/s/articlelist_1191258123_0_1.html 提醒:韩寒的新浪博客文章共有316篇,共7页。爬取第一页的前十篇文章,并下载到本机#coding:utf-8import urllibimport timeurl = ['']*10 con = urllib.urlopen('http://blog.si
2016-07-08 19:28:19 2150 2
原创 java中的集合框架(一)
集合框架概述集合的概念 现实生活中的集合:很多的事物凑在一起 数学中的集合:具有共同属性的事物的总体 java中的集合类:是一种工具类,就像是容器,存储任意数量的具有共同属性的对象集合的作用 1.在类的内部,对数据进行组织; 2.简单而快速的搜索大数量的条目; 3.有的集合接口,提供了一系列排列有序的元素,并且可以在序列中间快速插入或者删除有关元素; 3.有的集合接口,提供了映射关
2016-07-08 17:33:18 407
CSDN中编写公式,为何公式后面有一个竖杠?
2016-09-08
TA创建的收藏夹 TA关注的收藏夹
TA关注的人