python
文章平均质量分 73
洗手洗红豆
这个人很懒,什么也留不下
展开
-
python入门,自制小爬虫获得百度贴吧内容
最近开始接触python,光学习语法感觉有些犯困.既然是脚本语言,还是制作一些工具好一些,而有关python,最出名的大概就是爬虫了.去网上找了一些例子,最后自己完成了一个小爬虫.环境 : python 2.7需求 : 获取某个帖子中的发帖内容,组合成一个网页制作简单爬虫不需要额外下载模块,只需要导入几个自带模块就可以# -*- coding: utf-8 -*-import urllib2原创 2016-05-03 20:00:21 · 583 阅读 · 0 评论 -
ipython pyQt/notebook 的配置
前言 : 最近在学习pandas, 发现ipython很好用. 本文主要介绍如何配置pyQt与notebookipythonipython可以通过pip来进行安装, pip install ipython 下到对应的版本.下载完成后, 在命令行输入ipython就可以进入了. 如果你有安装matplotlib的话, 可以输入ipython --pylab, 进行gui绘图. import原创 2016-09-20 11:57:45 · 1312 阅读 · 0 评论 -
scrapy + pandas 进行数据分析的一个例子
在没有看<利用python进行数据分析>之前一直不太明白数据分析是什么事情, 就跟学了很久python以后, 还是要时常搜索下, python能用来干嘛. 学了这两个模块后, 总算对于数据分析有一个初步的概念, 进行了一次实践 注意 : 本文原则上不提供scrapy或者pandas的使用方法介绍. 环境python2.7scrapypandasmatplotlibwindow原创 2016-11-04 17:37:36 · 3535 阅读 · 1 评论 -
scrapy入门的一个例子
scrapy入门的一个例子 最近在尝试进行数据分析, 首先从数据挖掘开始, 无可避免地找到了scrapy.安装以及最基础的教程Scrapy入门教程目标爬取豆瓣动画tag下的所有标题图.项目环境python 2.7windows具体首先打开豆瓣动画tag的页面, 分析一下urlhttps://movie.douban.com/tag/%E5%8A%A8%E7%94%BB?start=0原创 2016-10-28 18:52:13 · 426 阅读 · 0 评论 -
使用python(pandas)将数据处理成交叉分组表
交叉分组表是汇总两种变量数据的方法, 在很多场景可以用到, 本文会介绍如何使用pandas将包含两个变量的数据集处理成交叉分组表.环境pandaspython 2.7原理用坐标轴来进行比喻, 其中一个变量作为x轴, 另一个作为y轴, 如果定位到数据则累加一, 将所有数据遍历一遍, 最后的坐标轴就是一张交叉分组表(使用坐标轴展示的数据一般是连续的, 交叉分组表的数据是离散的).具体实现示例数据原创 2017-05-19 13:27:44 · 6445 阅读 · 1 评论