浅析python数据分析
文章平均质量分 69
算是比较基础的数据分析,涉及numpy,pandas,matplotlib,结巴分词等,数据分析相关库的基础用法。数据来源均从本人的爬虫专栏里获取,有对应教程。欢迎交流哈~
7voyage
这个作者很懒,什么都没留下…
展开
-
城市名称数据清洗
城市名称数据清洗有很多城市信息的脏数据如下:这里提供的思路是将这些数据放到某个地图网站上,自动匹配用爬虫的原理来实现数据清洗(这里保留空数据):代码如下:import reimport numpy as npimport pandas as pdimport requests,jsonfrom pandas import DataFramedef clean(dirty_ci...原创 2019-03-03 21:20:23 · 1077 阅读 · 0 评论 -
关于Pandas中SettingwithCopyWarning的解决。
英文原版:https://www.dataquest.io/blog/settingwithcopywarning/中文友联:https://www.jianshu.com/p/72274ccb647a转载 2019-03-03 09:46:27 · 472 阅读 · 0 评论 -
DataFrame索引和切片
DataFrame索引和切片学DataFrame以前要先了解下Series,可以简单的说Series是一维的ndarray,也可以说它是某种特定环境下的列表。结构:index values: 默认情况下index是0,1,2… 可以在创建的时候自己设定index的值。Series 中存放的数据只能是一维。行索引 列切片结构DataFrame在Series基础上扩充到二维,三个关键参数...原创 2019-02-25 18:51:18 · 1655 阅读 · 0 评论 -
numpy对图像的变换
文章目录图像旋转镜像旋转上下倒置上下左右全相反顺时针旋转90度逆时针旋转90度颜色处理反色图像剪切与拼接拼接剪切import matplotlib.pyplot as pltimport numpy as npfish = plt.imread('fish.jpg')plt.imshow(fish)图像旋转镜像旋转# 镜像旋转fish1 = fish[:,::-1,:]plt...原创 2019-02-18 12:16:47 · 1280 阅读 · 0 评论 -
numpy基础知识
numpy基础知识文章目录numpy基础知识ndarray创建由list创建使用np.routines函数创建索引和切片方法同列表 左闭右开变形及联np.concatenate() axis默认为0 注意维度对应np.hstack() 与 np.vstack()切分副本创建副本使用 np.copy()ndarray的聚合操作在python中有一种数据格式,如同list,dic,tuple,一样...原创 2019-02-17 21:47:47 · 395 阅读 · 0 评论 -
matplotlib简单的条形图应用
matplotlib简单的条形图应用——二手车销量用pandas从csv文件中获取数据用到的库:import pandas as pdimport numpy as npimport matplotlibimport matplotlib.pyplot as plt二手车数据获取:https://blog.csdn.net/qq_42776455/article/details/8...原创 2018-12-18 10:54:08 · 196 阅读 · 0 评论 -
爬取豆瓣短评并输出词云
说明:爬取豆瓣电影,书籍,音乐(可选择)的所有短评信息,最终筛选出现频率最高的100词生成词云。但是我这个写的有点问题是,在挂代理ip测试时把豆瓣账号永久封禁,造成了电影短评无法全部获取,但书籍,和音乐无影响。代码详情见Github。详细介绍:代码结构: GetID_Douban.py:需要传入两个参数,一个是爬取对象名称,一个是对象类型(从movie,music,bo...原创 2018-07-26 09:38:48 · 808 阅读 · 0 评论