![](https://img-blog.csdnimg.cn/20191205002612931.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
数据分析
有意识的呼吸
CSDN就是个笔记本。
展开
-
《洪水调节课程设计》任务 -- matplotlib练习
老同学需要完成这个课程设计,但他不会画图表,于是我帮帮他~代码如下:导入库和设置字体import pandas as pdimport numpy as npfrom matplotlib import pyplot as pltplt.rcParams['font.family'] = ['sans-serif']plt.rcParams['font.sans-serif'] = ...原创 2020-01-06 16:31:58 · 633 阅读 · 0 评论 -
【慢慢更新】数据分析实战——知乎排行前一万的都是哪些人?
其他几个专栏零零散散讲了许多爬虫,数据库方面的知识。因为数学奇差的原因,在数据分析方面也就是很low了。所以我将这两天我学到的实战一下:运行环境:python 3.7.4展示环境:jupyter一、导入数据我们以粉丝数为判断依据,从MongoDB中倒序取出前10K条数据:from pymongo import MongoClientimport pandas as pdimport ...原创 2019-12-11 03:52:57 · 181 阅读 · 0 评论 -
malplotlib 扇形图
pie(x, explode=None, labels=None, colors=None, autopct=None, pctdistance=0.6, shadow=False, labeldistance=1.1, startangle=None, radius=None)参数:x:每一块的比例,如果sum(x)>1会使sum(x)归一化labels:显示饼图外侧的说明文字e...原创 2019-11-27 22:09:37 · 166 阅读 · 0 评论 -
Pandas数据处理与透视
import pandas as pdimport numpy as npdf = pd.read_excel('豆瓣电影数据.xlsx')df.head()Out[]:Unnamed: 0 名字 投票人数 类型 产地 上映时间 时长 年代 评分 首映地点0 0 肖申克的救赎 692795.0 剧情/犯罪 美国 1994-09-10 00:00:00 142 1994 9.6 多伦...原创 2019-11-25 08:15:21 · 135 阅读 · 0 评论 -
Pandas 行列操作 与 数据选择
import pandas as pdimport numpy as npPandas读取数据及数据操作以豆瓣电影数据作为示例:【点击下载】df = pd.read_excel("豆瓣电影数据.xlsx")df.head()Out[]:Unnamed: 0 名字 投票人数 类型 产地 上映时间 时长 年代 评分 首映地点0 0 肖申克的救赎 692795.0 剧情/犯罪 美国 1...原创 2019-11-23 21:15:24 · 215 阅读 · 0 评论 -
Pandas基本数据类型
import pandas as pdimport numpy as npList item基本数据结构Series一维数组,与Numpy中的array类似,与Python中的List类似。Series能保存不同种数据类型。字符串、布尔值、数字都能保存在Series中。DataFrame二维的表格型数据结构。很多功能与R中的data.frame类似。可以将DataFrame理...原创 2019-11-23 15:30:27 · 660 阅读 · 0 评论 -
一篇文章学完 Numpy
import numpy as np一、产生数组从列表产生数组:l = [1,2,3,4]a = np.array(l)从列表传入:a = np.array([1,2,3,4])生成全0数组,默认浮点型:np.zeros(5)生成全1数组:np.ones(6, dtype='int')将数组设定为指定值:a = np.array(1,2,3,4,5)a.fill(...原创 2019-11-23 07:39:32 · 161 阅读 · 0 评论 -
matplotlib 直方图
plt.hist(datalist, 分组数或列表参数, 组距, normed=False)案例一假设你获取了250部电影的时长(列表a中),希望统计出这些电影时长的分布状态(比如时长为100分钟到120分钟电影的数量,出现的频率)等信息,你应该如何呈现这些数据?a = [131, 98, 125, 131, 124, 139, 131, 117, 128, 108, 135, 138, ...原创 2019-11-22 09:53:41 · 216 阅读 · 0 评论 -
matplotlib 条形图
plt.bar(x,y,width) plt.barh(x,y,height)单条形图案例假设你获取到了2017年内地电影票房前20的电影(列表a)和电影票房数据(列表b),那么如何更加直观的展示该数据?a = ["战狼2","速度与激情8","功夫瑜伽","西游伏妖篇","变形金刚5:最后的骑士","摔跤吧!爸爸","加勒比海盗5:死无对证","金刚:骷髅岛","极限特工:终极回归","...原创 2019-11-22 06:06:55 · 187 阅读 · 0 评论 -
matplotlib 散点图
plt.scatter(x,y)散点图案例假设通过爬虫你获取到了北京2016年3,10月份每天白天的最高气温(分别位于列表a,b),那么此时如何寻找出气温和随时间(天)变化的某种规律?a= [11,17,16,11,12,11,12,6,6,7,8,9,12,15,14,17,18,21,16,17,20,14,15,15,15,19,21,22,22,22,23]b = [26,26,2...原创 2019-11-22 05:08:10 · 101 阅读 · 0 评论 -
matplotlib 折线图
一、案例假设大家在30岁的时候,根据自己的实际情况,统计出来了从11岁到30岁每年交的女(男)朋友的数量如列表a,请绘制出该数据的折线图,以便分析自己每年交女(男)朋友的数量走势a = [1,0,1,1,2,4,3,2,3,4,4,5,6,5,4,3,3,1,1,1]要求:y轴表示个数x轴表示岁数,比如11岁,12岁等from matplotlib import pyplot as...原创 2019-11-21 19:52:34 · 233 阅读 · 0 评论 -
matplotlib 入门
一、什么是 matplotlibmatplotlib: 最流行的Python底层绘图库,主要做数据可视化图表,名字取材于MATLAB,模仿MATLAB构建二、上手案例假设一天中每隔两个小时(range(2,26,2))的气温(℃)分别是[15,13,14.5,17,20,25,26,26,27,22,18,15]from matplotlib import pyplot as pltx...原创 2019-11-21 15:04:39 · 197 阅读 · 0 评论