Python数据分析
文章平均质量分 97
建模是吧建模,建模!建模!
苍夜月明
又是努力变成大佬的一天
展开
-
Python 数据分析 —— Matplotlib ②
所谓双轴图,其实就是双y轴图,即一个图有两个y轴。既然y轴都有两个了,理所当然双轴图中的图也有两个。一个图定位坐标时看左边y轴,另一个看右边y轴。双轴图并不固定里面两个图的类型,可以 折线图+柱状图 ,也可以 两个折线图,随心所欲。目前双轴图支持的展示类型柱形图、折线图、堆积柱形图、面积图这四类图表样式。不过一般来说是 折线图+柱状图。 要实现双轴操作,就要用到 函数了。 根据电影评分绘制电影数量和评分的频率分布双轴图 生成概率密度函数,需要导包PS:这看起来原创 2022-06-10 00:57:22 · 2442 阅读 · 4 评论 -
Python 数据分析 —— Matplotlib ①
matplotlib 是一个 Python 的 2D 图形包。pyplot 封装了很多画图的函数。 导入相关的包: 包含一系列类似 MATLAB 中绘图函数的相关函数。每个 matplotlib.pyplot 中的函数对当前的图像进行一些修改,例如:产生新的图像,在图像中产生新的绘图区域,在绘图区域中画线,给绘图加上标记,等等… matplotlib.pyplot 会自动记住当前的图像和绘图区域,因此这些函数会直接作用在当前的图像上。在实际的使用过程中,常以 作为 matplotli原创 2022-06-08 23:59:18 · 7230 阅读 · 2 评论 -
Python 数据分析 —— Pandas ③
先导包再读数据这样才能正式开始学习 一个轴上拥有多个索引,使⾼维数据可以被紧凑的表示在我们熟悉的⼀维Series和⼆维DataFrame对象中,即降低维度形式处理高维度数据。 多重索引通过 参数实现:查看索引:MultiIndex 意思是:多索引 切片: 取内层: 逗号(,)前是外层,逗号(,)后是内层 取所有外层的 索引为1内层:取(c,2)元素: 通过 (不堆叠)方法可以将Series变成一个DataFrame外层原创 2022-06-07 11:44:01 · 2333 阅读 · 2 评论 -
Python 数据分析 —— Pandas ②
首先:读入 movie_data.xlsx查看一下前5行数据 在做数据分析时,原始数据往往会因为各种各样的原因产生各种数据格式问题。数据格式是我们非常需要注意的一点,数据格式错误往往会造成很严重的后果。并且,很多异常值在我们经过格式转换后才会发现,对我们规整数据,清洗数据有着重要的作用。常用方法: 查看某一列数据的具体格式 先看产地格式 用 astype 转化 报错了,因为这一列数据中有个异常数据,不能成功原创 2022-06-05 18:47:25 · 1040 阅读 · 4 评论 -
Python 数据分析 —— Numpy
文章目录小引 —— 为什么要学numpy?numpy 简介numpy用法:创建数组 —— numpy.array()生成整数序列 —— numpy.arange()生成等差数列 —— numpy.linspace()生成0到1随机数数组 —— numpy.random.rand()生成服从标准正态分布随机数的数组 —— numpy.random.randn()生成随机整数数组 —— numpy.random.randint()一维数组基本方法多维数组基本方法多维数组切片numpy数组的切片是引用一维花式索引原创 2022-05-20 15:42:02 · 3271 阅读 · 6 评论 -
Python 数据分析 —— Pandas ①
Python Data Analysis Library 或 pandas 是基于 numpy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。Pandas 提供了大量能使我们快速便捷地处理数据的函数和方法。 导入库: Pandas 中有两种常用的基本结构:一维数组,与Numpy中的一维array类似。二者与Python基本的数据结构 list也很相近。Series能保存不同种数据类型,字原创 2022-06-04 18:49:58 · 1575 阅读 · 3 评论