pandas学习
用于pandas学习过程中的笔记总结和整合
笑 瘾
这个作者很懒,什么都没留下…
展开
-
Pandas处理日期数据
一、pandaas日期处理的作用:将2018-01-01、1/1/2018等多种日期格式映射成统一的格式对象,在该对象上提供强大的功能支持几个概念1、pd.to_datetime:pandas的一个函数,能将字符串、列表、series变成日期形式2、Timestamp:pandas表示日期的对象形式3、DatetimeIndex:pandas表示日期的对象列表形式其中DatetimeIndex是Timestamp的列表形式pd.to_datetime对单个日期字符串处理会得到Timesta原创 2022-05-10 23:51:39 · 3574 阅读 · 0 评论 -
Pandas怎样实现groupby分组统计
一、如何实现分组统计groupby:先对数据分组,然后在每个分组上应用聚合函数、转换函数通过三个实例来了解pandas是如何实现分组统计的一、分组使用聚合函数做数据统计二、遍历groupby的结果理解执行流程三、实例分组探索天气数据导入数据import pandas as pdimport numpy as np# 加上这一句,能在jupyter notebook展示matplot图表#%matplotlib inlinedf = pd.DataFrame({'A': ['foo',原创 2022-05-10 22:42:56 · 16189 阅读 · 0 评论 -
Pandas实现数据的合并concat
一、合并的使用介绍1、使用场景:批量合并相同格式的Excel、给DataFrame添加行、给DataFrame添加列2、一句话说明concat语法:使用某种合并方式(inner/outer)沿着某个轴向(axis=0/1)把多个Pandas对象(DataFrame/Series)合并成一个。3、concat语法:pandas.concat(objs, axis=0, join=‘outer’, ignore_index=False)objs:一个列表,内容可以是DataFrame或者Se原创 2022-05-10 21:55:37 · 43133 阅读 · 0 评论 -
Pandas怎样实现DataFrame的合并
一、merge(合并)的语法:pd.merge(left, right, how='inner', on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=True, suffixes=('_x', '_y'), copy=True, indicator=False, validate=None)参数介绍:left,right:要merge的dataframe或者有name的Serieshow:j原创 2022-05-10 21:38:27 · 29809 阅读 · 1 评论 -
Pandas数据排序
一、pandas的两种排序方法:1、Series的排序:Series.sort_values(ascending=True, inplace=False)参数说明:* ascending:默认为True升序排序,为False降序排序* inplace:是否修改原始Series2、DataFrame的排序:DataFrame.sort_values(by, ascending=True, inplace=False)参数说明:by:字符串或者List<字符串>,单列排序或者多列排序原创 2022-05-10 21:13:47 · 34125 阅读 · 1 评论 -
Pandas对缺失值的处理
一、pandas使用函数处理缺失数据1.isnull和notnull:检测是否是空值,可用于df和series2.dropna:丢弃、删除缺失值axis : 删除行还是列,{0 or ‘index’, 1 or ‘columns’}, default 0how : 如果等于any则任何值为空都删除,如果等于all则所有值都为空才删除inplace : 如果为True则修改当前df,否则返回新的df3.fillna:填充空值value:用于填充的值,可以是单个值,或者字典(key是列名,val原创 2022-05-09 23:48:42 · 9174 阅读 · 2 评论 -
Pandas新增数据列
一、pandas新增数据在进行数据分析时,经常需要按照一定条件创建新的数据列,然后进行进一步分析。1、pandas新增数据的四种方法1.直接赋值2.df.apply方法3.df.assign方法4.按条件选择分组分别赋值二、读取csv数据到dataframeimport pandas as pdfpath = "./datas/beijing_tianqi_2018.csv"df = pd.read_csv(fpath)df.head() ymd bWendu yWendu原创 2022-05-09 23:30:44 · 4032 阅读 · 0 评论 -
Pandas的数据转换函数
一、三种数据转换函数:map、apply、applymap1.map:只用于Series,实现每个值->值的映射;2.apply:既可以用于Series实现每个值的处理,也可以用于Dataframe实现某个轴的Series的处理;3.applymap:只能用于DataFrame,用于处理该DataFrame的每个元素;二、map用于Series值的转换1.实例:将股票代码英文转换成中文名字Series里面传入一个字典和函数都可以,即Series.map(dict) or Series.m原创 2022-05-08 23:29:18 · 709 阅读 · 0 评论 -
Pandas查询选取数据
一、Pandas查询数据的几种方法1.df[]按行列选取,这种情况一次只能选取行或者列2.df.loc方法,根据行、列的标签值查询3.df.iloc方法,根据行、列的数字位置查询,根据索引定位4.df.query方法二、Pandas使用df.loc查询数据的方法1.使用单个label值查询数据2.使用值列表批量查询3.使用数值区间进行范围查询4.使用条件表达式查询5.调用函数查询注意以上查询方法,既适用于行,也适用于列三、df[]#np.random.rand(25):是用n原创 2022-05-07 23:37:54 · 6496 阅读 · 0 评论 -
Pandas的基本功能
Pandas的基本功能一、Pandas的常用32个方法和功能DataFrame() 创建一个DataFrame对象df.values 返回ndarray类型的对象df.shape 返回行列数df.index 获取行索引df.set_index 设置索引df.reset_index 重制索引df.columns 获取列索引df.rename 重新设置列名df.dtypes 查看每列数据类型df.axes 获取行及列索引df.T 行与列对调df.info() 打印DataFrame对象原创 2022-05-07 23:23:56 · 1516 阅读 · 0 评论 -
pandas的简单介绍和数据结构
pandas简单介绍一、python数据分析三剑客:numpypandasMatplotlib二、介绍三剑客:1.Numpy:Python语言的一个扩展程序库,支持大量的维度数据与矩阵运算,针对数组提供大量的数学函数库2.pandas:是一个强大的分析结构化数据的工具集;它的使用基础是Numpy(提供高性能的矩阵运算);用于数据挖掘和数据分析,同时也提供数据清洗功能。3.Matplotlib:是一个python绘图包三、pandas的安装1、下载使用Python类库集成安装包2、pi原创 2022-05-07 23:06:36 · 1477 阅读 · 0 评论