机器学习(提前篇):pandas库(基础)

机器学习(提前篇):pandas库(基础)

下面是我在学习pandas库的时候总结出的比较常用的几个函数,在这里做一下笔记以防忘记。

1. Pandas读取外部数据

读取函数函数作用
pd.read_csv(filename)导入csv文档
pd.read_table(filename)导入分割的文件文本(如TSV)
pd.read_excel(filename)导入Excel文档
pd.read_sql(query, connection_object)读取SQL表/数据库
pd.read_json(json_string)读取JSON格式的字符串,URL或文件
pd.read_html(url)解析Html URL, 字符串或文件,并将表提取到数据框列表
pd.read_clipboard()获取剪切板的内容并将其传给read_table()
写入函数函数作用
df.to_csv(filename)写入csv文件
df.to_excel(filename)写入excel文件
df.to_sql(table_name, connection_object)写入一个SQL表
df.to_json(filename)写入JSON格式的文件

2.Pandas数据结构

数据结构维数说明
Series1序列/系列;一维数组
DataFrame2数据框/表格;二维数组
Panel3面板;三维数组

3.数据框数据的索引于选取

选取对象方法
行列df[]
区域df.loc[], df.iloc[], df.ix[]
单元格df.at[] , df.iat[]
选取方法说明
loc[]根据index行标签或colmun列名称来选取
iloc[]基于行/列的position(行数列数)

4.Pandas描述性统计

函数描述
df.count()非空观测数量
df.sun()所有值的和
df.mean()所有值的平均值
df.median()所有值的中位数
df.mode()值的模值
df.std()值的标准差
df.min()所有值中的最小值
df.max()所有值中的最大值
df.abs()绝对值
df.prod()数组元素的乘积
df.cunsum()累计总和
df.cumprod()累计乘积

5.判断空值函数

函数作用
pd.dropna(axis=0, how=‘any’,thresh=None,subset=None,inplace=False)(1)axis:维度,axis=0表示行,1表示列 (2)how:"all"表示这一行或列中的元素完全消失才删除这一行或列,“any”表示只要有数值为空,即删除这一行(3)thresh:表示这一行或列出现多少个空才删除
pd.fillna(value=None,method=Node,inplace=False,limit=None,downcast=None,**kwargs)(1)value:用什么值去填充缺失值。(2)axis:确定填充维度。
pd.isna()判断是不是缺失值
pd,isnull()判断是不是缺失值
  • 2
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值