Pandas(一)调用Pandas

3 篇文章 0 订阅
3 篇文章 0 订阅

生成表格

  • 调用pandas库
import pandas as pd
  • 调用DataFrame:
df = pd.DataFrame(data = data)

参数:

data: 可以使用标量,变量,方法,字典等

index: 默认为数字,修改见下文

column:默认为表格内原有值或数值,修改见下文

 实例:

  • 加载Excel:
# csv格式
df = pd.read_csv('data_set.csv')
# xlsx格式
df = pd.read_xlsx('data_set.xlsx')

实例:  

 操作相似,只展示一种文件格式

基础信息

  • 维度查看
#维度查看
df.shape

#数据格式查看
df.dtypes

#查看数据结构(行数,列名,null值情况,数据格式等)
df.info()

#查看某列唯一值
df[column1].unique()

 实例:

查询数据维度与格式

查询数据信息与唯一值

 

  • 值查看
df.values

实例:查询值

 

  • 索引查看及修改
#查看
df.index

#修改方法1:
df.reset_index()

#修改方法2:
df.rename(index={0:'修改值'})

实例: 查询索引

修改方法1:

 

 注:标红列为新的index,index列变为数据中的一部分

 修改方法2:该方法与修改列名方法3相似,详情见下

 

 注:方法2中要带参数inplace默认值为False,使用时需调整为inplace=True,否则不会在原数据集上修改列表名称 

  • 列名查看及修改
#查询
df.columns

#修改:方法1
columns_change = ['', '', '']
df.columns = columns_change


#修改:方法2
df.rename(columns={'categoru':'category_size'})

注:

方法1用于修改列名的列表,里面的值的数量需要与df中列的数量保持一致,否则报错;

方法2无该上述问题,用字典把原字段名称和需要改的名字组成键值对即可 

 实例:查询列名

修改方法1:

修改方法2: 

 

注:方法2中要带参数inplace默认值为False,使用时需调整为inplace=True,否则不会在原数据集上修改列表名称 

  • 综合查看
#数据集的值查看
df.head()

#数据集的值查看
df.tail()

实例:数据集查看

head()中填几就显示表头几行数据,默认值为5 

tail()中填几就显示表尾几行数据,默认值为5 

 

  • 空值查看
# 空值查看
df.isnull

# 某列空值查看
df['column'].isnull

实例:

全表空值查看

某列空值查看

 

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Charliewyzzzz

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值