【Python】DataFrame基本数据基本导入处理

自己学习的代码整理文件,方便使用,想起来还会再接着补充

读取文件

import pandas as pd
#csv,excel,txt文件导入代码 
##index_colindex_col='列名' 把此列作为index列
csv_data = pd.read_csv('文件路径.csv',encoding='utf-8')
excel_data = pd.read_excel('文件路径.xlsx',encoding='utf-8',encoding='utf-8')
txt_data = pd.read_table('文件路径.txt',encoding='utf-8')

存储文件

# sep='\t';index=False; encoding='utf-8'
csv_data.to_csv('文件名.csv')
txt_data.to_csv('文件名.txt')
excel_data.to_excel('文件名.xlsx')

更改Dataframe列名

data.columns=['列名1','列名2','列名3']

删除列、行

#labels:要删除的行或列,用列表给出
#axis:默认为0,指要删除的是行,删除列时需指定axis为1
#index :直接指定要删除的行,删除多行可以使用列表作为参数
#columns:直接指定要删除的列,删除多列可以使用列表作为参数
#inplace = True 覆盖之前的DataFrame
data.drop('列名',axis=1)

索引设置

#inplace=True 将序列号设置为索引
#drop = True 删除原始的索引
#如果要将原始索引保留为数据字符串,则可以在reset_index之后使用set_index
data.reset_index()
data.set_index()

缺失值删除

#inplace = True
#删除缺失行
data.dropna()

#删除缺失列
data.dropna(axis=1) 
data.dropna(axis='columns') 

# 删除所有值都缺失的行
data.dropna(how = 'all')
 
# 删除至少有两个缺失值的行
data.dropna(thresh = 2)
 
# 判断缺失值的列范围
data.dropna(subset = ['列1','列2'])

# 指定列的缺失值删除
data.列名.dropna()

  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Flechazo_JY

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值