python数据清洗数据表处理

本文介绍了Python进行数据清洗的一些关键操作,包括常用库的使用、数据的读取和保存、数据筛选、数据增加与删除,特别是loc和iloc的运用,以及数据整理和层次化索引。内容涵盖数据查看、简单索引以及如何处理特定问题,如编码问题和DataFrame的to_excel()函数的使用。
摘要由CSDN通过智能技术生成

1.常用库

import pandas as pd
import numpy as np
import xlrd  #Excel数据处理
import os
#更改文件路劲
os.chdir(r'E:\python\数据')

2.数据读取

常用编码为utf-8、gbk 、gbk2312和gb18030等。

#读取csv数据
df = pd.read_csv('baby_trade_history.csv', encoding='utf-8',dtype={'user_id':str})
df1 = pd.read_csv('sam_tianchi_mum_baby.csv',encoding = 'utf-8',dtype =str)  #将数据转换为字符串格式
#读取excel数据
import xlrd
workbook = xlrd.open_workbook('meal_order_detail.xlsx')
sheet_name = workbook.sheet_names() #返回所有sheet的列表
order1 = pd.read_excel('meal_order_detail.xlsx',sheet_name ='meal_order_detail1',engine="python",encoding = "gbk")   #如果表格中有中文容易报错,加上engine="python"
open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)  # 文件路径,模式,缓冲,编码格式,错误处理方式,换行符(只适用于文本模式),如果closefd为False则当文件关闭时基础文件描述符将保持打开状态。
"""
模式 
r--打开读取(默认)
w--打开进行写入,首先截断文件
x--创建一个新文件并打开它进行写入
a--打开进行写入,如果文件存在,则追加到文件末尾
b--二进制模式
t--文本模式(默认)
+--打开磁盘文件进行更新(读和写)
u--通用换行符模式(已弃用)
"""

3. 数据保存成文件

df.to_csv(‘df.csv’,index=False)
df.to_excel('a1.xlsx', sheet_name=‘sheet1', index= False,encoding='utf-8")

如果报错module ‘pandas’ has no

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值