Pandas处理数据常用操作

本文介绍了使用Pandas处理数据的基本操作,包括通过指定encoding正确读取含中文字符的CSV文件,查看数据的统计信息,如缺失值,以及如何进行异常数据处理,如转换数据类型、填充缺失值和删除含有特定字符的数据样本。
摘要由CSDN通过智能技术生成

数据来源天池新人赛工业蒸汽预测数据https://tianchi.aliyun.com/competition/entrance/231693/introductionspm=5176.12281973.1005.4.3dd574ffWvvEJ0

数据读取:

path = r'train_datasets.txt'
df = pd.read_csv(path,seq = '\t')#既可以对txt文件又可以对csv,xls等文件读取
df = pd.read_table(path)  #多用于对txt文件

对于一些含有中文字符的文件读取,如果对encoding参数不加以指定会出现乱码情况,所以需要注意文件的编码方式,一般来说现在的一些非图像数据采用的多是用csv或者txt文件形式的,查看或更改其编码方式的时候可以利用Excel,按如下方式查看

首先查看数据文件的字符编码方式࿰

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值