pandas中read_csv的缺失值处理

最新推荐文章于 2024-07-16 21:58:09 发布

dzysunshine

最新推荐文章于 2024-07-16 21:58:09 发布

阅读量1w

点赞数 2

分类专栏：机器学习 python相关用法文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dzysunshine/article/details/83418994

版权

机器学习同时被 2 个专栏收录

46 篇文章 8 订阅

订阅专栏

python相关用法

18 篇文章 3 订阅

订阅专栏

今天遇到的问题是，要将一份csv数据读入dataframe，但某些列中含有NA值。对于这些列来说，NA应该作为一个有意义的level，而不是缺失值，但read_csv函数会自动将类似的缺失值理解为缺失值并变为NaN。
看pandas文档中read_csv函数中这两个参数的描述，默认会将’-1.#IND’, ‘1.#QNAN’, ‘1.#IND’, ‘-1.#QNAN’, ‘#N/A N/A’,’#N/A’, ‘N/A’, ‘NA’, ‘#NA’, ‘NULL’, ‘NaN’, ‘-NaN’, ‘nan’, ‘-nan’, ''转换为NaN，且na_values参数还支持定义另外的应处理为缺失值的值。

值得注意的是keep_default_na参数，这个参数的作用是决定要不要保留默认应该转换的缺失值列表，将这个参数设为False之后同时不定义na_values参数，就可以在读取文件时不将任何值转换为缺失值NaN。
例：

import pandas as pd
df = pd.read_csv('train.csv', keep_default_na=False)

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
pandas中read_csv的缺失值处理

今天遇到的问题是，要将一份csv数据读入dataframe，但某些列中含有NA值。对于这些列来说，NA应该作为一个有意义的level，而不是缺失值，但read_csv函数会自动将类似的缺失值理解为缺失值并变为NaN。看pandas文档中read_csv函数中这两个参数的描述，默认会将’-1.#IND’, ‘1.#QNAN’, ‘1.#IND’, ‘-1.#QNAN’, ‘#N/A N/A’,’#...
复制链接

扫一扫

专栏目录

dzysunshine CSDN认证博客专家 CSDN认证企业博客

码龄6年

175: 原创

3万+: 周排名

5万+: 总排名

55万+: 访问

: 等级

4515: 积分

383: 粉丝

630: 获赞

191: 评论

2838: 收藏

私信

关注

热门文章

分类专栏

最新评论

ChatGLM3-6B模型介绍及微调
Jasmine0224: 这些都是官方样例，博主有没有微调过自己的数据，以及有没有增大batchsize训练过？我最近训练时遇到一些问题，想请教一下
基于LoRA进行Stable Diffusion的微调
编程晓菜狗: 请问博主，数据集的格式和使用方法有官方文档可以查阅嘛，我看有些教程是使用yaml文件，有些是使用bash文件进行训练的
【self-instruct方式生成语料代码实战】
Lasson 李: step 4中生成的 all_generated_instances.jsonl 以及 gpt3_finetuning_data_336.jsonl 这两份数据，用途分别是什么？使用 gpt3_ 这份进行微调吗？还是说两份数据要同时扔给模型进行微调？
基于ChatGLM-Med与HuaTuo的微调部署
vs_zfx: 目前infer.sh里的配置都配完了但一运行就报错,在windows下运行的, ImportError: Using low_cpu_mem_usage=True or a device_map requires Accelerate: pip install accelerate 问下有遇到的朋友吗?查了github也没解决方案
ChatGLM3-6B模型介绍及微调
m0_64997058: 博主你的数据比较图的数据来源是哪里啊

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。