pandas神坑:如果列有NAN,则默认给数据转换为float类型

最新推荐文章于 2024-05-08 23:33:54 发布

yuxiaoyanran2020

最新推荐文章于 2024-05-08 23:33:54 发布

阅读量1.4k

点赞数 1

分类专栏：机器学习文章标签： python 数据挖掘机器学习

原文链接：https://segmentfault.com/u/everfigt

版权

机器学习专栏收录该内容

4 篇文章 0 订阅

订阅专栏

今天碰到一个错误，一个字典取值报keyError, 一查看key, 字符串类型的数字后面多了小数点0, 变成了float的样子了。

发现了pandas一个坑：如果列有NAN，则默认给数据转换为float类型！

来源：https://stackoverflow.com/questions/39666308/pd-read-csv-by-default-treats-integers-like-floats

但是，我们这里不想要让它转成float, pandas中有dtype指定列的数据类型，我们可以在read_csv指定我们想要的数据类型。

来源：https://stackoverflow.com/questions/13250046/pandas-csv-import-keep-leading-zeros-in-a-column

dtype_dic= {'subject_id': str, 
            'subject_number' : 'float'}
df = pd.read_csv(yourdata, dtype = dtype_dic)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

yuxiaoyanran2020

关注关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Python使用pandas设置数据列中float数据类型的有效小数位数、抑制科学计数法

data+scenario+science+insight

11-08

2361

Python使用pandas设置数据列中float数据类型的有效小数位数、抑制科学计数法目录 Python使用pandas设置数据列中float数据类型的有效小数位数、抑制科学计数法 #pandas默认float数值使用科学计数法 #pandas设置保留四位小数1 #pandas设置保留四位小数2 #获取dataframe中数值列的第一个值 #pandas默认float数值使用科学计数法 #pandas默认float数值使用科学计数法 import numpy as np im

pandas教程：pandas读取csv文件并指定字段数据类型

最新发布

Cachel Wood的博客

07-31

339

参数来指定每个列的数据类型。这个参数接受一个字典类型的值，其中键是列名，值是数据类型。如果无法进行转换，则会引发一个异常。参数来控制异常的处理方式。当数据与指定的数据类型不匹配时，无法实现解析会报错。列的数据类型为字符串，列的数据类型为浮点数。会在不匹配时引发异常，会将无法转换的值转换为。参数传递，时间类型通过。文件时，我们可以使用。在此示例中，我们指定。列的数据类型为整数，类型的时间数据添加到。

参与评论您还未登录，请先登录后发表或查看评论

pandas神坑：如果列有NAN，则默认给数据转换为float类型

jiangbo721的博客

11-11

6546

data = pandas.read_excel(file) 结果读完一个excel，我所有为空的单元格，他全部给我按nan算了，好无语。然后debug去查看这个nan，居然还是float类型，为什么不用字符串呢？所以我们想把对应nan的数据改为自己想要的数据，就要操作一番。第一种： data.fillna('', inplace=True) 直接替换读取到的数据中为空的数据为空字...

NAN值判断，pandas中NAN为浮点值

三番鱼

11-11

1158

import numpy as np nan = float('nan') print(np.isnan(nan)) import math nan = float('nan') print(math.isnan(nan)) import pandas as pd nan = float('nan') print(pd.isna(nan)) 利用Nan值不等于其自身判断 def is_nan(nan): return na

拯救pandas计划（12）——转换包含np.nan的float64类型列为int64类型

weixin_46281427的博客

04-15

2809

拯救pandas计划（12）——转换包含np.nan的float64类型列为int64类型/ 数据需求/ 需求拆解/ 需求处理/ 总结最近发现周围的很多小伙伴们都不太乐意使用pandas，转而投向其他的数据操作库，身为一个数据工作者，基本上是张口pandas，闭口pandas了，故而写下此系列以让更多的小伙伴们爱上pandas。系列文章说明：系列名（系列文章序号）——此次系列文章具体解决的需求平台： windows 10 python 3.8 pandas >=1.2.4 / 数据需求

pandas神坑：如果列有NAN，则默认给数据转换为float类型！给pandas列指定不同的数据类型。...

dideng8675的博客

05-13

1063

今天碰到一个错误，一个字典取值报keyError, 一查看key, 字符串类型的数字后面多了小数点0, 变成了float的样子了。发现了pandas一个坑：如果列有NAN，则默认给数据转换为float类型！来源：https://stackoverflow.com/questions/39666308/pd-read-csv-by-default-treats-integers-lik...

Pandas实现数据类型转换的一些小技巧汇总

09-20

Pandas提供了灵活的工具来应对各种数据转换场景，但同时也需要对数据有深入的理解，以避免因数据类型不匹配而引发的错误。在进行数据类型转换时，要特别注意处理异常值、非标准格式和潜在的信息损失，确保转换后的...

pandas 将某一列转换为字符类型_在Pandas中更改列的数据类型【方法总结】

weixin_39825872的博客

12-22

6633

先看一个非常简单的例子：a = [['a', '1.2', '4.2'], ['b', '70', '0.03'], ['x', '5', '0']]df= pd.DataFrame(a)有什么方法可以将列转换为适当的类型？例如，上面的例子，如何将列2和3转为浮点数？有没有办法将数据转换为DataFrame格式时指定类型？或者是创建DataFrame，然后通过某种方法更改每列的类型？理想情况下，希...

python dtype强制类型转换_python - 将包含NaN的Pandas列转换为dtype`int`

weixin_39718521的博客

12-20

2176

python - 将包含NaN的Pandas列转换为dtype`int`我将.csv文件中的数据读取到Pandas数据帧，如下所示。对于其中一列，即id，我想将列类型指定为int.问题是id系列有缺失值/空值。当我尝试在读取.csv时将id列转换为整数时，我得到：df= pd.read_csv("data.csv", dtype={'id': int})error: Integer colum...

pandas读取CSV文件时查看修改各列的数据类型格式

09-19

有三个处理无效值的选项：'raise'（默认，遇到无效值时抛出错误）、'coerce'（将无效值转换为NaN）和'ignore'（忽略无效值）。 ```python # 将DataFrame的特定列转换为数值 df[['col2', 'col3']] = df[['col2', '...

Pandas的read_excel()函数读取excel时遇到身份证含空值(pandas识别nan为float类型)自动变成科学计数法的解决办法

boyheroes的博客

06-25

5346

现象: Excel身份证列含空值时pandas读入后自动变科学计数法如图所示：原图：读取后：原因：pandas将空值识别为float类型的nan 解决办法: 办法一（针对某一列）：read_excel函数利用参数converters={'身份证':str}强制指定特定列如'身份证' 列的类型为str：效果如下： ...

重大发现，nan原来是float类型。。。。

人太健忘了，需要有个地方记录

09-20

4272

从以上几种方法里可以看到，就是说nan是用float强转来的，而且只有少数一个字符串可以这样操作，比如inf，nan等，如果用其它字符串，你这么操作会报错，所以，本质来说，nan其实是python的一种内置类型（可能以前学过，但是后来忘了），很明显python对nan，inf做了特殊处理，所以我们才可以用float('nan')这样强转，math.isnan()才能判断。知道了这个点后，那么到底怎么才能找到缺失值的key呢，于是我百度了一下，缺失值判断，发现了一下几种方法。2.pandas判断。

2021-11-07大数据学习日志——Pandas——Pandas数据类型

tingbaobaoo的博客

11-07

1515

01_数据类型简介学习目标了解 Numpy 的特点知道 pandas 中的数据类型 1.1 pandas 数据类型简介 1.1.1 Numpy 介绍 Numpy（Numerical Python）是一个开源的Python科学计算库，用于快速处理任意维度的数组。 1）Numpy 支持常见的数组和矩阵操作对于同样的数值计算任务，使用 Numpy 比直接使用 Python 要简洁的多 2）Numpy 使用ndarray对象来处理多维数组，该对象是一个快速而灵活的大数据容器比如我们现在

pandas object转float_Pandas技巧小盘点

weixin_39886172的博客

11-27

877

译者：山阴少年链接：https://www.cnblogs.com/jclian91/p/12305471.html本文一共为大家分享25个pandas技巧，分为两篇分享给大家。显示已安装的版本输入下面的命令查询pandas版本：In[7]:pd.__version__Out[7]:'0.24.2'如果你还想知道pandas所依赖的模块的版本，你可以使用show_versions...

pandas object转float_Pandas 基础深度检查中篇上

weixin_39856269的博客

11-27

213

5. 深入了解数据类型从广义上讲，数据可以分为连续数据和分类数据。连续数据总是数字，代表某种测量，如身高、工资或薪水。连续数据可以有无限的可能性。而分类数据则代表离散的、有限量的数值，如汽车颜色、扑克牌的类型或麦片的品牌。Pandas 并没有笼统地将数据分类为连续或分类数据。相反，它对许多不同的数据类型有精确的技术定义。下面介绍常见的pandas数据类型：float - NumPy fl...

pandas中关于nan的处理

我是小蚂蚁

10-27

5万+

在pandas中有个另类的存在就是nan，解释是：not a number，不是一个数字，但是它的类型确是一个float类型。对于pandas中nan的处理，简单的说有以下几个方法。 import numpy as np import pandas as pd from pandas import Series, DataFrame n = np.nan print(type(n)) # &lt...

pandas 数据类型转换

onemorepoint的博客

08-02

4762

pandas 数据类型转换数据处理过程的数据类型当利用pandas进行数据处理的时候，经常会遇到数据类型的问题，当拿到数据的时候，首先需要确定拿到的是正确类型的数据，一般通过数据类型的转化，这篇文章就介绍pandas里面的数据类型（data types也就是常用的dtyps），以及pandas与numpy之间的数据对应关系。主要介绍object，i...

python之pandas中NaN与None的比较与处理

hutaotaotao的博客

05-08

3414

python之pandas中NaN与None的比较与处理

pandas中对nan空值的判断和陷阱