我正在使用熊猫库读取一些CSV数据。在我的数据中,某些列包含字符串。字符串“nan”是一个可能的值,空字符串也是这样。我设法让大熊猫读取“nan”作为一个字符串,但我不知道如何让它不读取一个空值作为NaN。这里是样本数据和输出
One,Two,Three
a,1,one
b,2,two
,3,three
d,4,nan
e,5,five
nan,6,
g,7,seven
>>> pandas.read_csv('test.csv', na_values={'One': [], "Three": []})
One Two Three
0 a 1 one
1 b 2 two
2 NaN 3 three
3 d 4 nan
4 e 5 five
5 nan 6 NaN
6 g 7 seven
它正确地读取“nan”作为字符串“nan”,但仍然读取作为NaN的空单元格,我尝试将转换器参数中的str传递给read_csv(with converters = {‘One’:str})),但仍然读取空单元格为NaN。
我意识到我可以用fillna填写这些值,但是真的没有办法告诉大熊猫,特定CSV列中的空单元格应该被读取为空字符串而不是NaN吗?