处理csv文件时要注意的

qq_44066896

于 2024-07-11 14:04:32 发布

阅读量194

点赞数 1

文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_44066896/article/details/140345799

版权

pandas读取csv文件会默认假设第一行包含的是列名数据，并将其作为 DataFrame 的列名。因此要么你的csv文件的第一行保存的是列名，假如你的原始csv文件的第一行就是数据行，要注意使用 header=None 参数告诉 pandas 不要将第一行视为列名，而是将其作为数据的一部分。此时，可以根据默认的数字索引去读取对应的列。

import pandas as pd

# 读取 CSV 文件，第一行不是列名
df = pd.read_csv('data.csv', header=None)

# 显示 DataFrame
print(df['索引1'])
print(df)

假如原csv文件内容如下：

   索引1  索引2  索引3
0    1     2      3
1    4     5      6

则df[‘索引1’]读取结果为

0  1 
1  4

则df读取结果为

   0  1  2
0  1  2  3
1  4  5  6

会按照默认的数字索引来读了

如果要在写入csv文件时忽略行索引那么：

指定index=False

train.to_csv(train_csv_file, index=False)

如果要获取数据，需要忽略行索引

data_array = all_csv_data[colunm].values
# 结果为
[ 0.40015721  0.95008842  1.45427351  1.49407907  0.6536186   0.04575852
  0.37816252  1.23029068 -1.42001794 -1.25279536]

返回numpy数组，行数为数据量，列数为特征数量，会损失一点数值精确度

data_array = all_csv_data[colunm].tolist()
#结果为
[0.4001572083672233, 0.9500884175255894, 1.454273506962975, 1.494079073157606, 0.6536185954403606, 0.045758517301446, 0.3781625196021735, 1.2302906807277207, -1.4200179371789752, -1.2527953600499262]

返回列表

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

qq_44066896 CSDN认证博客专家 CSDN认证企业博客

码龄6年

18: 原创

131万+: 周排名

11万+: 总排名

3205: 访问

: 等级

194: 积分

3: 粉丝

8: 获赞

9: 评论

5: 收藏

私信

关注

热门文章

分类专栏

最新评论

遍历文件夹下的文件
CSDN-Ada助手: 恭喜您开始博客创作，您的第一篇博客已经很不错了！我的建议是，您可以在这篇博客的基础上进一步探讨如何遍历文件夹下的子文件夹，或者分享一些实用的技巧和注意事项。期待您的下一篇精彩文章！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1 如果您持续创作，完成第三篇博客，并且质量分达到 80 分以上，在评论区就有机会获得红包奖励哦！
从content.txt中随机挑选文本并去除其空格和拼音后替换--text后双引号中的文本
CSDN-Ada助手: 恭喜您第十篇博客发表成功！您的创作精神值得我们学习。不过，我认为您可以尝试更深入的研究，例如在此基础上对文本进行情感分析或主题抽取，从而让读者更深入地了解您的文章。期待您更多的创作！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply10 看奖励名单。
两种加载gpu并将模型放置到gpu上的方式；python3.6之后的格式化字符方式
CSDN-Ada助手: 恭喜您写了这篇关于GPU加载和Python3.6格式化字符的博客！您的文章内容非常有用，对于想要学习GPU加速和Python编程的人来说都是很有帮助的。建议您可以继续分享一些关于Python的高级技巧和应用，这样可以让更多的人受益。期待您的下一篇文章！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply9 看奖励名单。
将文件名为该内容的文件移动到指定文件夹内
CSDN-Ada助手: 恭喜您撰写了这篇有用的博客，我觉得您的方法非常实用并且易于理解。我期待您未来更多的博客，特别是关于如何优化文件管理和组织的技巧。再次感谢您的分享！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply8 看奖励名单。
读取csv文件
CSDN-Ada助手: 非常感谢您的第七篇博客，标题为“读取csv文件”。您的文章对于读取csv文件的方法和技巧进行了详细的介绍，让读者受益匪浅。恭喜您一直保持着持续创作的热情和动力，这是一个非常值得赞赏的品质。接下来，我建议您可以探索更多与csv文件相关的主题，例如如何使用Python进行数据分析和可视化等。期待您的下一篇博客！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply7 看奖励名单。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。