自学笔记|使用pd.read_csv以dataframe格式读取txt

小小白鹿

已于 2023-03-26 14:15:00 修改

阅读量1.3k

点赞数 1

文章标签： python 机器学习开发语言

于 2023-03-25 22:50:56 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_48196258/article/details/129765557

版权

可能遇到的问题：注意txt文档编码格式，不然用pd.read_csv可能会报错

用下面这段代码检测txt文档的编码格式

# 读取文件并检测编码格式
with open(train_data_file, 'rb') as f:
    result = chardet.detect(f.read())

print(result)

结果如下：{'encoding': 'GB2312', 'confidence': 0.99, 'language': 'Chinese'}

可以看到encoding编码格式是“GB2312”，这是中文编码的意思

train_data= pd.read_csv(train_data_file, sep='\t', encoding='gb2312',skiprows=[0],header=None)

所以这里的encoding参数设为GB2312就行了（gb大小写应该都行没试）。

pd.read_csv的skiprows参数表示要跳过的行数。

pd.read_csv的header参数用于控制哪一行作为列名。具体来说：

如果header=None（默认值），则数据框的列名将自动编号生成。此时，文件的第一行将被视为数据的一部分而不是列名。
如果header=0或header='infer'，则数据框会将文件的第一行视为列名。
如果header为一个整数，则数据框将把文件的第header行视为列名。
如果header为一个列表，则该列表中的值将用作列名。

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
自学笔记|使用pd.read_csv以dataframe格式读取txt

结果如下：{'encoding': 'GB2312', 'confidence': 0.99, 'language': 'Chinese'}所以这里的encoding参数设为GB2312就行了（gb大小写应该都行没试）。可能遇到的问题：注意txt文档编码格式，不然用pd.read_csv可能会报错。pd.read_csv的header参数用于控制哪一行作为列名。可以看到encoding编码格式是“GB2312”，这是中文编码的意思。pd.read_csv的skiprows参数表示要跳过的行数。
复制链接

扫一扫

小小白鹿 CSDN认证博客专家 CSDN认证企业博客

码龄4年

18: 原创

136万+: 周排名

57万+: 总排名

1万+: 访问

: 等级

211: 积分

2: 粉丝

12: 获赞

5: 评论

31: 收藏

私信

关注

热门文章

分类专栏

最新评论

在使用GRU预测时，时间不连续会有影响吗
CSDN-Ada助手: 恭喜您撰写了第16篇博客！标题“在使用GRU预测时，时间不连续会有影响吗”引起了我的兴趣。您对于预测领域的探索和研究真是令人钦佩。关于您的问题，我认为时间的连续性在使用GRU进行预测时确实会有一定影响。时间序列数据的连续性对于模型的准确性和稳定性非常重要，因此在处理时间不连续的数据时可能会导致预测结果的不确定性。我希望您能在博客中更深入地探讨这个问题，并提供一些实证研究或案例来支持您的观点。另外，我也想提醒您在下一步的创作中考虑添加一些实际案例或应用场景。这样可以帮助读者更好地理解GRU预测的潜力和局限性。同时，如果您能够介绍一些其他预测模型或方法的比较，将会使您的博客更加全面和有说服力。再次恭喜您的创作成果，期待您未来更多博客的发布！
pandas.errors.ParserError: Error tokenizing data. C error: Expected 10 fields in line 244, saw 11
weixin_58154129: 大招解决燃眉之急了
ValueError: could not convert string to float: ‘-2914.013108.005‘
小小白鹿: 第一段代码有错误，后面更新了正确的方法
pycharm 中it chat模块安装失败
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
pycharm 中it chat模块安装失败
小小白鹿: 哈哈哈哈哈，最后发现itchat没啥用，不让登网页微信。溜了溜了，已经成为历史了

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。