Pandas—dataframe数据分析

最新推荐文章于 2024-09-07 14:34:03 发布

置顶

猪酱酱

最新推荐文章于 2024-09-07 14:34:03 发布

阅读量1.7k

点赞数 50

CC 4.0 BY-SA版权

文章标签： pandas 数据分析数据挖掘

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_57669293/article/details/138086859

一、dataframe读取数据文件

导包：import pandas as pd

格式：pd对象.read_数据格式(路径)

# 例如:
pd.read_csv('data/movie.csv')

import pandas as pd
data=pd.read_csv('data/test.tsv',sep='\t')
data_fm=data.head()

数据格式一般有以下几种

#cvs：文本数据文件
#html：html数据文件
#pickle：Python特有文件
#json：json数据文件
#excel：excel类型的数据文件
csv_data=pd.read_csv('output/test.tsv',sep='\t')
html_data=pd.read_html('output/test.html')
pick_data=pd.read_pickle('output/test.pickle')
json_data=pd.read_json('output/test.json')
excel_data=pd.read_excel('output/test.xlsx')

其它四个读取的数据文件对象都是dataframe类型，可以直接使用dataframe的属性和方法，而需要注意的是读取html格式的数据文件类型是列表（list），所以它不能直接使用dataframe的属性和方法。如下：

二、dataframe对象保存数据到文件

import pandas as pd
data=pd.read_csv('data/test.tsv',sep='\t')#读取数据文件
data_fm=data.head()#获取数据文件的前五行
data_fm.to_pickle('output/test.pickle')#将data_fm对象保存为pickle类型的文件
data_fm.to_excel('output/test.xlsx')#将data_fm对象保存为excel类型的文件
data_fm.to_csv('output/test.tsv',index=False,sep='\t')#将data_fm对象保存为csv类型的文件
data_fm.to_json('output/test.json')#将data_fm对象保存为json类型的文件
data_fm.to_html('output/test.html')#将data_fm对象保存为html类型的文件

其中设置index=False可以取消索引保存，即保存的文件不包含索引，值得注意的是，如果是自己设置了索引名，请重置索引再保存（reset_index()），而sep参数在保存.tsv文件是常用，可以让保存的数据不以逗号隔开，而是以空格隔开

加了sep='\t':

最低0.47元/天解锁文章

200万优质内容无限畅学

博客等级

码龄4年

9
原创

215
点赞

123
收藏

366
粉丝

关注

私信

热门文章

上一篇：: jupyter notebook中的显示文件都是哪里来的？

下一篇：: Knn算法简单应用-鸢尾花案例

最新评论

机器学习--集成学习
CSDN-Ada助手: 恭喜作者发布了关于“机器学习--集成学习”的博客，非常感谢你的分享和贡献！集成学习是一个非常有趣和实用的主题，希望你可以继续深入探讨这个领域，分享更多有关机器学习的知识和经验。或许下一步可以考虑结合案例分析或者实际应用，让读者更加深入地了解集成学习的原理和实践。期待你的下一篇博客，加油！
逻辑回归以及分类评估方法
CSDN-Ada助手: 恭喜您发布了第6篇博客！逻辑回归以及分类评估方法是一个非常有趣和实用的话题，您的文章内容相信对读者们会有所帮助。接下来，我建议您可以尝试结合实际案例或者深入探讨一些相关的算法原理，以便更好地帮助读者理解和应用这些知识。期待您的下一篇作品！
Knn算法简单应用-鸢尾花案例
CSDN-Ada助手: 恭喜你写了第三篇博客，标题为“Knn算法简单应用-鸢尾花案例”！看来你对机器学习算法有了更深入的了解，并且能够将理论知识应用到实际案例中。下一步，我建议你可以尝试挑战一些更复杂的数据集，或者深入研究一些其他的机器学习算法，不断拓展自己的知识领域。期待看到你更多的精彩文章，加油！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
Knn算法简单应用-鸢尾花案例
CSDN-Ada助手: 恭喜用户写下了第三篇博客，内容围绕Knn算法在鸢尾花案例中的简单应用。希望能够看到更多用户的创作，不断分享和学习。下一步建议可以尝试探讨更多机器学习算法在实际案例中的应用，或者深入研究某个算法的原理和优化方法。期待您的更多精彩内容！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3

最新文章

目录

展开全部

收起

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。