pandas 读取某一单元格的值_Pandas读写文件（3）

最新推荐文章于 2023-05-26 09:09:50 发布

觅喵

最新推荐文章于 2023-05-26 09:09:50 发布

阅读量2.8k

点赞数

文章标签： pandas 读取某一单元格的值

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_35715281/article/details/112208018

版权

本文介绍了Pandas如何读取和写入HTML、Excel、SQL和Pickle文件，包括使用不同的参数进行操作，如HTML的解析、Excel的工作表选择、SQL的数据库操作和Pickle的序列化与反序列化。

摘要由CSDN通过智能技术生成

Pandas读写文件

来源：https://realpython.com/pandas-read-write-files/

翻译：老齐

阅读本文需要12分钟

本书计划发行时间：2020年初

第三部分

★
在昨天发布的第二部分中，介绍了如何处理CSV和JSON类型的文件，本部分接续介绍其他类型文件的读写方法。
”

HTML文件

HTML是一个纯文本文件，它使用超文本标记符，从而帮助浏览器呈现网页。HTML文件的扩展名是.html 和.htm。你需要安装一个类似lxml 或 html5lib 的HTML解析包，才能使用HTML文件：

$pip install lxml html5lib

你还可以使用Conda安装相同的包：

$ conda install lxml html5lib

一旦有了这些库，就可以使用.to_html()将DataFrame的内容保存为HTML文件：

df = pd.DataFrame(data=data).Tdf.to_html('data.html')

这段代码生成了文件 data.html。

但是，请注意，还没有获得整个网页，你刚刚以HTML格式输出了与df 对应的数据。

如果不提供可选参数buf， .to_html()就不会创建文件，buf表示要写入的缓冲区。如果不使用此参数，代码将返回一个字符串，就像.to_csv() 和.to_json()的代码所做的那样。

以下是其他的一些可选参数：

header 决定是否保存列名。
index决定是否保存索引。
classes指定CSS样式表。
render_links 指定是否将URLs转换为HTML链接。
table_id将CSSid分配给table。
escape决定是否将字符<, >和 & 转换为HTML认可的字符串。

你可以通过设置这些参数，生成具有不同特点的文件。

可以使用 read_html()从适当的HTML文件读取数据，并返回DataFrame 对象：

>>> df = pd.read_html('data.html', index_col=0, parse_dates=['IND_DAY'])

这与读取CSV文件时的做法非常相似。还有一些参数可以帮助处理日期、缺失值、精度、编码、HTML解析等等。

Excel文件

你已经学会了如何用Pandas读写Excel文件。不过，还有几项选择值得考虑。例如，当你使用.to_excel()时，可以使用参数sheet_name指定目标工作表的名称：

>>> df = pd.DataFrame(data=data).T>>> df.to_excel('data.xlsx', sheet_name='COUNTRIES')

在这里，你将一个名为 COUNTRIES的工作表保存为文件data.xlsx，这个工作表里存储了数据。字符串'data.xlsx'是参数 excel_writer的值，excel

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。