4.3.4 Pandas读写html表格数据
pandas提供的read_html()和to_html()两个函数,用于读写html表格格式。
首先来看把DataFrame转换成HTML表格的方法to_html()。使用该方法,无需了解HTML知识,无需编写一长串HTML代码,就能把DataFrame等复杂的数据结构转换成HTML表格,可以将DataFrame的内部结构自动转换为嵌入在表格中的<TH>,<TR>,<TD>标签,保留所有内部层级结构。
In [1]:
import pandas as pd import numpy as np
In [2]:
dt1 = pd.DataFrame(np.arange(6).reshape(2,3)) dt1
Out[2]:
0 | 1 | 2 | |
---|---|---|---|
0 | 0 | 1 | 2 |
1 | 3 | 4 | 5 |
In [3]:
print(dt1.to_html())#将dataframe写成html表格形式
<table border="1" class="dataframe"> <thead> <tr style="text-align: right;"> <th></th> <th>0</th> <th>1</th> <th>2</th> </tr> </thead> <tbody> <tr> <th>0</th> <td>0</td> <td>1</td> <td>2</td> </tr> <tr> <th>1</th> <td>3</td> <td>4</td> <td>5</td> </tr> </tbody> </table>
如上所示,该函数按照DataFrame的内部结构,正确生成了创建HTML表格所需的HTML标签。
下面的例子演示如何在HTML文件中自动生成表格,我们创建一个具有索引和列名称的DataFrame对象。如下所示:
In [4]:
dt2 = pd.DataFrame(pd.DataFrame(np.random.randint(80,100,(3,4)), index=['linux基础成绩', '网络基础成绩', 'python基础成绩'], columns=['张三', '李四', '王五', '赵六'])) dt2
Out[4]:
张三 | 李四 | 王五 | 赵六 | |
---|---|---|---|---|
linux基础成绩 | 96 | 93 | 93 | 85 |
网络基础成绩 | 91 | 84 | 94 | 81 |
python基础成绩 | 88 | 96 | 85 | 85 |
In [5]:
print(dt2.to_html())#to_html()将dataframe写成html表格形式
<table border="1" class="dataframe"> <thead> <tr