为了把从网页中解析的数据存储起来,便于存档和查询,可以把数据存放在数据库中,也可以以文件的方式存储,还可以存储为网络应用程序,即html文件或者CSV格式文件。本文引用一个例子,看看如何将网页的解析数据存储为html文件。
from bs4 import BeautifulSoup
import requests
#前置标签
pre_html = '''
<!DOCTYPE HTML>
<html>
<head>
<!--meta charset = 'utf-8'-->
<title>油价历史数据</title>
</head>
<body>
<h2>自去年11月份以来的油价数据(取自本例网站)</h2>
<table width=600 border=1>
<tr><td>日期</td><td>92#无铅</td><td>95#无铅</td><td>98#无铅</td></tr>
'''
#后置标签
post_html = """
</table>
</body>
</html>
"""
url = 'http://new.cpc.com.tw/division/mb/oil-more4.aspx'
src = requests.get(url)
#src.encoding &#