干货分享:
#如何做出好看的Excel可视化图表(小白免费也能做出视觉炫酷的可视化图表)
read_html() 的基本语法及其参数:
pandas.read_html(io,match='.+',flavor=None,header=None,index_col=None,skiprows=None, attrs=None,
parse_dates=False, thousands=', ', encoding=None, decimal='.', converters=None, na_values=None,
keep_default_na=True, displayed_only=True)
参数 | 注释 |
---|---|
io | 接收网址、文件、字符串 |
parse_dates | 解析日期 |
flavor | 解析器 |
header | 标题行 |
skiprows | 跳过的行属性,比如 attrs = {‘id’: ‘table’} |
案例1:抓取世界大学排名榜(第1页的数据)
# 导入库
import pandas as pd
import csv