教你十行代码获取福布斯排行榜前350的富豪

最新推荐文章于 2024-01-31 13:55:58 发布

力量型搬砖工人

最新推荐文章于 2024-01-31 13:55:58 发布

阅读量644

点赞数

分类专栏： python 文章标签：数据分析数据挖掘

本文链接：https://blog.csdn.net/m0_62145276/article/details/124957868

版权

python 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

目标网址:

https://www.phb123.com/renwu/fuhao/shishi_1.html

首先，创建临时表格:

df=pd.DataFrame()

从这个网页可以发现，前350名就在1到15页里面

就可以写成

for i in range(1,16):
    url="https://www.phb123.com/renwu/fuhao/shishi_%s.html"%i

然后

再把每一个网址的表格加进去就可以了:

for html in urls:
    df=df.append(pd.read_html(html,encoding="utf-8"),ignore_index=True)

使页的表格拼在一起，使用同一个列索引

df=df[[x for x in df]]

最后生成csv表格，over

df.to_csv("福布斯排行榜.csv",header=["世界排名","名字","财富(10亿美元)","财富来源","国家/地区"],index=False)

完整代码:

import pandas as pd
df=pd.DataFrame()
urls=list()
for i in range(1,16):
    url="https://www.phb123.com/renwu/fuhao/shishi_%s.html"%i
    urls.append(url)
for html in urls:
    df=df.append(pd.read_html(html,encoding="utf-8"),ignore_index=True)
df=df[[x for x in df]]
print(df)
df.to_csv("福布斯排行榜.csv",header=["世界排名","名字","财富(10亿美元)","财富来源","国家/地区"],index=False)

力量型搬砖工人

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
教你十行代码获取福布斯排行榜前350的富豪

目标网址:https://www.phb123.com/renwu/fuhao/shishi_1.html首先，创建临时表格:df=pd.DataFrame()从这个网页可以发现，前350名就在1到15页里面就可以写成for i in range(1,16): url="https://www.phb123.com/renwu/fuhao/shishi_%s.html"%i然后再把每一个网址的表格加进去就可以了:for html in urls:
复制链接

扫一扫