教你十行代码获取福布斯排行榜前350的富豪

目标网址:

https://www.phb123.com/renwu/fuhao/shishi_1.html

首先,创建临时表格:

df=pd.DataFrame()

从这个网页可以发现,前350名就在1到15页里面

就可以写成

for i in range(1,16):
    url="https://www.phb123.com/renwu/fuhao/shishi_%s.html"%i

然后

再把每一个网址的表格加进去就可以了:

for html in urls:
    df=df.append(pd.read_html(html,encoding="utf-8"),ignore_index=True)

使页的表格拼在一起,使用同一个列索引

df=df[[x for x in df]]

最后生成csv表格,over

df.to_csv("福布斯排行榜.csv",header=["世界排名","名字","财富(10亿美元)","财富来源","国家/地区"],index=False)

 完整代码:

import pandas as pd
df=pd.DataFrame()
urls=list()
for i in range(1,16):
    url="https://www.phb123.com/renwu/fuhao/shishi_%s.html"%i
    urls.append(url)
for html in urls:
    df=df.append(pd.read_html(html,encoding="utf-8"),ignore_index=True)
df=df[[x for x in df]]
print(df)
df.to_csv("福布斯排行榜.csv",header=["世界排名","名字","财富(10亿美元)","财富来源","国家/地区"],index=False)

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值