爬取内容:财富500强http://www.fortunechina.com/fortune500/c/2020-08/10/content_37214.htm
import requests
from bs4 import BeautifulSoup # 网页解析 获取数据
r = requests.get('http://www.fortunechina.com/fortune500/c/2020-08/10/content_372148.htm')
#以下为对请求回的信息进行'utf-8'编码
r.encoding = 'utf-8'
demo = r.text
soup=BeautifulSoup(demo,'html.parser')
for i in soup.tbody.find_all('tr'):
print(i.contents[1].string,
i.contents[5].string,
i.contents[7].string,
i.contents[9].string,
i.contents[3].string,)
```
1 523,964 14,881 美国 沃尔玛(WALMART)
2 407,008.8 6,793.2 中国 中国石油化工集团公司(SINOPEC GROUP)
3 383,906 7,970 中国 国家电网公司(STATE GRID)
4 379,130.2 4,443.2 中国 中国石油天然气集团公司(CHINA NATIONAL PETROLEUM)
5 352,106 15,842 荷兰 荷兰皇家壳牌石油公司(ROYAL DUTCH SHELL)
6 329,784.4 88,210.9 沙特阿拉伯 沙特阿美公司(SAUDI ARAMCO)
7 282,760.2 15,542 德国 大众公司(VOLKSWAGEN)
8 282,616 4,026 英国 英国石油公司(BP)
9 280,522 11,588 美国 亚马逊(AMAZON.COM)
10 275,288.3 19,096.2 日本 丰田汽车公司(TOYOTA MOTOR)
11 264,938 14,340 美国 埃克森美孚(EXXON MOBIL)
12 260,174 55,256 美国 苹果公司(APPLE)
13 256,776 6,634 美国 CVS Health公司(CVS HEALTH)
14 254,616 81,417 美国 伯克希尔-哈撒韦公司(BERKSHIRE HATHAWAY)
爬取出的结果