数据采集之爬取2019最好大学网站前四列排名保存为csv文件格式简单案例 BeautifulSoup

数据采集之爬取2019最好大学网站前四列排名 保存为csv文件格式 简单案例 BeautifulSoup

目录:
第一步 观察网页
第二步 使用requests、 BeautifulSoup解析数据
第三步 代码呈现结果

开始:
第一步 观察网页
在这里插入图片描述
第二步 使用request、 BeautifulSoup解析数据

...
导入包
....
import requests  #第三方下载器
from bs4 import BeautifulSoup
import csv
...
定位抓取
...
url='http://www.zuihaodaxue.com/zuihaodaxuepaiming2019.html'
re=requests.get(url,{'User-Agent': 'Mozilla/5.0'})
re.encoding='utf8'
soup=BeautifulSoup(re.text,'lxml')
list=[]
for tbody in soup ('tbody'):
    for tr in tbody ('tr'):
        td=tr('td')
        list.append([td[0].string+','+td[1].string+','+td[2].string+','+td[3].string])
...
保存csv文件

...
with open('C:/Users/17792/Desktop/最好大学排名.csv','w',encoding='GBK',newline="") as file:
    head=['排名','学校名称','省份','总分']
    write=csv.writer(file)
    write.writerow(head)
    for i in list:
        for j in i :
           write.writerow(j.split(','))

第三步 代码呈现结果
结果:
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值