爬虫实战--爬取CPU天梯榜单

网址:

http://itianti.sinaapp.com/index.php/mcpu

最近女票要买电脑,看了几款,于是我就帮她看看这几款的CPU咋样,就找了一个CPU天梯排行榜。一瞅发现,榜上有800+个CPU,一个一个找,得累死。刚好最近了解了python爬虫,于是乎,就写了一个爬虫脚本,把排名和CPU名字爬了并且保存下来了。

代码如下:

import requests        #导入包
from bs4 import BeautifulSoup
res = requests.get("http://itianti.sinaapp.com/index.php/mcpu/")
res.encoding = 'utf-8'        #显示中文
soup = BeautifulSoup(res.text, 'html.parser')      #解析html
table = soup.select('#maintable')[0]        #爬取id为'maintable'的元素
tbody = table.select('tbody')[0]            #爬取tbody标签的元素
f = open("out.txt","w")                    #保存到文件中
f.write("排名  名称")
for i in tbody.select('tr'):        #遍历tr标签
    temp = i.select('td')            #挑选td标签
    rank = temp[0].text
    name = temp[1].text
    #print(rank + "  " + name)
    print("%s  %s" %(rank, name), file = f)

保存成txt文件后,查某个CPU排行,只要ctrl+F就好啦~~~

。。。。

不过后来才知道,原来谷歌上的网页也是可以ctrl+F,进行查找的。。。。。。。。。

涨姿势了。。。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值