Python用requests库+BeautifulSoup库+re库获取微博热搜(有详解)

Python用requests库+BeautifulSoup库+re库获取微博热搜

import requests
from bs4 import  BeautifulSoup
import re
def main():
        f=open('pythontxt\\weibohot.txt','w')  #以写入的方式打开文本
        r=requests.get("https://s.weibo.com/top/summary")  #获取链接
        r.raise_for_status()          #检查状态
        r.encoding=r.apparent_encoding      #改变编码形式
        html=r.text             #获取文本
        soup=BeautifulSoup(html,"html.parser")     解析获取到的文本
        listm=soup.find_all('a',attrs={'target':"_blank"}) # #查找tarfet为_blank的全部的a,这里的listm为一个列表
        print("{:^4}\t{:^20}\t".format("排名","内容"),file=f)  #将输出的结果写入文件
        for i in range (51):   #这里括号里本来应该是上面listm的长度,但是有几个不符合情况我就去掉不合适的了
                match=re.search(r'(>)(.*)(<)',str(listm[i]))  #这里是使用正则表达式,search方法re.search(pattern, string, flags=0),所以我将listm[i]改变为str类型              
                a=match.group(2) #用group()方法取出内容
                print("{:^4}\t{:20}\t".format(i+1,a),file=f) #输出结果
        f.close()#关闭文件
main()

如果使用的是IDLE没有这些库,则需要安装,管理员模式启动cmd,然后输入
pip install re 则安装re库,其他库一样把re改变即可
获取的结果如下:

在这里插入图片描述
………………………………
在这里插入图片描述
一定要多多练习哈

  • 7
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值