搜狗微信爬取热门标题及其链接

最新推荐文章于 2024-02-20 16:33:31 发布

黄大黄

最新推荐文章于 2024-02-20 16:33:31 发布

阅读量727

点赞数 1

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_38413844/article/details/83279812

版权

import requests
from bs4 import BeautifulSoup
import re
c=[]
for i in range(1,6):
    url="http://weixin.sogou.com/pcindex/pc/pc_0/1.html"
    html=requests.get(url)
    html.encoding="gzip"
    html=BeautifulSoup(html.text,"lxml")
    href=html.select(".img-box a")
    for h in href:
        h=h.attrs["href"]
        c.append(h[0:4]+"s"+h[4:])
        newhtml=requests.get(h)
        newhtml=BeautifulSoup(newhtml.text,"lxml")
        title=newhtml.select("title")[0].string
        print(title)

很简单的一个爬虫有时间扩展一下

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
搜狗微信爬取热门标题及其链接

import requestsfrom bs4 import BeautifulSoupimport rec=[]for i in range(1,6): url="http://weixin.sogou.com/pcindex/pc/pc_0/1.html" html=requests.get(url) html.encoding="gzip" html...
复制链接

扫一扫

黄大黄 CSDN认证博客专家 CSDN认证企业博客

码龄7年

20: 原创

75万+: 周排名

223万+: 总排名

2万+: 访问

: 等级

439: 积分

12: 粉丝

14: 获赞

12: 评论

39: 收藏

私信

关注

最新评论

知网的爬取很简单
qq_43542275: 我可以帮忙爬取
知网的爬取很简单
liubo68945: 大佬你好，我是一个编程小白，看了这个教程然后在python上也不知道如何运行复制的代码。我需要在知网爬取某一期刊历年来所有的论文的题目，关键字和专题类别，请问要怎么做？
知网的爬取很简单
黄大黄: 最近也尝试过新版的知网爬取知网的封禁还是挺强的是按ip封的建议搞一个ip池就行了 url跟着F12 一步一步找就可以了
知网的爬取很简单
00goto: 这是基于旧版的知网吧?博主有爬新版的吗？能不能指导一下分析URL变化啊
知网的爬取很简单
黄大黄回复 LuLu997339219: 基本上就这些啊大兄弟多看看参数传递应该都可以爬取呀

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。