爬取博客圆博客

最新推荐文章于 2023-10-05 16:03:58 发布

aaronthon

最新推荐文章于 2023-10-05 16:03:58 发布

阅读量190

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/aaronthon/article/details/81714374

版权

# import os
import requests
from bs4 import BeautifulSoup
# 登陆, 模仿用户浏览器
r1 = requests.get(
    # 要爬取的博客圆页面
    url='https://zzk.cnblogs.com/s/blogpost?Keywords=blog%3Ayuanchenqi%201&pageindex=9',
    # 浏览器的信息
    headers={
        'user-agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36'
    }
)
# 编码
# r1.encoding = 'gbk'
# 获取第一条cookie
r1_cookie_dict = r1.cookies.get_dict()

# 去响应体中j解析我们想要的数据
soup = BeautifulSoup(r1.text, 'html.parser')
container = soup.find(name='div', attrs={'class':'forflow'})
div_list = container.find_all(name='div',attrs={'class':'searchItem'})
# 循环所有的标签
for tag in div_list:
    articles = tag.find(name='a', attrs={'target': '_blank'})
    if not articles:
        continue
    summay = tag.find(name='span', attrs={'class': 'searchCon'})
    if not summay:
        continue
    print(articles.text)
    print('文章地址：', articles['href'])
    print('------------------------------------------------')

    # 把爬取的博客标题和博客地址写到本地文件中
    articles_title = articles.text
    try:
        r3 = articles_title
        with open("article.txt", 'a+') as f:
            f.write(r3)
            f.write(articles['href'])
            f.write("\n")
    except:
        print('爬取失败')

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
爬取博客圆博客

# import osimport requestsfrom bs4 import BeautifulSoup# 登陆, 模仿用户浏览器r1 = requests.get( # 要爬取的博客圆页面 url='https://zzk.cnblogs.com/s/blogpost?Keywords=blog%3Ayuanchenqi%201&amp;p...
复制链接

扫一扫

aaronthon CSDN认证博客专家 CSDN认证企业博客

码龄7年

582: 原创

3万+: 周排名

2万+: 总排名

82万+: 访问

: 等级

6722: 积分

153: 粉丝

364: 获赞

102: 评论

1199: 收藏

私信

关注

热门文章

分类专栏

Java 8篇
Python 54篇
Golang 24篇
数据结构与算法 45篇

最新评论

原码、反码与补码
做而论道_CS: 反之，由补码换算到十进制数，也极其简单。你只需记住：【补码首位的权，是负数】。一般的八位二进制数，各个位的权是：　　128、64、32、16、8、4、2、1；如果是八位的补码，各个位的权则是：　－128、64、32、16、8、4、2、1。　例如，有一个补码：1110 0001，它代表的十进制是：－128 + 64 + 32 + 1 = －31。如果，另一个补码：0110 0001，它代表的十进制是：0 + 64 + 32 + 1 = ＋97。仅仅使用【进制转换】，不就完事了吗？哪里还需要：原码反码取反加一！谁要是跟老外学算术，立刻、马上、直接，就掉沟里了！－－－－－－－－－－－－－－－－－－－－－－求正负数的补码，就是这么简单。至于：机器数符号位原码反码取反加一 ... 　这些谎话，都是计算机专家在那【卖拐】呢！　　千万千万，可别上他们的当啊。
原码、反码与补码
做而论道_CS: 哪有什么原反补码啊！虽然，计算机使用的，是二进制数。但是，二进制数，也是数，并不是什么 “原码反码补码”。作为数字，二进制、十进制，都是一样的数。如果用数字，代表 “非数字”，才能叫做 “码”。如：学号、门牌车牌电话性别股票英文汉字声音颜色 ... 在码长八位时，各码的范围如下。　原码：－127 ~ +127；　反码：－127 ~ +127；　补码：－128 ~ +127。看到了吧？　－128 只有补码，没有原码和反码。没有原码，拿什么取反？没有反码，拿什么加一？取反加一，不可用！　－128 的补码，又是怎么来的？　　是谁特殊规定的吗？　　　不是的！所有的补码，都是算出来的。　但是，并不是用 “原码取反加一” 算的。－－－－－－－－－－－－－－－－－－－－－首先要知道；　计算机使用二进制。　计算机只有加法器，负数或减法运算，都要用加法器完成。　计算机的字长，是固定值。由于上述原因，14－14 = 0，八位机将如下计算：　0000 1110－xxxx xxxx = 0000 0000。其中的 xxxx xxxx，就是代表－14 进行运算的 “补码”。这个 xxxx xxxx，究竟是什么呢？你肯定会推导的。先移项：xxxx xxxx = 0000 0000－0000 1110。可算出：xxxx xxxx = (借位 1) 1111 0010。其八位结果就是：[－14]补码 = 1111 0010。－－－－－－－－－－－－－－－－－－－－－－实际上，任意负数（－X）的补码，都是：0 － X。你用二进制简单算一下，立刻就能得到结果。（－128 的 8 位补码，也就是这样求出来的。）同理，任意正数（＋X）的补码，也都是：0 ＋ X。这还用算？　0 ＋ X，不就是 X 吗？即，零和正数的补码，就是 X 本身！
cmd/go: unsupported GOOS/GOARCH pair linux /amd64
itloser.info: 牛谢谢了
ERROR: Error loading ASGI app. Could not import module "main".
lsm03624: 真奇怪，改名后真正常运行了
ERROR: Error loading ASGI app. Could not import module "main".
qq_43293247: 有卵用

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。