Python爬虫实践1，博主博客文章爬取

最新推荐文章于 2023-01-10 11:45:03 发布

VIP文章 kyle_1111

最新推荐文章于 2023-01-10 11:45:03 发布

阅读量206

点赞数

分类专栏： Python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/kyle_1111/article/details/102973427

版权

'''
爬取博客文章，静态页面
'''

import urllib.request
import http.cookiejar
import requests
from bs4 import BeautifulSoup

def clean_file():  #初始清除文档内容
    with open('article.txt','w',encoding='utf-8') as f:
        f.truncate()

def write_to_file(content): #增量写入
    with open('article.txt', 'a', encoding='utf-8') as f:
        f.write(content)

def get_page(url): #获取response
    try:
        response = requests.get(url,timeout=20)
        return response.text
    except:
        return "error"

def get_blog_info():
    headers={'User-Agent':  #chrome申请头信息
             'Mozilla/5.0 (Windows NT 6.1; WOW64)'
             'AppleWebKit/537.36 (KHTML, like Gecko)'
             'Chrome/77.0.3865.90'
             'Safari/537.36'}
    html=get_page(blog_url)
    soup=BeautifulSoup(html,'lxml&

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Python爬虫实践1，博主博客文章爬取

'''爬取博客文章，静态页面'''import urllib.requestimport http.cookiejarimport requestsfrom bs4 import BeautifulSoupdef clean_file(): #初始清除文档内容 with open('article.txt','w',encoding='utf-8') as f:...
复制链接

扫一扫

专栏目录

kyle_1111 CSDN认证博客专家 CSDN认证企业博客

码龄6年

119: 原创

5万+: 周排名

106万+: 总排名

17万+: 访问

: 等级

2820: 积分

150: 粉丝

103: 获赞

26: 评论

658: 收藏

私信

关注

热门文章

分类专栏

最新评论

第一次跳槽总结（产品经理，简历&面试）
z6870579: 野生新人报道！接下来准备计划： 1、收录本文中的信息重点，做好收集，方便回看及自身修正； 2、根据公司自有自研产品，按照产品设计流程，自我准备一份全流程设计稿，含文档、原型、流程； 3、修改简历，包装完善； 4、小面试积累经验，目标岗位对简历做处理；预计入职时间，2023年6月。
Python爬虫实践2，企业工商信息查询
厉响亮: requests.get()返会的html跟浏览器Network返回的html不一致
第一次跳槽总结（产品经理，简历&面试）
Yvoon99: 写的真的很棒,野生产品新人提前感谢,希望勿删
读《财务就是IT 企业财务信息系统》
ugibb510_zhouhm: 哪个地方方便买到电子版？方便分享一下链接么？（工具类的书，还是电子版会更合适阅读）
第一次跳槽总结（产品经理，简历&面试）
Della_Ding0408: 感谢指点

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。