自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

m0_67471470的博客

原创第四个爬虫实战代码

看出规律都是由https://www.qidian.com/all/ +page{}/所以第一页：https://www.qidian.com/all/page1/第四页：https://www.qidian.com/all/page4/第二页：https://www.qidian.com/all/page2/第三页：https://www.qidian.com/all/page3/第一页：https://www.qidian.com/all/我们的目标url：http://a.qidian.com/

2023-12-09 17:43:59 1528

原创第三个爬虫实战代码(使用xpath表达式)

如果我直接写入'bookname', 'bookurl', 'author', 'press', 'presstime', 'book_price', 'grade', 'comment'，那么这将是一个包含8个字符串元素的列表，而不是元组。.split(“/”)方法就可以得到["[清] 曹雪芹著(0) ","人民文学出版社(1)","1996-12(2)","59.70元(3)"]所以修改后的xpath路径：infos = html.xpath('//tr[@class="item"]')

2023-12-08 12:09:56 1356

原创 Xpath语法

Xpath是一门在XML文档中查找信息的语言，对HTML文档也有很好的支持。

2023-12-05 14:04:12 860

原创 Lxml库的使用

Lxml库的简单使用

2023-12-04 21:09:34 912 1

原创使用正则表达式爬取小说

content</p>）

2023-12-03 19:38:16 521

原创 Python爬虫正则表达式的学习

（1）\d : 匹配一个数字字符。（2）\D : 匹配一个非数字字符。（3） \w : 匹配一个单词字符（字母、数字或下划线）。（4） \W : 匹配一个非单词字符。（5） \s : 匹配一个空白字符（空格、制表符、换行符等）。（6） \S : 匹配一个非空白字符。

2023-12-03 17:52:45 1517 1

原创爬虫的第一个小程序

1）.发送get请求requests.get()2）.发送post请求,requests.post()3）.设置请求头，例如：User-Agent、Authorization等# 使用get方法发送get请求，并获取响应内容# pycharm中返回结果为，说明请求成功，若为404、400则请求网址失败print(res)通过BeautifulSoup库可以很轻松地解析Requests库请求的网页，并把网页源代码解析为Soup文档，以便过滤提取数据。

2023-12-02 19:58:25 1482

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

lercky CSDN认证博客专家 CSDN认证企业博客

码龄2年

IP 属地：湖北省

IP属地以运营商信息为准，境内显示到省（区、市），境外显示到国家（地区）

7: 原创

141万+: 周排名

20万+: 总排名

8183: 访问

: 等级

219: 积分

90: 粉丝

139: 获赞

2: 评论

143: 收藏

私信

关注

热门文章

最新评论

Lxml库的使用
CSDN-Ada助手: 恭喜您写了第四篇博客《Lxml库的使用》，内容详实，让我受益匪浅。希望您能继续保持创作的热情和动力，分享更多有价值的内容。或许下一步可以考虑写一些实际应用案例，让读者更直观地了解Lxml库的使用方法。希望我的建议能对您有所启发，期待您更多精彩的创作！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
Python爬虫正则表达式的学习
CSDN-Ada助手: 非常棒的博客！我很喜欢你对Python爬虫正则表达式的学习总结。你对\d、\D、\w、\W、\s和\S的解释非常清晰易懂。这些是在编写爬虫时非常有用的正则表达式模式。我鼓励你继续写作，分享更多关于Python爬虫和正则表达式的知识。在继续创作的过程中，你可以考虑介绍一些更高级的正则表达式技巧，例如：使用括号进行分组和捕获、使用量词进行重复匹配、使用字符类进行更精确的匹配等等。这些扩展知识和技能可以进一步提升你的爬虫编程能力。期待你的下一篇博客！加油！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
使用正则表达式爬取小说
CSDN-Ada助手: 恭喜作者能够使用正则表达式成功爬取小说，这是一项很不容易的技能！希望你能够坚持不懈地创作下去，继续分享你的经验和成果。或许下一步你可以尝试使用其他技术或工具来改进爬取效率，比如使用爬虫框架或者学习更高级的正则表达式技巧。期待看到你更多的精彩作品！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
爬虫的第一个小程序
CSDN-Ada助手: 恭喜你写下了第一篇博客！标题《爬虫的第一个小程序》听起来很有趣。作为一个读者，我很期待能够了解你在这个领域的探索和经验分享。希望你能进一步展开博客内容，分享你在编写这个小程序时的心得体会，或者介绍一些关于爬虫的基础知识，以帮助读者更好地理解你的实践。继续努力，期待你未来更多有趣的博客文章！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

最新文章

提示

确定要删除当前文章？

取消删除