python 爬虫试手 requests+BeautifulSoup

最新推荐文章于 2024-07-12 16:16:27 发布

zekizz

最新推荐文章于 2024-07-12 16:16:27 发布

阅读量1k

点赞数

分类专栏： python 文章标签： python java 糗事百科爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Crystal_Zero/article/details/51148098

版权

工作需要，要爬取新浪微博数据，之前一直用java，但是遇到页面加密很伤，转到python。先拿糗事百科试试python里爬虫的写法。

工具
requests
BeautifulSoup

工具参考
Python爬虫利器一之Requests库的用法
 Python爬虫利器二之Beautiful Soup的用法

还有一个据说比较好用的PyQuery，试用了下，难用的要死！class 里有空格就懵逼了。之前在Java里一直用Jsoup解析，比较顺手，相应的感觉比较适应于BeautifulSoup，废话不多说，搞起！

页面结构

这里写图片描述

代码

import requests

from bs4

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
python 爬虫试手 requests+BeautifulSoup

工作需要，要爬取新浪微博数据，之前一直用java，但是遇到页面加密很伤，转到python。先拿糗事百科试试python里爬虫的写法。工具 requests BeautifulSoup工具参考 Python爬虫利器一之Requests库的用法 Python爬虫利器二之Beautiful Soup的用法还有一个据说比较好用的PyQuery，试用了下，难用的要死！class 里有空格就懵逼了。
复制链接

扫一扫

专栏目录

zekizz CSDN认证博客专家 CSDN认证企业博客

码龄10年

90: 原创

14万+: 周排名

141万+: 总排名

13万+: 访问

: 等级

2105: 积分

27: 粉丝

25: 获赞

12: 评论

30: 收藏

私信

关注

热门文章

分类专栏

Scala进阶源码实战 8篇
2016Spark 8篇
hadoop 3篇
推荐系统 1篇
python 1篇
Java 7篇
scala 7篇
机器学习 3篇
ubuntu 3篇
实用小技巧 4篇
leetcode 57篇

最新评论

ubuntu 安装搜狗输入法（解决部分ubuntu安装完没有键盘选择栏）
Deepturn: 膜拜技术大佬
推荐系统相关资料收集
Tisfy: 深得人心，正如古人云：不畏浮云遮望眼，只缘身在最高层。
Co-training 初探快切入
曲咬金: 楼主有相关的代码么
Java String.split() 关于空值（empty results）
魔术蝎: 第二点描述是错误的哦。当limit为默认值，也就是不填的情况下，只要最后一个分隔符后有数字，那么就不会舍弃。也就是说中间出现空值，不会舍弃，只会舍弃最后出现的空值。[code=java] if (limit == 0) { while (resultSize > 0 && list.get(resultSize - 1).length() == 0) { resultSize--; } } [/code]
ubuntu 安装搜狗输入法（解决部分ubuntu安装完没有键盘选择栏）
微电子学与固体电子学-俞驰: 博主您好！请问最后一句中：什么是“最后要需要在sougou输入法里添加中文的键盘” 谢谢博主

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。