我的第一只爬虫

最新推荐文章于 2022-08-10 21:32:37 发布

这是个菜比测试

最新推荐文章于 2022-08-10 21:32:37 发布

阅读量1k

点赞数 1

分类专栏：爬虫入门文章标签： Python入门

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_42293487/article/details/80653060

版权

入门同时被 2 个专栏收录

11 篇文章 0 订阅

订阅专栏

7 篇文章 0 订阅

订阅专栏

# Python小白的挣扎

# 大神轻锤
# 小白的第一个爬虫
# 求大神多指点

# 这里导入要先导入BeautifulSoup和requests
from bs4 import BeautifulSoup
import requests

# 这里是你要爬取的网页路径，我这里爬的是糗事百科
url = 'https://www.qiushibaike.com/pic/'
# 用requests.get方法获得网页，并把它存储
we_data = requests.get(url)
# 用BeautifulSoup 解析网页，用.text方法使得网页可读
soup = BeautifulSoup(we_data.text, 'lxml')
# 爬取的元素标签，（看其标签中共有属性）
titles = soup.select('div.content span')
# 爬取想要图片的链接（在图片路径没有设置宽度的情况下）
# 不要听信百度用煞笔正则，我研究了一上午正则，一直报错说正则不是str类型，我又研究怎么加转型
imgs = soup.select('div.thumb a img')
# 对比上面的，爬取想要的图片的链接（在图片路径有设置宽度的情况下）
# imgs = soup.select('img[width="200"]')
# 用循环输出结果
for title, imgs in zip(titles, imgs):
# 设置字典存放你爬取到的内容
data = {
# 用户输入的内容
'内容': title.get_text('span'),
# 用户上传的图片路径
'图片路径': imgs.get('src')
}
# 输出你爬到的东西
print(data)

# 下一遍研究怎么将图片下载到本地

这是个菜比测试

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

这是个菜比测试 CSDN认证博客专家 CSDN认证企业博客

码龄6年

74: 原创

5万+: 周排名

8万+: 总排名

42万+: 访问

: 等级

3418: 积分

109: 粉丝

126: 获赞

96: 评论

490: 收藏

私信

关注

热门文章

分类专栏

安全测试工具 3篇
LoadRunner 3篇
性能测试 9篇
jmeter 7篇
自动化测试 15篇
APP测试 1篇
Airtest 3篇
入门 11篇
自动化脚本生成测试报告 2篇
appium 8篇
爬虫 7篇
python 23篇
电脑小技巧 2篇
tkinter 3篇
Autolt 2篇
htpp协议 1篇
部署禅道 1篇
selenium 4篇
Linux 2篇
UI2 2篇
pyinstaller 1篇

最新评论

Jmeter分布式部署
CSDN-Ada助手: 云原生入门技能树或许可以帮到你：https://edu.csdn.net/skill/cloud_native?utm_source=AI_act_cloud_native
Python调用钉钉机器人发送消息
interface_comm: 测试后并查看钉钉文档发现，如果您的代码需要艾特人的话，需要在消息体的data中，写入@15386174586,也就是下面at里面需要艾特人的人保持一致才可以正确的艾特人 [code=python] data = {"msgtype": "markdown", "markdown": { "title": "测试已完成", "text": r"#### {}测试报告生成成功 \n> 存放地址：\\192.168.1.80\share\TestFolder\自动化分享\测试文件夹\n> " r"![微信截图_20200817153548.png](https://i.loli.net/2020/08/17/gKVw2qTXYf3aPRG.png)" r"\n> ###### {}生成成功\n @15386174586".format(test_report, str_time) }, "at": {"atMobiles": ["15386174586"]} } [/code]
【已解决】Autolt写代码中文显示？？和乱码问题
等一人: 这么简单，搞了半天
爬取QQ群成员信息并批量发送QQ邮件（带傻瓜操作界面）
谭欣tanxin: 想问一下，这个‘间谍号是什么。’，没有用过这个包。这里没有看太懂。请教一下。
Loadrunner的下载安装
奶白象: 大佬，给我个吧893050158@qq.com

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。