Python 爬虫基础学习

最新推荐文章于 2024-11-13 17:26:18 发布

linmeiyun

最新推荐文章于 2024-11-13 17:26:18 发布

阅读量174

点赞数

分类专栏： python 后端文章标签： python 爬虫学习开发语言 java

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/linmeiyun/article/details/126961731

版权

python 同时被 2 个专栏收录

41 篇文章 1 订阅

订阅专栏

36 篇文章 1 订阅

订阅专栏

1、爬虫的概念

爬虫是模拟浏览器发送请求，获取相应
爬虫的流程
URL--->发送请求，获取相应--->提取数据--->保存本地
发送请求，获取相应---提取 URL

graph TD
A[url list] -->|发送请求| B(相应内容)-->E(提取url)-->A
B --> C(提取数据)
C --> D[模块D]

爬虫要根据当前 url 地址对应的响应为准，当前 url 地址的 elements 的内容和 url 的响应 network 不一样
页面上的数据在哪里
当前 url 地址对应的响应中
其他的 url 地址对应响应中
比如 ajax 请求中
js 生成
部分数据在响应中
全部通过 js 生成

2、requests 库学习

为什么学习 requests,而不是 urllib1.requests 的底层就是 urllib2.requests 在 Python2 和 Python3 中通用，方法完全一样 3.requests 简单易用 4.requests 能够自动帮助我们解压（gzip 压缩的等）网页内容
url 编码
http://www.baidu.com/s?wd=%E4%BC%A0%E6%99%BA%E6%92%AD%E5%AE%A2
字符串格式化的另一种方式

    "传{}智播客".format(1)

linmeiyun CSDN认证博客专家 CSDN认证企业博客

码龄2年

43: 原创

118万+: 周排名

51万+: 总排名

5万+: 访问

: 等级

504: 积分

191: 粉丝

45: 获赞

9: 评论

331: 收藏

私信

关注

热门文章

分类专栏

后端 36篇
python 41篇

最新评论

Python 进阶——什么是描述符？
LeeFYH: 写得给力
用python去除SQL中的注释
tankpp: 有没有考虑过这样的注释 /* aaa /* -- */ 有没有考虑过引号里的情况： select ' -- aaa /* ' as a from dual [code=sql] /*注释一*/ --注释二 select id, --编号 name, /*名称*/ sex, --性别 --syf 测试 b.birthday/*a.birthday*/, /*生日*/ /*注释四 llll ------- asfaf*/ --/*注释五*/ b.asdf --sss /*sdfdsf*/ */ /* /*--注释六--------*/ /*--注释7-- /* asdfasf--sdfsf --*/ b.test, -- /* -- /* asdfafs*/ a.test, '*/' as bb, '--' as cc, '/*'||/*asdf*/b.kk||'*/ --', as dd --' from kkk a left join nnn b on a.id = b.id where a.etl_dt = date'${batch_date}' [/code]
Python 机器学习：超参数调优
一只简单有梦的幼儿猿: 请问score是不是只能做最小化才对啊？我看的几篇文献里面使用这个包都是在求目标值的最小化
我做过的Python30道练习题
白客小李666: 我要答案~

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。