![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
爬虫
aa-create
这个作者很懒,什么都没留下…
展开
-
关于爬虫文字乱码的问题
python文字乱码问题原创 2023-02-26 15:43:31 · 209 阅读 · 0 评论 -
【爬虫】正则表达式
无原创 2023-01-09 23:15:52 · 188 阅读 · 0 评论 -
re.findall 用法
def findall(pattern, string, flags=0):第一个参数,正则表达式第二个参数,搜索的是那些字符串第三个参数,匹配的模式,其中re.S使匹配包括换行在内的所有字符。findall()函数是逐行匹配的。page_text = requests.get(url=url,headers=headers).textex = '<div class="thumb">.*?<img src = "(.*?)" alt.*?</div>'img_s转载 2021-12-22 18:49:43 · 2453 阅读 · 0 评论 -
params和data的区别
params是添加到url的请求字符串中的,用于get请求。data是添加到请求体(body)中的, 用于post请求。举一个例子:肯德基地址json()返回的是字典类型,可以通过键值获取相应的值text返回的类型为字符串无法通过键值获取相应的值# -*- codeing = utf-8 -*-# @Time : 2021/12/17 23:41# @File : 肯德基地址.py# @software: PyCharmimport requestsimport jsonurl =原创 2021-12-18 00:32:01 · 1611 阅读 · 0 评论