Python爬虫学习笔记

最新推荐文章于 2023-03-30 20:20:48 发布

SUMMERCOLD_

最新推荐文章于 2023-03-30 20:20:48 发布

阅读量255

点赞数

文章标签： python 爬虫 1024程序员节

本文链接：https://blog.csdn.net/SUMMERCOLD_/article/details/120814257

版权

本文介绍了Python爬虫的基础，包括requests库的使用，如何获取和解码响应数据，讲解了BeautifulSoup库创建对象及find()函数，还涉及正则表达式的常见语法和应用，最后提到了JSON与Python之间的转换操作。

摘要由CSDN通过智能技术生成

1.requests请求库

1.1导入模块------import requests

1.2发送请求，获取响应---------response=requests.get('网址')

1.3获取响应数据---------print(response.text) #网址的编码格式不同可能导致看不懂

改:response.encoding='utf-8'; print(response.text); #两行数据，略显麻烦

改:print(response.content.decode())

decode() 解码，默认utf-8编码格式

response.text 响应体str类型

response.encoding: 二进制转换字符使用的编码，显示二进制码

response.content:响应体bytes类型

有些网站使用gbk解码，则print(response.content.decode(‘gbk’))

2.Beautiful4库

需要安装

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

SUMMERCOLD_

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Python（二十一）网页爬虫第一部分

Rain778的博客

09-24

389

网页爬虫，程序排版布局，正则表达式，html解析

torch中DataLoader的next_data数据加载流程.xmind

02-21

torch中DataLoader的next_data数据加载流程

2 条评论您还未登录，请先登录后发表或查看评论

Next.js踩坑入门系列（七） —— 其他相关知识

weixin_33766805的博客

11-04

2157

Next.js踩坑入门系列 (一) Hello Next.js (二) 添加Antd && CSS (三) 目录重构&&再谈路由 (四) Next.js中期填坑 (五) 引入状态管理Redux (六) 再次重构目录 (七) 其他相关知识获取数据&&getInitialProps 获取数据，依然是Next与普通的React SPA应用不同的地方，...

SSD模型解读（三）数据集加载部分SSDDataset类代码解读-数据采样机理

Deen的博客

03-30

973

个人学习笔记，仅做参考。

next. js_Next.js应用程序捆绑

cuk0051的博客

08-27

384

next. jsWhen you view the page source of a Next.js app, you can see a bunch of JavaScript files being loaded: 当您查看Next.js应用程序的页面源代码时，您会看到一堆正在加载JavaScript文件： Let’s start by putting the code in an ...

nextdate_nextdata_第二日_

10-03

测试“NextDate ”函数。NextDate 返回输入日期后面的那个日期。变量年、月、日都具有整数值，且满足如下条件：C1: 1800≤年份≤2050 C2: 1≤月份≤12 C3: 1≤日期≤31

python 爬虫学习笔记

03-09

Python 爬虫学习笔记本文将详细介绍 Python 爬虫学习笔记的知识点，涵盖爬虫基础、网络和前端基础、Requests 模块、请求头、GET 和 POST 请求、代理、Cookie 模拟登录、Quote 和 Unquote、登录和获取 Cookie、Post...

python爬虫学习笔记-scrapy框架(1)

01-29

python爬虫学习笔记-scrapy框架(1) python scrapy 爬虫 python爬虫学习笔记-scrapy框架(1) python scrapy 爬虫 python爬虫学习笔记-scrapy框架(1) python scrapy 爬虫 python爬虫学习笔记-scrapy框架(1) python ...

python爬虫学习笔记.zip

最新发布

12-30

Python爬虫学习笔记在IT领域，Python爬虫是一种常用的技术，用于自动化地从互联网上抓取大量数据。Python语言因其简洁的语法和丰富的库支持，成为开发爬虫的首选工具。本篇将深入探讨Python爬虫的相关知识点，帮助...

python爬虫学习笔记.pdf

09-10

Python爬虫学习笔记本资源摘要信息将对Python爬虫学习笔记进行详细的知识点总结，涵盖正则表达式、Python文件操作、CSV文件操作等方面的知识。一、正则表达式正则表达式是一段字符串，可以用于表示一段有规律...

Python学习——（2）通过网络爬虫获取数据

gogo_monster的博客

02-28

3336

通过网络爬虫获取数据 1. 和爬虫有关的HTTP HTTP是网络数据通信的基础。在本节中会围绕Python网络爬虫讲述常用HTTP知识点。 1.1 基于HTTP的请求处理流程当用户在浏览器的地址栏中输入一个URL并按回车键后，浏览器会向HTTP服务器发送HTTP请求，根据请求解析并绘制界面。在浏览器中右击，在弹出的菜单栏中选择”检查“选项命令，打开”调试“窗口，并在其中点击”Network（网络）“标签。在浏览器的地址栏中输入“www.coblogs.com”网址，随后在“调

小白学python爬虫：1.找到数据

m0_59162248的博客

11-21

1290

1.1网页真实的面目：HTML 对于爬虫来说，着手的首要目标就是找到你想要爬取的数据。那么你在网页上看到的数据到底是以怎样的一个形式存在的呢？或者说，web网页它的本质到底是什么？下面我会为大家详细的介绍。 1.1.1 标签我的第一个网页来看看我的第一个网页吧请将以上代码复制到txt中并保存，再将文档后缀‘txt’更改为‘html’，最后双击打开。没错，你每天所看

NextDate问题

izhengtl2021的博客

07-01

4806

Input 输入是一个字符串，根据实际情况，一般一行输入不会太长，我们规定串的长度<=256。根据国家标准，合格的日期是YYYYMMDD或者YYYY-MM-DD，我们还可以扩展一下，如果把公元前的年份为负数，那么-YYYYMMDD和-YYYY-MM-DD也算为合格输入，同时规定此时输出加前缀“BC ”，为了使问题简化，特别是简化闰年的计算，我们规定年份的绝对值不超过9999。本问题是多组测试...

python之__iter__函数与__next__函数

热门推荐

08-18

6万+

容器（container）容器是用来储存元素的一种数据结构，容器将所有数据保存在内存中，Python中典型的容器有：list，set，dict，str等等。class test(): def __init__(self,data=1): self.data = data def __iter__(self): return self def __

oracle定时任务next_date,oracle定时任务

weixin_42109639的博客

04-03

792

更改系统的会话方式为disenable restricted,为snp的启动创建条件alter system disenable restricted session;job_queue_processes=10 (oracle10gde 默认值)job_queue_interval=Nalter system set job_queue_processes=100;sql> selec...

nextdata问题

hhh83585的博客

03-23

1084

/*nextdata问题*/ #include<stdio.h> int isLeap(int year) { if(year%4==0&&year%100!=0||year%400==0)//闰年返回1 return 1; else return 0; } int main() { int year,mont...

dy小姐姐一向好看~今天我们就用python来通通抓下来吧

weixin_62853513的博客

09-23

1648

大家早好、午好、晚好吖~

python数据分析：采集分析岗位数据，看看薪资的高低都受什么因素影响呢

m0_72282564的博客

01-06

2481

嗨喽，大家好呀~这里是爱看美女的茜茜呐又到了学Python时刻~在我们学习的时候,通常会产生疑问:这个行业前景好不好呢?今天我们就用python的数据分析这个就业方向来举例看一下都有哪些因素影响了薪资的高低呢？

"Python爬虫学习笔记：正则表达式与re库基本使用

Python爬虫学习笔记.pdf是一本介绍Python爬虫学习的重要文档。其中，对于正则表达式的学习是非常重要的一部分。正则表达式（Regular Expression）是一段字符串，可以用于表示一段有规律的信息。使用正则表达式的步骤...