自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

原创 字典推导式--模式匹配处理映射--可哈希的定义--字典get()方法优化--__missing__方法

"""数值类型以及不可变的扁平类型str和bytes都是可以哈希的,如果容器类型是不可变的,而且所含的对象全是可哈希的,那么容器类型自身也是可哈希的"""下面举几个简单的例子辅助各位理解什么是可以哈希的"""tt是一个元组,它的元素中也有一个元组,那个元组一样不可变,所以tt可以hash"""hash(tt)"""哈希值为:-3907003130834322577""""""

2024-04-28 21:57:24 278 1

原创 视情况选择列表或者数组和memoryview对象和numpy方法——《流畅的python》

从最初认识python到现在的前一分钟,认为python中的列表挺全能的,int,str,float,tuple,list,set什么都能填充进去。但为了后续追求开发效率,得考虑python代码内存的占用,也就引出了另一个概念python数组。当列表中只包含数值型数据时,那么使用array.array会更加高效。PS:这里说的是array数组,当然numpy模块中也有一个ndarray数组。

2024-04-25 22:13:54 336 1

原创 模式匹配实现解释器和切片对象和嵌套列表的正确使用——《流畅的python》

使用match和case匹配模式完成一个简单的解释器,总体来说下面的解释器代码不太好理解,重点围绕模式匹配模块,理解模式匹配的作用及好处。

2024-04-24 20:54:38 338 2

原创 序列拆包和序列模式匹配——《流畅的python》

序列拆包和序列匹配相关

2024-04-23 22:41:06 280

原创 python魔法函数__str__和__repr__区别——《流畅的python》

__str__和__repr__的区别,主要是面相的人群不一样

2024-04-22 22:56:41 410 1

原创 《从零开始学习python网络爬虫》——07讲,re模块的使用

提起python内置re模块,就会想到正则表达式,本期给大家带来正则表达式的相关语法和内置方法的使用,还有两个使用re模块提取数据的案例,供大家参考。

2023-11-20 20:48:56 662 1

原创 Python《从零开始学习网络爬虫》——数据解析专题

parsel、Beautiful、lxml三个模块数据解析,css和xpath实际运用,还有避坑指南!

2023-11-13 21:16:37 462

原创 第06课Python 《从零开始学习网络爬虫》——反反爬

简单来说反爬就是区别人类行为和机器行为,当你使用python代码模拟浏览器访问服务器时,服务器会识别这个浏览器相关信息,一般来说识别Cookie、User-Agent、Host字段来确认你是爬虫机器人还是人类。识别方式大致有以下几种:1.通过访问频率判断,比如在某一段时间里访问该网站次数过多,容易被识别。2.会设置headers请求头所需参数,服务器会检测浏览器所提供headers信息,如果缺少相关参数或者是网站特定使用的秘钥,都会停止访问。

2023-11-06 16:58:51 1379 1

原创 Python 《从零开始学习网络爬虫》——第05课,封装函数

格式: def 函数名 (参数1,参数2,参数....):函数体(return 返回值)#无参构建——没有返回值#无参构建——又返回值return 1#有参构建——无返回值#有参构建——有返回值print('第一个函数:',end=' ')sayHello()print('第二个函数:',returnNumber())print('第三个函数:',end=' ')sayName('小明')print('第四个函数:',mergeStr('摸金','校尉'))

2023-11-05 16:26:16 79 1

原创 Python《从零开始学习网络爬虫》——第04课,爬取笔趣阁小说《鬼吹灯》文章标题

爬虫案例01——爬取《鬼吹灯》文章标题

2023-10-31 13:28:05 78 1

原创 Python《从零开始学习网络爬虫》——第03课,BeautifulSoup库的相关方法

find_all()、find()、.text的使用

2023-10-29 12:34:14 84 1

原创 Python《从零开始学习网络爬虫》——第02课,BeautifulSoup库的使用

初步认识BeautifulSoup库

2023-10-28 20:26:23 37

原创 Python————requests库的导入和第一个网络爬虫

今天还是有请到我们的老朋友《从零开始学习网络爬虫》,相信愿意学习Python爬虫的小伙伴们都已经安装好了Python的社区版(当然Python专业版也行),基于本书前面第一、二章就不过多赘述。查看到第一个包www.xiaozhu.com,点击response查看到数据是和我们代码请求到数据是一样的。我们代码用的get方法:发现网页也是get方法,后续案例会有post方法,之后再讲。首先打开python里面的终端,在python的左下角,点击一下。我们的构建就是根据这个来创建的,创建时我们一般直接复制下来.

2023-10-22 20:43:42 1114

原创 Python爬虫入门推荐书籍

适用于python爬虫新手所看的爬虫书籍

2023-10-15 11:56:27 27

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除