![](https://img-blog.csdnimg.cn/881aa8b0f7db4894a6c72980697dbbd0.jpeg?x-oss-process=image/resize,m_fixed,h_224,w_224)
从0基础到python大神的究极成长之路
文章平均质量分 71
从初级阶段到大成阶段的全路径知识介绍
如桃花来
吾心吾行,澄如明镜。道阻且长,行则将至。
展开
-
【爬虫基础1.1课】——requests模块上
功夫是一个相当经典的电影。看上述图片,我们用本文开篇提到的搜索方法,发现功夫这个词条根本就不存在当前网页的response中。2.我们都知道前端页面的设计具有规律性,网页中第2页获取请求的方式,跟第一页是一样的。控制台中左上角的这个小放大镜,就是我们提到的search按钮。它的功能是在所有的response中检索相应的词条。如果锦囊1依旧找不到对应的url的话,我们就需要使用异步请求来查看对应的url。记得要刷新一下,这里面有各种各样的数据,包括动态的。那么跳出来的响应,就是我们要的当前网页返回的数据。原创 2024-05-09 21:00:05 · 449 阅读 · 0 评论 -
【最详解面向对象编程2】——面向对象三大特征——如桃花来
封装就是将属性和方法写到类里面的操作,没有什么特别需要讲解的地方。所以我们引入了重写的概念,让子类重新定义父类的方法,让一个方法具有不同的行为。它只重写了Girl类的run方法,这是因为多继承要遵循就近原则,注意注意,这里的就近指的是你括号内谁写在前头,谁就是近的。试想一下如果,子类和父类的方法重名了该怎么办呢?我在调用的时候,到底是用子类的方法还是父类的方法?这节我们要讲述的是面向对象的三大特征:继承、封装、多态。如果你在子类里面输入了init方法来定义属性,那么实例化对象的时候以子类为准。原创 2023-07-16 16:51:40 · 112 阅读 · 0 评论 -
【快速弄懂!cookie与session】
客户端和客户端之间是存在差异的,浏览器和Postman等一些工具是可以自行完成的,但是用python的request模块发送请求的时候,他是不具备封装cookie的能力的。客户端的浏览器通常会将 Session ID 存储在 cookie 中,并在后续的请求中自动发送给服务器,以便服务器可以识别和关联正确的会话数据。服务器将 Session ID 与用户的会话数据关联起来,并将其存储在服务器端的会话存储区域中,以便在后续的请求中可以通过 Session ID 检索和识别用户的会话数据。原创 2023-07-15 19:16:00 · 228 阅读 · 0 评论 -
【更改python版本】——日常记录
不是通过标准的安装程序安装的。在这种情况下,您可以手动删除 Python 3.6 的文件夹来卸载它。然后就是漫长的下载第三方包过程了,其实有更简便的方法,但这次没用上。挑选好自己下载的版本,直接下载即可。记得要把旧版本的环境变量都给删除掉,不然会起冲突。原创 2023-06-25 12:24:17 · 430 阅读 · 0 评论 -
【集合数据类型详解】——基础语法
符号:^,去掉相同的数据之后再取出它们剩余的部分。与字典非常相似,但这里是以单元素的形式出现的。符号:|,把两者的数据全都合并起来并去重。符号:-,减去另一个集合中共同的数据。符号:&,取出两者共同的部分。原创 2023-06-21 13:09:07 · 137 阅读 · 0 评论 -
【闭包函数与装饰器大全】——python基础
函数内变量的作用域也仅限于在函数内部,如果该函数执行完毕,内部的局部变量就会被销毁。我们可以变量的认为闭包就是只有一个方法的类。对于带有参数的函数,装饰器里面的内部函数也要带参数,毕竟内部函数需要调用被装饰函数,所以参数上面也要保持一致。装饰器的外部函数一定要用一个变量来接收被装饰的函数,之后在内部函数中进行调用。闭包:一个嵌套函数,外部函数返回内部函数引用。内部函数使用外部函数的局部自由变量。2.没了闭包,python的功能不会受到影响(当然,装饰器必须要用闭包来写)装饰器是通过闭包的方式实现的。原创 2023-06-15 17:52:21 · 498 阅读 · 0 评论 -
【面向对象编程1】——类和对象——如桃花来
封装代码的是函数,那么封装函数的就是类。函数里面有好几个代码。类里面也有好几个类。原创 2023-06-05 15:43:57 · 597 阅读 · 0 评论 -
【强推!!!处理验证码等各种实用的软件和程序推荐!会永久更新!】
【代码】【强推!!!处理验证码等各种实用的软件和程序推荐!会永久更新!原创 2023-06-02 22:36:03 · 46 阅读 · 0 评论 -
【大作业之爬虫实战+数据分析与可视化处理上】——案例——如桃花来
我们将代码进行分段讲解,便于理解。信息非常杂乱,而且有很多脏数据和存在规律不整齐的问题。我们需要进行数据清洗,将数据尽可能的转化为数字。原创 2023-06-02 22:29:42 · 518 阅读 · 0 评论 -
【selenium关键补充】——全栈开发——如桃花来
在selenium的控制下,我们手动输入验证码很可能被网站识别为爬虫,所以我们需要进行自动处理。验证码处理分为两种方式,一种是截图形式。原创 2023-05-28 11:08:10 · 473 阅读 · 0 评论 -
【web框架】——Django01——如桃花来
BS:(Browser & Server) 浏览器和服务端架构 , 这个模式下用户只需要通过浏览器发送http协议请求就可以获取到对应的资源.(百度 ,博客园 , 力扣 , CSDN , B站……(Clinet & Server) 服务端和客户端的架构,这个架构是从用户层面进行划分的,通过这个架构开发出来的东西对用户的系统环境依赖比较大。在其他电脑上写一个socket写一个客户端 , 访问我的服务端。(微信 , 抖音 , QQ , pycharm。我可以通过这种方式在不同电脑上进行数据传输么。原创 2023-05-27 23:21:22 · 719 阅读 · 0 评论 -
【初识django】——Django02——如桃花来
|— views.py 视图函数(url对应的功能函数)| |—wsgi.py 封装socket的东西。| |—settings.py 项目的配置文件。| |— models.py 用来操作数据库。| |—asgi.py 异步处理操作。| |— admin.py 后台管理文件。| |— apps.py 用来注册app。| |— tests.py 用来测试代码。| |—urls.py 路由配置。有返回数据就是下载好了。原创 2023-05-25 10:13:25 · 793 阅读 · 1 评论 -
【初始scrapy框架下】——全栈开发——如桃花来
1、DEBUG面向功能开发人员,一般在功能开发阶段使用,用来给开发人员检查功能是否正常的。此类日志只在开发阶段使用,版本不输出。2、INFO内测 版可输出此日志,用来查看新开发特性或者 bugfix 是否正常。上网版不输出。3、WARN不会对系统造成影响的非正常流程。上网版本输出。3、ERROR会对系统造成影响的非正常流程,可自我修复,不影响系统稳定性。上网版本输出。5、CRITICAL产生了不可逆的错误,系统无法正常工作。原创 2023-05-21 14:47:08 · 643 阅读 · 1 评论 -
【初始scrapy框架上】——全栈开发——如桃花来
包含Twisted的异常:指的是这个库安装报错,无法通过pip进行安装。Scrapy是作为一个项目启动的,要启用指令创建,里面会为你自动搭建好基础框架。手动拿到的数据需要赋值到settings里面。直接在start文件下运行就可以了。切换到你要创建项目的指定文件夹下。下的文件下路径,然后创建。我们举个例子用来说明。原创 2023-05-19 16:43:59 · 568 阅读 · 0 评论 -
【Selenium下】——全栈开发——如桃花来
导包:from selenium.webdriver.support import expected_conditions as EC。明确要等待某个元素出现,等不到就一直等。如果在规定的时间内都没找到,那么报错。控制浏览器前进页面或者后退界面,效果跟这两个箭头差不多。直接使用time模块睡眠即可,简单又方便。原创 2023-05-18 16:24:23 · 515 阅读 · 0 评论 -
【集合详解】——python基础——如桃花来
创建集合使用{}或者set{},但如果要创建空集合就必须使用set(),因为{}用来创建空字典。因为集合有去重功能,所以,当集合内追加的数据是当前集合已有的数据的话,则不进行任何操作。update()追加的数据是序列,追加单个数据会报错。删除集合中的指定数据,如果数据不存在也不会报错。删除集合中的指定数据,如果数据不存在则报错。判断数据不在集合序列:不存在为真,存在为加。判断数据在集合序列:存在为真,不存在为假。随机删除集合中的某个数据,并返回该数据。只能添加单个数据,添加序列则报错。原创 2023-05-15 16:22:17 · 414 阅读 · 1 评论 -
【字典详细介绍】——python基础——如桃花来
该语法是用来判断元素是否在序列中,在字典里,这个语法用来判断的是字典的键是否存在,与值无关。如果当前查找的key不存在则返回第二个参数,如果省略第二个参数,则返回None。:如果key存在则修改这个key对应的值,如果key不存在则新增此键值对。如果当前查找的key存在,则返回对应的值,否则就报错。把键值对整个成元组,排列出来。原创 2023-05-15 15:59:46 · 699 阅读 · 0 评论 -
【Selenium中】——全栈开发——如桃花来
这里要注意一个细节问题,就是名字叫做“图片”的元素跳转前后跳转后的界面都有这个元素,会造成跳转混乱。所以这个time.sleep放的位置就起到了重要的作用,当然你也可以在wait.until里面选取适当的元素,这里主要是故意使用的图片。scrollHeight:是dom元素的通用属性,document.body.scrollHeight会返回body元素的高度,基本上就是页面的高度。scrollTo:window的方法,可以滚到页面的任何位置。element中文释义是元素,也就是找元素的意思。原创 2023-05-13 12:41:03 · 384 阅读 · 0 评论 -
【Selenium上】——全栈开发——如桃花来
你问我selenium是什么?那我只能告诉你这是个高科技超级武器,爬虫界的神,可以让你节省极大的时间和简化代码的复杂程度。从上到下的代码都是连续的,但是为了方便学习,这里将它分别拆开来看。如果在运行后发现网页会自动打开,就代表下载成功了!selenium可以支持多种浏览器。一些最简洁的访问页面的代码。原创 2023-05-12 22:32:05 · 160 阅读 · 0 评论 -
【内置函数】——高级编程——如桃花来
is+sub+class,用于判断前面这个类是不是后面这个类的子类,如果是则返回True,否则返回False。has+attr,用于判断对象有没有这个属性,有则返回True,没有则返回False。顾名思义:get+attr,获取有属性的属性值,有就返回,否则就会报错。第一个参数是实例化对象名,第二个参数是属性,第三个参数是给属性设置的值。第一个参数一般是实例化对象的变量名,第二个参数则是要测的属性。set+attr,用于设置属性值,无则增,有则改。del +attr,用于删除属性值。原创 2023-05-07 15:59:22 · 484 阅读 · 1 评论 -
【恭喜宿主:你的神装Xpath到手】——07全栈开发——如桃花来
lxml和正则一样,也是用 C 实现的,是一款高性能的 Python HTML/XML 解析器,我们可以利用之前学习的XPath语法,来快速的定位特定元素以及节点信息。这是一门在xml文档中查找信息的语言,可用来在XML文档中对元素和属性进行遍历。lxml 是 一个HTML/XML的解析器,主要的功能是如何解析和提取 HTML/XML 数据。限制:我们需要先将HTML文件转换成XML文档,然后用Xpath查找HTML里的节点或元素。谓语用来查找某个特定的节点或者包含某个指定的值的节点,被嵌在方括号中。原创 2023-05-05 15:10:26 · 618 阅读 · 0 评论 -
【爬虫常用模板案例演示】——05全栈开发——如桃花来
其次:不是json格式是没法使用jsonpath模块的,所以我们使用beautifulsoup模块来进行抓包。该函数专门用于处理数据,是最为重要的。一定要找出共同的规律,可能比较隐蔽但一定存在,分类讨论的方法不可取,因为数据匹配会错乱。首先我们把任务用函数进行拆解,分为引入四个模块、三个基本函数和一个工作表的创建。这里采用的是excel的格式进行保存,需要提前下载第三方模块:openpyxl。此次,我们针对租房网站进行相关信息的爬取,并使用excel来进行保存。这里的末尾要引用下一个函数,用于保存数据。原创 2023-05-01 21:14:39 · 1057 阅读 · 0 评论 -
【BeautifulSoup下】——05全栈开发——如桃花来
对于取属性来说,一般只有取类名的时候返回的才是一个列表,其他如id之类的属性是直接返回结果。除了标签名选择器之外,还有一种选择器也特别好用。推荐对前端选择器比较熟悉的人使用。返回的是所有ul标签下的li标签。原创 2023-04-30 16:01:16 · 776 阅读 · 0 评论 -
【BeautifulSoup上】——05全栈开发——如桃花来
大家都说人生苦短,我用python。而在这里我要说人生苦短,用BeautifulSoup。还在为正则表达式而烦恼么?不用担心,我们用高科技。利用BeautifulSoup就足够解决我们百分之90的问题了。原创 2023-04-29 14:47:08 · 977 阅读 · 0 评论 -
【正则表达式上】——03全栈开发——如桃花来
匹配一个模式,如果不是起始位置匹配成功的话,match()就返回。为了匹配字符串中具体的目标,可以使用()进行分组匹配。因为要尽可能少的去匹配,所以d+直接匹配了七个数字,匹配很宽泛,根据几个关键词展现匹配的相关内容。re.match()方法尝试从字符串的。尽可能多的去匹配,最大可能匹配多的字符。可以以任意长度,那么0长度也可以。这种匹配一般比较精确而具体。原创 2023-04-27 15:38:07 · 2234 阅读 · 1 评论 -
【requests模块上】——02爬虫基础——如桃花来
来传递参数,每个属性之间用&符连接,比如:http://httpbin.org/get?换言之,也就是requests是一个Python代码编写的HTTP请求库,方便在代码中模拟浏览器发送http请求。requests是python的第三方库,采用的是Apache2 Licensed开源协议的HTTP库。这个网站直接打开是打不开的,因为浏览器不能直接打开post请求,虽然不能直接打开,但是可以通过代码进行测试。这里的虚线是为了区分特意添加的,没写在代码中。对比我们可以发现,get请求中我们传入的参数都在。原创 2023-04-26 19:08:01 · 771 阅读 · 1 评论 -
【列表详解下】——python基础——如桃花来
key表示依据什么来进行排序;reverse表示排序规则,reverse=True降序,reverse=False升序(默认)只会删除对应的第一个数据,即使出现多次也只会删除第一个。删除指定下标的数据(不写的话默认为最后一个),并。,pop的特点就是会将删除的数据返回。列表直接被清除,打印的是一个空列表。此时报错,是因为已经将列表删掉了。通过赋值的方式直接修改就可以了。逆置:将列表反过来放。原创 2023-04-21 20:06:16 · 69 阅读 · 0 评论 -
【列表详解上】——python基础——如桃花来
如果append()追加的数据是一个序列,则追加整个序列作为一项追加到列表,序列外不需要额外加引号,因为它不是字符串类型。我们可以看到,列表发生了变化所以列表是可变数据类型。列表结尾追加数据,如果数据是一个序列,则将这个序列的数据逐一添加到列表。判断指定数据在某个列表序列,如果在则返回True,否则返回False。跟in方法正好相反,数据不在则返回True,数据存在返回False。返回指定数据所在位置的下标,如果数据不存在则报错。可以看到数据是拆分后,逐一添加的。访问列表长度,即列表中数据的个数。原创 2023-04-21 18:47:20 · 66 阅读 · 0 评论 -
【turtle库3】——如桃花来
startx\starty中:None表示水平居中。正数表示距离左侧的像素,负数表示距离右侧的像素。pic是picture图片的英文缩写,括号内写相对路径或者绝对路径。这是用坐标法来确定画笔的位置,第一位是X轴,第二位是Y轴。由图我们可以获取思路:走一段路向右转144度。我们可以看到,抬笔的时候,画笔没有画出轨迹。需要填充颜色,还要写开始上色和结束上色。支持图片的格式为png、gif不支持jpg。当画笔落下的时候,轨迹又重新出现了。startx:窗口在X轴的初始位置。starty:窗口在Y轴的初始位置。原创 2023-04-20 14:13:46 · 270 阅读 · 0 评论 -
【turtle库2】——如桃花来
它画出的其实是一个半径为60的圆的内接三角形,steps的值等于边数。红线是为了方便理解效果加的。背景色的英文是background-color,在python中缩写为bgcolor。这是steps为6的情况,画了个内切六边形,当steps为2时是一条直线。更改画布颜色的代码在前在后会影响背景色先更改还是后更改。我们可以看到,它画了一个半圆,也就是180弧度对应的圆。数值越大笔越粗,数值没有限制。可以让画笔颜色变得随机。原创 2023-04-20 09:55:28 · 226 阅读 · 0 评论 -
【turtle库的用法1】——如桃花来
或者直接写pen.color(“red”)里面直接写颜色也可以。画画都是用画笔来画的,所以按照上面的例子,我们需要调用pen。半径是正数则是逆时针画圆,半径为负数则是顺时针画圆。pen引用的是画笔的名称。pen是自己设置的画笔名称。海龟库用于绘制图形所用。原创 2023-04-19 18:44:06 · 387 阅读 · 3 评论 -
【内置池】——如桃花来——07高级编程之网络编程
我们使用内置池可以非常方便快捷的建立并发,提高程序运行的效率。进程或线程对象名.apply_async(参数1,参数2…在进程池或线程池中,用于提交任务的函数。原创 2023-04-17 16:41:45 · 64 阅读 · 0 评论 -
【面向对象三大特征之继承】——如桃花来——03高级编程之面向对象编程
此时解释器会先跳转到子类的include方法中,然后见到super()跳转执行父类的include方法,然后再回到子类的include方法继续执行。若是交换子类中的print与super()的位置,则先执行子类方法后执行父类方法。也就是说init方法只生效一次,参数的多少也只取决于第一个继承的init方法。我们可以发现方法重写后,父类和子类的方法同时被应用了。》》》super()方法重写时,按照继承顺序来进行重写有就执行,没有则到下一个父类里面找。C继承了B,B又继承了A,那么就相当于C同时继承了A和B。原创 2023-04-16 21:28:57 · 33 阅读 · 0 评论 -
【队列详解】——如桃花来——06高级编程之网络编程
Queue括号里面可带可不带参数,如果不写参数则表示可以无限插入队列,这种情况容易被别人恶意插入数据。在进行多线程处理的时候,我们经常会遇到资源抢占的问题。而队列就是用于解决资源抢占问题的。用于测量队列是否满了,若满队列则返回True,没满则返回False.用于测量队列是否为空,若队列空则返回True,没空则返回False。先进先出 ,一个一个来,避免资源抢占。我们发现程序没有运行结束,它阻塞了。我们发现程序没有运行结束,它阻塞了。我们可以发现程序运行完毕,没有阻塞。先进先出,所以先打印a,后打印b.原创 2023-04-15 16:15:54 · 64 阅读 · 0 评论 -
【lambda函数的详细用法】——如桃花来——日常记录
reverse的中文含义是倒置,是否倒置,默认是False即升序排列。首先冒号前面是参数,if前面的a是满足a>b的情况下返回的结果,而b是else的情况返回的结果。怎么样,经过上述的例子,我们是不是会发现lambda函数对于简易函数的实现非常方便。在python3中直接打印map函数返回的是一个迭代器的内存地址,需要使用。直接打印lambda表达式,输出的是lambda的id地址(内存地址)我们可以看到,args是可以返回任意数量参数的可变参数,且返回的形式是。:===号的方式,否则会报错。原创 2023-04-08 22:50:07 · 2720 阅读 · 0 评论 -
【enumerate函数最网最详细用法】——日常记录——如桃花来
我们可以看到,这里的序列是从我们设置的start开始的。start不可以设置英文字母和罗马数字等。这里的start可不是指从第几个下标开始遍历。而是你把设置的数替换原来下标的0,详情看下方。可以用enumerate()函数来统计文件行数以提高效率,这里作者还没完全掌握,日后再谈。效果基本跟列表一模一样,这里不再赘述。原创 2023-04-06 16:46:59 · 480 阅读 · 0 评论 -
【字符串遍历前后比较时,超出索引范围的避免方法,很常用】——日常记录——如桃花来
s[i]>s[i+1]原创 2023-04-05 22:41:17 · 167 阅读 · 0 评论 -
【文件操作】——14python基础下——如桃花来
with操作、缓冲区、刷新缓冲区原创 2023-03-30 19:36:27 · 54 阅读 · 0 评论 -
【文件操作】——14python基础上——如桃花来
文件操作打开、打开文件模式、读写方法、readline、readlines、seek原创 2023-03-30 18:59:33 · 72 阅读 · 0 评论 -
【一章更比百章强 最全网络编程,认识进程和线程】——04pyhon高级编程上
多任务,多进程,多线程,进程和线程之间择优适用范围原创 2023-03-21 17:07:50 · 81 阅读 · 12 评论