不得不学的Python教程
文章平均质量分 73
Python相关的各种小知识点,对知识进行深入的分析,提供学习案例
一行书辞
欲买桂花同载酒,终不似,少年游。
展开
-
Python爬虫教程-网络通信(补习,不熟悉的同学赶紧看!)
在迈入爬虫学习的旅程之前,我们首先需要理解一个核心前提:网络爬虫的工作方式本质上是模拟人类与网络服务器进行通信。因此,为了能够高效、准确地抓取数据并遵守网络协议,我们必须掌握网络通信的基本原理。熟悉HTTP协议、TCP/IP协议等相关技术也是必不可少的,这能让我们在处理请求响应、管理Cookies和Sessions等爬虫关键环节中更加得心应手。同时,我们还需要理解网络通信的安全性和优化原理,确保我们的爬虫行为合法且高效。因此,接下来让我们一起深入学习网络通信的基础知识,为掌握爬虫技术打下坚实的基础。原创 2023-11-24 19:25:41 · 214 阅读 · 0 评论 -
Python爬虫教程-网络爬虫分类
本章将重点介绍爬虫的分类,并详细阐述通用爬虫的原理。我们有两个主要目的。首先,通过了解通用爬虫,我们可以更深入地认识爬虫技术,尽管它在日常工作中并不常用,但我们仍然需要对其有一定了解。其次,通过学习通用爬虫的原理和应用场景,我们可以认识到聚焦爬虫的优势和适用场景,为后续的学习打下坚实的基础。原创 2023-11-15 16:53:49 · 756 阅读 · 0 评论 -
在Ubuntu、Mac中创建虚拟环境的步骤
问题:在开发过程中,使用Python安装包时,需要使用可以使用pip install 包名或者sudo pip install 包名来安装。问题是在开发多个项目的时候,使用的依赖包是不一样的或者依赖包的版本是不一样的。这时候如果还把所有的包放到一个开发环境中,就会造成开发环境的臃肿、混乱(包的版本不一样),更甚者会是环境无法运行。原创 2021-11-17 15:46:12 · 3766 阅读 · 0 评论 -
Python中通过property实现属性的修改、删除、查看
1. property的作用在Python中,属性可以完成赋值、取值、删除的操作。如果我们想要在完成这些操作前,进行属性的校验工作(例如:赋值前判断数据的有效性、删除前判断合法性身份),则需要在方法中完成。那么有没有既能检查参数,又可以用类似属性这样简单的方式来访问类的变量呢?有的,我们可以通过property,来实现既能检查属性,还能用属性的方式来访问该属性的功能。2. property的本质——property类property()的实例化方式:property(fget=None, fset原创 2021-11-12 11:59:55 · 8241 阅读 · 0 评论 -
Python去除html标签的几种方法
最近小说看得比较多,但是很多小说网站都存在各种小广告,看起来很不方便,所以就自己写了个小程序,把小说都爬下来,然后搭个自己喜欢web页面来看。在爬取过程中没有出现太大的问题,只有在清洗数据时,发现小说文本中混杂HTML标签,所以就需要对标签进行清洗。我自己尝试了字符串的处理方式,正则,还有lxml等方式来处理这个问题,现在记录一下使用方式。我们使用下面这个字符串举例说明,内容为一段html代码。需要对这段字符串进行处理,提取文本html = '<p>你好</p><br/原创 2021-11-12 11:32:24 · 16066 阅读 · 0 评论 -
详解Python中的迭代器
1. 什么是迭代器迭代器是一个可以记住遍历位置的对象。可以遍历诸如列表,字典及字符串等序列对象迭代器的特点:迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问完结束。迭代器只能往前不会后退。2. 两个基本的方法:iter() 和 next()。序列对象可以利用iter()直接创建迭代器,并通过next()获取迭代器中的下一个元素。# 创建迭代器对象S = 'PYTHON'str_iter = iter(S)print(type(str_iter))# 利用for循环迭代原创 2021-04-22 17:59:59 · 6124 阅读 · 0 评论 -
一文搞懂Python中的三大法器之迭代器
1. 什么是迭代器迭代器是一个可以记住遍历位置的对象。可以遍历诸如列表,字典及字符串等序列对象迭代器的特点:迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问完结束。迭代器只能往前不会后退。2. 两个基本的方法:iter() 和 next()。序列对象可以利用iter()直接创建迭代器,并通过next()获取迭代器中的下一个元素。# 创建迭代器对象S = 'PYTHON'str_iter = iter(S)print(type(str_iter))# 利用for循环迭代原创 2021-04-08 20:32:53 · 6252 阅读 · 0 评论 -
对Python中字符串编码的理解
字符串,作为Python中基本数据类型中的一种,也是使用最频繁的数据类型。这里对字符串的编码格式做一个总结。 在Python中字符串有两种形式:一种是bytes类型,一种是str类型。str -&amp;gt;&amp;gt; bytes:encode编码bytes -&amp;gt;&amp;gt; str:decode解码文本总是Unicode,由str类型进行表示二进制数据使用bytes进行表示网络中...原创 2018-09-03 14:44:13 · 6082 阅读 · 0 评论 -
在Ubuntu下配置Chrome + Chromedriver
安装chrome步骤详细讲解使用在Ubuntu环境下,安装Chrome浏览器,并安装Chromedriver原创 2018-09-04 09:33:33 · 6972 阅读 · 0 评论