![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Python零基础
kingx3
这个作者很懒,什么都没留下…
展开
-
Python零基础之多线程爬取王者荣耀官方网站高清壁纸(threading、queue)
Python零基础之多线程爬取王者荣耀官方网站高清壁纸1. 目标2. 代码示例3. 注意4. 引用1. 目标通过多线程和队列的方式快速抓取王者荣耀高清壁纸程序架构以生产者-消费者模式进行设计,数据缓存在两个队列中将壁纸文件按照英雄名称为目录的方式保存实现对下载失败的文件重新下载2. 代码示例# !/usr/bin/python# Filename: 多线程方式实现王者荣耀壁纸图片抓取.py# Data : 2020/08/21# Author : --king--# ctr原创 2020-08-21 17:15:48 · 436 阅读 · 0 评论 -
Python零基础之爬取王者荣耀官方网站高清壁纸(普通版)
Python零基础之爬取王者荣耀官方网站高清壁纸目标:分析过程:1. 确定目标url2. 解决url解析问题3. 图片下载解析4. 多页面的处理代码示例需要注意的问题:目标:1.下载王者荣耀网站游戏壁纸的高清壁纸2.把同一个名称的壁纸放到同一个文件夹分析过程:1. 确定目标url访问https://pvp.qq.com/web201605/wallpaper.shtml发现图片地址并不在网页html源码中,检查浏览器,分析network。发现目标url有可能是:https://原创 2020-08-16 19:38:09 · 1907 阅读 · 0 评论 -
Python零基础之生产者和消费者线程交互
Python零基础之生产者和消费者线程交互1. 功能需求2. Lock版生产者和消费者3. Condition版生产者和消费者1. 功能需求由生产者进行生产由消费者进行消费消费者消费金额不能大于余额生产10次以后不再生产当余额小于消费金额且生产次数达到10次后,就不再消费2. Lock版生产者和消费者# !/usr/bin/python# Filename: Lock版的生产者和消费者.py# Data : 2020/08/15# Author : --king--# c原创 2020-08-15 18:54:53 · 119 阅读 · 0 评论 -
Python零基础之多线程(threading、enumerate、Lock、RLock、Queue、Condtion)
Python零基础之多线程1. 为什么要使用多线程2. python如何实现多线程2.1 python的多线程模块2.2 主线程和子线程的执行关系2.3 查看线程数量.enumerate()2.4 验证进程的创建和运行1. 为什么要使用多线程多线程类似于同时执行多个不同程序,多线程运行有如下优点:使用线程可以把占据长时间的程序中的任务放到后台去处理。用户界面可以更加吸引人,比如用户点击了一个按钮去触发某些事件的处理,可以弹出一个进度条来显示处理的进度。程序的运行速度可能加快。在一些等待的任务原创 2020-08-15 00:06:03 · 306 阅读 · 0 评论 -
Python零基础之Tesseract图像识别
Python零基础之Tesseract图像识别1. 什么是Tesseract2. 下载和安装3.1. 什么是Tesseracttesseract: “立方体的四维模拟;四次元立方体;超正方体”。tesseract ocr: 图像识别类库 ; 光学字符识别OCR,即Optical Character Recognition,光学字符识别,是指通过扫描字符,然后通过其形状将其翻译成电子文本的过程。对于图形验证码来说,它们都是一些不规则的字符,这些字符确实是由字符稍加扭曲变换得到的内容。2.原创 2020-08-11 20:22:59 · 850 阅读 · 0 评论 -
Python零基础之selenium进阶(多窗口和页面等待)
Python零基础之selenium进阶 - 多窗口和页面等待1. selenium中的页面等待2. selenium多窗口1. selenium中的页面等待主要分为三种:固定等待,隐式等待,显式等待固定等待:通过time.sleep()实现,等待一段时间,这个时间可以是固定值也可以配合random模块调整为随机值隐式等待:通过.implicitly()实现,有等待条件,一般为有匹配对象就立刻结束等待时间,运行效率较高,但存在被反爬的风险显式等待:通过WebDriverWait()实现,与隐式原创 2020-08-10 17:48:51 · 620 阅读 · 0 评论 -
Python零基础之selenium进阶:自动登录qq空间
Python零基础之selenium进阶:自动登录qq空间目标注意事项目标通过selenium自动登录qq空间获取cookie并保存成文件通过requets加载headers实现自动登录qq空间# !/usr/bin/python# Filename: selenium登录qq空间.py# Data : 2020/08/07# Author : --king--# ctrl+alt+L自动加空格格式化from selenium import webdriverimpor原创 2020-08-08 00:01:10 · 229 阅读 · 0 评论 -
Python零基础之selenium
Python零基础之selenium1. selenium1.1 什么是selenium1.2 selenium的功能1.3 selenium的优势2. 初探selenium2.1 selenium的一些方法2.2 selenium如何与浏览器互动2.3 操作下拉菜单2.4 行为链Action Chains3. 使用selenium自动登录豆瓣3.1 代码示例3.2 注意事项1. selenium1.1 什么是seleniumselenium 英[səˈliːniəm] 美[səˈliːniəm]原创 2020-08-07 04:01:32 · 371 阅读 · 0 评论 -
Python零基础之bs4抓取全国天气
Python零基础之bs4抓取全国天气目标需要注意的地方目标使用bs4抓取全国天气使用面向对象的写法# !/usr/bin/python# Filename: 用bs4实现抓取全国天气预报.py# Data : 2020/07/29# Author : --king--# ctrl+alt+L自动加空格格式化from bs4 import BeautifulSoupimport requestsimport csv# 获取网页源代码def page_html原创 2020-07-29 18:32:54 · 233 阅读 · 0 评论 -
Python零基础之BeautifulSoup4
BeautifulSoup41. 什么是BeautifulSoup42. BS4入门2.1 功能示例2.2 数据类型3. 遍历节点3.1 遍历子节点:.contents .children .descendants3.2 获取字符串内容:.string .strings .stripped strings3.3 遍历父节点:.parent .parents3.4 遍历兄弟节点:_sibling _siblings4. 搜索树:find, find_all和过滤器4.1 find, find_all4.2 过原创 2020-07-28 19:30:09 · 264 阅读 · 0 评论 -
Python零基础之xpath实现爬取豆瓣TOP250(lxml,,etree,xpath,csv)
lxml和xpath1. xpath语法1.1 什么是xpath1.2 xpath语法1.3 xpath运算符2. xpath如何使用?2.1 lxml库2.2 etree用法3. 如何写入csv文件4. 抓取豆瓣TOP2501. xpath语法1.1 什么是xpathXPath(XML Path Language)是一种XML的查询语言: 他能在XML树状结构中寻找节点。XPath 用于在 XML 文档中通过元素和属性进行导航xml是一种标记语法的文本格式: xpath可以方便的定位xml中的元原创 2020-07-27 02:01:47 · 260 阅读 · 0 评论 -
Python零基础之爬取瀑布页百度图片(正则表达式,爬虫,反爬,延时,异常处理)
通过正则表达式爬取瀑布页百度图片思路:需要注意的地方:思路:根据输入的关键字,获取想要爬取的百度图片页的url地址为了方便抓取,把瀑布页的展示模式改为翻页式寻找翻页url的规律,获取需要抓取的url地址分析url和html源码,通过正则表达式获取原始图片的url地址通过正则表达式处理将来需要保存的图片名称获取图片数据,并保存为指定名称# !/usr/bin/python# Filename: 通过正则表达式爬取瀑布页百度图片.py# Data : 2020/07/23# Au原创 2020-07-23 17:36:54 · 436 阅读 · 0 评论 -
Python零基础之自动登录12306
Python零基础之自动登录12306文章目录Python零基础之自动登录12306需要注意的问题直接上代码分析过程在代码注释中已经写的较为清楚# !/usr/bin/python# Filename: 登录12306.py# Data : 2020/07/21# Author : --king--# ctrl+alt+L自动加空格格式化# 验证码url分析# 首先开12306,点击登录,在登录界面看到扫码和账号登录# 通过输入错误的验证码和输入争取的验证码,抓包发现,原创 2020-07-23 01:19:54 · 242 阅读 · 0 评论 -
Python零基础之re正则表达式
1. re中的一些函数match和search是只返回第一个匹配的结果或者返回NONEfindall返回所有匹配的结果# !/usr/bin/python# Filename: test.py# Data : 2020/07/16# Author : --king--# ctrl+alt+L自动加空格格式化import re# 以下是re中match,search,findall的定义# 1. match# 从字符串开始部分进行匹配,如果匹配成功,返回一个匹配结果,原创 2020-07-20 20:39:17 · 173 阅读 · 1 评论 -
Python零基础之通过post请求实现有道翻译小程序(urllib,request,post,parse,json)
# !/usr/bin/python# Filename: 有道翻译实现post请求.py# Data : 2020/07/16# Author : --king--# ctrl+alt+L自动加空格格式化import urllib.requestimport urllib.parseimport json# 目标:通过post实现有道翻译的小功能# 获取想翻译的文字key = input('请输入您想要翻译的文字:')# 构造POST内容data = {原创 2020-07-16 23:37:31 · 330 阅读 · 0 评论 -
Python零基础之用三种方式爬取百度贴吧(urllib,request,parse)
一: 入门写法# !/usr/bin/python# Filename: 实战 爬取百度贴吧.py# Data : 2020/07/14# Author : --king--# ctrl+alt+L自动加空格格式化import urllib.request, urllib.parseimport random# 随机获取一个user-agent# 百度上很多U-A大全header_list = [{ 'User-Agent': 'Moz原创 2020-07-16 19:58:28 · 335 阅读 · 0 评论 -
Python零基础之urllib
1. urllib.request模块通过urllib获取百度首页源码import urllib.request# 通过urlopen打开网址,返回值为http.client.HTTPResponse object对象# res = urllib.request.urlopen('https://www.baidu.com')# print(res)## # 如果有反爬,则会返回错误数据# print(res.read())# # 返回值为字节# print(type(re原创 2020-07-11 22:21:09 · 149 阅读 · 0 评论 -
Python零基础之爬虫介绍
爬虫介绍1.什么是爬虫?2.为什么需要爬虫?3. 企业获取数据的方式有哪些?4. Python做爬虫的优势5. 爬虫的分类6. 几个概念7. 抓包工具1.什么是爬虫?- 让计算机去模拟人进行网页浏览操作2.为什么需要爬虫?- 为其他数据提供数据源、数据分析、AI/人工智能等- 人脸识别、无人驾驶、智能家居、智能语音、无人机等3. 企业获取数据的方式有哪些?- 公司自有数据- 第三方平台的数据(免费和付费) - 免费:如百度指数 - 收费:如贵阳大数据交易所,数据堂等- 爬虫工程师原创 2020-07-11 21:27:16 · 148 阅读 · 0 评论 -
Python零基础之爬虫基础知识(协议和网络模型)
爬虫基础爬虫基础1. 通讯协议2. 网络模型2.1 OSI七层模型2.2 TCP/IP模型3. http、https和相关协议3.1 http3.2 https3.3 SSL3.4 TLS爬虫基础1. 通讯协议开放系统互联协议中最早的协议之一,它为连接不同操作系统和不同硬件体系结构的互联网络提供通信支持,是一种网络通用语言。TCP/IP协议定义了在互联网络中如何传递、管理信息(文件传送、收发电子邮件、远程登录等),并制定了在出错时必须遵循的规则。实现不同目标的相互通信的过程通讯协议就是通信方都必原创 2020-07-09 22:18:03 · 381 阅读 · 0 评论 -
Python零基础之异常处理和文件处理
文章目录异常1. 异常的简介2. 异常的传播3. 异常对象文本文件的操作1. 打开文件2. 读取文件内容2.1 read()2.2 readline()2.3 readlines()3. 关闭文件4. 上下文管理器5. 文件操作标准格式6. 文件的写入6.1 ‘w’6.2 ‘a’6.3 'rb'和'wb'异常1. 异常的简介在程序的运行过程中出现的错误就是异常异常会导致程序终止,异常以后的代码都不会去执行异常处理# try 语句结构try: 代码块 # 可能出现错误的语句except:原创 2020-06-21 17:08:10 · 203 阅读 · 0 评论 -
Python零基础之模块、迭代器和生成器
文章目录模块1. 模块的简介2. 模块的导入模块1. 模块的简介模块化 : 将完整的程序分成一个个功能模块模块化的优点:1.方便开发并且方便维护2.模块可以复用3.高复用,低耦合2. 模块的导入import 模块名 (即Python文件名)# 在Python中一个.py文件就是一个模块# 引入外部模块import test_m# 可以多次引入同一个模块,但是模块只会执行一次import test_m# 打印出的结果是被引用模块所在的路径print(t原创 2020-06-17 21:57:42 · 121 阅读 · 1 评论 -
Python零基础之面向对象(继承,方法的重写,super(),多重继承,多态,属性和方法)
@TOPIC继承什么是继承?继承是一种创建新的类的方式,新创建的叫子类,继承的叫父类、超类、基类。特点:子类可以使用父类的属性(特征、技能)继承是类与类之间的关系为什么要继承?减少代码冗余、提高重用性...原创 2020-06-15 22:53:09 · 152 阅读 · 0 评论 -
Python零基础之面向对象(__init__方法,封装,property装饰器)
1. 特殊方法__init__基本结构特殊方法不需要调用,系统会在特殊的时候自动调用该方法init()方法在创建对象时自动调用,用来对新创建的对象初始化属性程序会首先执行类中的代码,再执行__init__()中的代码class 类名([]): 公共属性 # 对象的初始化方法 def __init__(self,参数,...,参数n) pass # 其他的方法 def method1(self): pass def原创 2020-06-14 22:18:36 · 263 阅读 · 0 评论 -
Python零基础之面向对象(对象,类,属性和方法)
1. 对象的简介Python就是一个面向对象的编程语言对象就是内存中用来存储数据的一块区域对象也成为类的实例对象的结构:id(): 标识 (唯一的,在C Python中,就是对象的 内存地址)type(): 类型 (用来表示当前对象所处类型,决定了对象的功能)value(): 值 (对象中存储的具体数据)可变对象和不可变对象不可变对象值不能改变,可变对象值可以改变面向过程的编程方式:编程逻辑简单, 思路清晰复用困难, 修改困难面向对象的编程方式:所有操作通过原创 2020-06-10 22:15:42 · 126 阅读 · 0 评论 -
Python零基础之环境变量
环境变量我的电脑右键属性 →高级系统设置→系统属性→高级→环境变量用户变量 | 系统变量用户变量系统变量作用用户作用系统修改变量名 | 变量值多个变量名用‘;’分开path环境变量添加path变量名+路径,则全局可以打开windows寻找文件先找本目录,再找环境变量的路径环境变量不区分大小写,用‘;’分隔...原创 2020-05-20 20:27:22 · 199 阅读 · 0 评论 -
Python零基础之基本概念
Python 语言1. 基本概念简介,快速,门槛低Python的创始人为吉多*范罗苏姆 (Gudio van Rossum)吉多 龟书 大神Python的起源可以追溯到1989年12月,由Guido van Rossum(Python社区的仁慈独裁者)创建,作为一个在圣诞节期间工作的爱好项目,Python的名字不是取义于大蟒蛇,而是来自于英国喜剧团Monty Python。Python诞生于ABC语言,是van Rossum工作的荷兰CWI研究所的终止项目,van Rossum也在研究叫Amoe原创 2020-05-20 21:08:45 · 399 阅读 · 0 评论 -
Python零基础之环境搭建
搭建Python环境Python解释器的种类Cpython(官方)1. 下载Pythonhttps://www.python.org/downloads/Python 3.6.10https://www.python.org/downloads/release/python-3610/不推荐下载右侧预览版Python 3.6.8https://www.python.org/downloads/release/python-368/windows版本选择.executable ins原创 2020-05-20 21:58:54 · 181 阅读 · 0 评论 -
Python零基础之运算符
运算符1. 运算符的概念- 用于执行代码运算,对一个以上操作数进行运算。- 分为算术运算符、赋值运算符、⽐较运算符(关系运算符)、逻辑运算符、条件运算符(三元运算符)1.1 算数运算符- 加法运算符 表现形式 +- 减法运算符 表现形式 -- 乘法运算符 表现形式 *- 除法运算符 表现形式 /- // 整除,只会保留计算后的整数位,总会返回⼀个整型- % 取模,求两个数相除的余数- ** 幂运算,求⼀个值的⼏次幂1.2 赋值运算符- 赋值运算符的特殊写法 x = x + 3原创 2020-05-27 16:48:32 · 132 阅读 · 0 评论 -
Python基础之条件选择语句
条件选择语句1. if语句如果满足条件, 执行代码块1;如果不满足条件, 执行代码块2。if 条件: 代码块12. input()函数输出为str,注意与数字比较时要增加int()content = input('请输入内容')if content == 'Python' print('通过验证')3. if else语句if 条件: 代码块1else: 代码块2salary = int(input('请输入你的工资 ='))if salary >= 2原创 2020-05-27 22:48:42 · 706 阅读 · 0 评论 -
Python零基础之序列
序列可变序列:比如列表:列表名(或称为列表引用)指向堆空间中的一个列表。列表引用当中存储的内容为地址,可以指向堆内存中的具体对象.一方面,该列表可以保证在地址不变的前提下,改变列表内容;另一方面,该引用也可以直接指向堆空间中的另外一个列表…不可变序列:比如数字、字符、(元祖):对于基础数据类型,变量地址即变量本身,所以值发生变化了,内存地址就一定也变了。比如字符串:被称为不可变的字符序列,每个字符底层均有规范的Unicode码对应,内存规定无法对单一的一个字符进行修改,要修改字符串必须重新原创 2020-05-29 22:37:56 · 186 阅读 · 0 评论 -
Python零基础之元组,字典,集合
1.元组 ()Python 的元组与列表类似,不同之处在于元组的元素不能修改。属于不可变序列元组使用小括号,字典使用大括号,列表使用方括号。元组创建很简单,只需要在括号中添加元素,并使用逗号隔开即可。tup=()print(type(tup))非空元组至少有一个逗号tup=(1,)print(type(tup))元组定义不加括号也会被认作元组tup1 = 0,print(type(tup1))tup= 1,2,3,4,5print(type(tup))可以批原创 2020-06-01 22:06:06 · 510 阅读 · 0 评论 -
Python零基础之函数(一)(函数的定义、传递方式、不定长参数和函数的解包)
写在函数之前可变对象每个对象都保存了3个数据 id(标识) type(类型) value(值)# 列表是一个可变对象a = [1,2,3]# 修改对象里面的值,id不变a[0] = 10# 实际上修改了变量,此a非彼a,id已变a = [4,5,6]1.修改变量和对变量赋值对id的影响a = [1,2,3]print('修改前的id:',id(a))a[0] = 10print('修改后的id:',id(a))a = [4,5,6]print('赋值后的id:'.原创 2020-06-03 22:27:26 · 190 阅读 · 0 评论 -
Python零基础之函数二(return、文档字符串、函数作用域、递归函数)
一. 函数的返回值return通过return返回数据数据return后边跟随什么数据或变量,函数就返回什么return后边可以跟数据类型的值和变量,甚至是函数不写return相当于return Nonereturn后的代码语句都不会执行def s(*b): r = 0 for i in b: r += i # 仅仅是打印无法利用 print(r) # 可以通过return返回函数执行完的结果 returns(1,2)de原创 2020-06-05 22:25:19 · 223 阅读 · 0 评论 -
Python零基础之高阶函数(高阶函数,匿名函数,闭包,装饰器)
1. 高阶函数接收函数作为参数,或者将函数作为返回值返回都是高阶函数高阶函数示例:lst = [i for i in range(1,11)]# 定义一个函数,用来检查偶数def fn2(i): if i % 2 == 0: return True# 定义一个函数,用来检查数字是否大于5def fn3(i): if i > 5: return True# 定义一个函数,用来检查偶数def fn4(i): if i % 3原创 2020-06-08 21:45:55 · 140 阅读 · 0 评论 -
Python零基础之汉诺塔谜题(解题思路,步骤,和步数)
Python零基础之汉诺塔谜题汉诺塔(又称河内塔)问题是源于印度一个古老传说的益智玩具。大梵天创造世界的时候做了三根金刚石柱子,在一根柱子上从下往上按照大小顺序摞着64片黄金圆盘。大梵天命令婆罗门把圆盘从下面开始按大小顺序重新摆放在另一根柱子上。并且规定,在小圆盘上不能放大圆盘,在三根柱子之间一次只能移动一个圆盘。# 定义一个函数解决汉诺塔游戏# a b c三个柱子,假设所有的盘子初始都在a,a柱上有n≥1个盘子,要全部移动到c# 目标# 实现输出每一步:如第一步第1个盘子从a到b,第二步第2个盘原创 2020-06-08 22:26:03 · 2237 阅读 · 0 评论