![](https://img-blog.csdnimg.cn/20201208182431270.jpeg?x-oss-process=image/resize,m_fixed,h_224,w_224)
Python
文章平均质量分 92
Python的学习笔记
尔玉先生
这个作者很懒,什么都没留下…
展开
-
Python:爬虫数据解析
1. 数据解析概述数据解析:是指对网页中指定的内容进行提取的过程数据解析分类:正则数据解析bs4数据解析xpath数据解析数据解析原理:解析局部的文本内容都会在标签之间或者标签对应的属性中进行存储数据解析要先进行指定标签的定位然后对标签或者标签对应的属性中存储的数据进行存储(解析)数据解析编码流程:指定url发起请求获取响应数据数据解析持久化存储2. 数据解析–正则表达式用正则表达式进行数据解析步骤:使用通用爬虫对url对应的一整张页面进行爬取找出要爬.原创 2020-10-20 21:03:49 · 168 阅读 · 0 评论 -
Python:requests模块
1. 爬虫概述爬虫是通过编写程序,模拟浏览器上网,让后让其在互联网上抓取数据的过程爬虫的分类:通用爬虫:抓取系统的重要组成部分,抓取的是一整张页面数据聚焦爬虫:是建立在通用爬虫的基础之上,抓取的是页面中特定的局部内容增量式爬虫:检测网站中数据更新的情况,只会抓取网站中最新更新出来的数据反爬机制:门户网站,可以通过制定相应的策略或技术手段,防止爬虫程序进行网站数据的爬取反反爬策略:爬虫程序可以通过制定相关的策略或者技术手段,破解门户网站中具备的反爬机制,从而获取门户网站信息robots..原创 2020-10-18 20:16:40 · 427 阅读 · 0 评论 -
Python:进程与线程
1. 进程概述进程(Process)是计算机中的程序关于某数据集合上的一次运行活动,是系统进行资源分配和调度的基本单位,是操作系统结构的基础。在早期面向进程设计的计算机结构中,进程是程序的基本执行实体;在当代面向线程设计的计算机结构中,进程是线程的容器。对于操作系统来说,一个任务就是一个进程。比方说打开浏览器就是启动一个浏览器的进程,在打开一个记事本就启动一个记事本进程,如果打开两个记事本就启动两个记事本进程。进程可以在任务管理器中进行查看2. 进程创建2.1 创建进程进程创建时需导入fr.原创 2020-08-09 16:56:41 · 164 阅读 · 0 评论 -
Python:正则表达式
1. 什么是正则表达式正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配正则表达式是对字符串操作的一种逻辑公式,用事先定义好的一些特殊字符,以及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑2. 字符串匹配方法2.1 re.match()re.match():尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回Noneimport restr = "张三李四王五赵六李四"# ma.原创 2020-08-07 20:27:36 · 274 阅读 · 0 评论 -
Python:输入与输出
1. 输入1.1 基本使用方法函数input() 让程序暂停运行,等待用户输入一些文本。获取用户输入后,Python将其存储在一个变量中,以方便使用。message = input("Tell me something, and I will repeat it back to you: ") print(message)函数input() 接受一个参数:即要向用户显示的提示或说明,让用户知道该如何做。在这个示例中,Python运行第1行 代码 时,用户将看到提示Tell me.原创 2020-08-04 21:51:04 · 269 阅读 · 0 评论 -
Python:Pandas的使用
1. Pandas介绍什么是Pandas数据处理工具专门用于数据挖掘的开源python库以Numpy为基础,借力Numpy模块在计算方面性能高的优势基于matplotlib,能够简便的画图独特的数据结构为什么使用Pandas便捷的数据处理能力读取文件方便封装了Matplotlib、Numpy的画图和计算Pandas的三大核心数据结构DataFrame: 带行列索引的二维数组Panel: 存储三维数据的结构Series: 带索引的一维数组DataFram原创 2020-08-04 21:48:40 · 210 阅读 · 0 评论 -
Python:Numpy的使用
1. Numpy的优势1.1 Numpy的介绍Numpy(Numerical Python)是一个开源的Python科学计算库,用于快速处理任意维度的数组。Numpy支持常见的数组和矩阵操作。对于同样的数值计算任务,使用Numpy比直接使用Python要简洁的多。Numpy使用ndarray对象来处理多维数组,该对象是一个快速而灵活的大数据容器。1.2 ndarray介绍Numpy提供了一个N维数组类型ndarray,它描述了相同类型的“items”的集合。import numpy as n.原创 2020-08-04 21:46:53 · 599 阅读 · 0 评论 -
Python:Matplotlib的使用
1. Matplotlib的三层结构1.1 容器层容器层主要由Canvas、Figure、Axes组成。Canvas是位于最底层的系统层,在绘图的过程中充当画板的角色,即放置画布(Figure)的工具。Figure是Canvas上方的第一层,也是需要用户来操作的应用层的第一层,在绘图的过程中充当画布的角色。Axes是应用层的第二层,在绘图的过程中相当于画布上的绘图区的角色。画板层上有画布层,画布层上有绘图区。画板层不用我们显式的创建,但是画布层需要显式创建(plt.figure),画布层上可.原创 2020-08-04 21:43:24 · 338 阅读 · 0 评论 -
Python:内置函数
1. 函数的知识eval()函数常见作用有:计算字符串中有效的表达式,并返回结果a = "[[1,2], [3,4], [5,6], [7,8], [9,0]]"b = eval(a)print(b) #[[1, 2], [3, 4], [5, 6], [7, 8], [9, 0]]a = "{1:'xx',2:'yy'}"c = eval(a)print(c) #{1: 'xx', 2: 'yy'}a = "(1,2,3,4)"d = eval(a)print(d) #(1.原创 2020-08-04 21:37:26 · 335 阅读 · 0 评论 -
Python:异常处理机制
1. 什么是异常异常即是一个事件,该事件会在程序执行过程中发生,影响了程序的正常执行。一般情况下,在Python无法正常处理程序时就会发生一个异常。异常是Python对象,表示一个错误。当Python脚本发生异常时我们需要捕获处理它,否则程序会终止执行。2. 异常处理机制一2.1 try-except-else使用except而不带任何异常类型当不带有任何异常类型时,格式为:try: 正常的操作 ......................except: 发生.原创 2020-08-02 18:21:56 · 476 阅读 · 0 评论 -
Python:文件操作
1. 打开关闭文件1.1 打开文件你必须先用Python内置的open()函数打开一个文件,调用相关的方法才可以对它进行读写。# file_name:file_name变量是一个包含了你要访问的文件名称的字符串值# access_mode:access_mode决定了打开文件的模式:只读,写入,追加等,这个参数是非强制的,默认文件访问模式为只读(r)# buffering:如果buffering的值被设为0,就不会有寄存。如果buffering的值取1,访问文件时会寄存行。steam = op.原创 2020-08-02 18:20:36 · 295 阅读 · 0 评论 -
Python:函数、闭包、装饰器
1. 函数的定义与使用def greet_user(): """显示简单的问候语""" print("Hello!") greet_user() #Hello!这个示例演示了最简单的函数结构。使用关键字def来告诉Python你要定义一个函数。定义函数时,要向Python指出了函数名,还可能在括号内指出函数需要的参数。在这里,函数名为greet_user() ,它不需要任何参数,因此括号是空的(即便如此,括号也必不可少)。最后,定义以冒号结尾。函数在进行使用时必.原创 2020-08-02 18:17:26 · 115 阅读 · 0 评论 -
Python:运算符
1. 赋值运算符=+=-=*=/=不同变量具有相同内容,则内存地址也相同,这节省了内存空间。赋值是内存中地址指向的改变。2. 算数运算符+-*:可以结合字符串使用/**:幂次运算符//: 整除运算符%: 取余运算符3. 关系运算符==!=><>=<=is: 内存地址的比较is not关系运算符的返回结果只有False或True整数在程序中的使用非常广泛,Python为了优化速度,使用了小整数对象池,避免为整数频繁申请和.原创 2020-08-02 18:13:35 · 115 阅读 · 0 评论 -
Python:字符串
1. 字符串的运算符+# +name = "张三"age = 18# 张三的年龄为18print(name + "的年龄为:" + str(age))# *str1 = "abc"# abcabcabcabcabcprint(str1 * 5)in、not in# in、not instr2 = "steven"result1 = "s" in str2result2 = "st" in str2result3 = "e" not in str2re.原创 2020-08-02 18:11:26 · 190 阅读 · 0 评论 -
Python:元组、字典、集合
1. 元组1.1 元组的概念与声明什么是元组列表非常适合用于存储在程序运行期间可能变化的数据集,并且列表是可以修改的。然而,有时候你需要创建一系列不可修改的元素,元组可以满足这种需求。元组看起来犹如列表,但使用圆括号而不是方括号来标识。元组的创建dimensions = (200, 50) print(dimensions[0]) #200 print(dimensions[1]) #50将试图修改元素时,程序将会报错。1.2 遍历元组中的所有值像列表一样,也可以使用fo.原创 2020-08-02 18:06:53 · 251 阅读 · 0 评论 -
Python:列表
1. 列表概念及创建列表1.1 列表的概念列表是一系列按特定顺序排列的元素组成。你可以创建包含字母表中所有字母、数字0~9或包含字符串的列表;也可以将任何东西加入列表中,其中的元素之间可以没有任何关系。在Python中,用方括号[ ]来表示列表,并用逗号来分隔其中的元素。1.2 创建列表1. 普通方式创建列表bicycles = ['trek', 'cannondale', 'redline', 'specialized'] print(bicycles) #['trek', 'cann.原创 2020-08-02 18:01:04 · 171 阅读 · 0 评论 -
Python:列表推导式、生成器、迭代器
1. 列表推导式列表推导式是通过旧的列表通过公式推导出新的列表还有集合推导式、字典推导式,与列表推导式类似格式为:[表达式 for 变量 in 旧列表][表达式 for 变量 in 旧列表 if条件]# 过滤掉长度小于或等于3的人名names = ['tom','lily','abc','jack','steven']result = [name for name in names if len(name) > 3]print(result) #['lily', 'jack', .原创 2020-08-02 17:58:12 · 437 阅读 · 0 评论 -
Python:模块
1. 模块的用途在Python中,模块是代码组织的一种方式,把功能相近的函数或者类放到一个文件中,一个文件(.py)就是一个模块(module),模块名就是文件名去掉后缀.py这样做的好处是:提高代码的可复用行、可维护性、一个模块编写完毕后,可以很方便的在其他项目中导入解决了命名冲突,不同模块中相同的命名不会冲突2. 导入模块2.1 import 模块名使用这一方法可以将模块中所有内容(变量、函数、类)导入,但是使用这些内容时必须用模块名.变量、模块名.函数、模块名.类的方式,非常不方便.原创 2020-08-02 17:55:00 · 204 阅读 · 0 评论 -
Python:面向对象
1. 类与对象1.1 类与对象的创建类名为驼峰式命名法,每个单词开头大写每个类都自动继承Object类类中的每个属性都必须有初始值,哪怕这个值是0或空字符串可以通过“类名.属性”的方式修改类的普通属性# 类的创建# 由于类的方法会在下面讲述,所以这里创建的类只有属性class Person: name = 'Licy' age = '18'# 对象的创建person1 = Person()person2 = Person()# 同一类的不同对象的初始属性相同.原创 2020-07-26 17:42:55 · 148 阅读 · 0 评论