1 基础语法
1.1 字面量
1.2 注释
ps:单行注释与多行注释
- 单行注释不能包含多行注释。
- 多行注释可以包含单行注释,但不能嵌套其他多行注释。
1.3 字符串
1.3.1 定义方式
联系与区别:
- 三引号定义法,和多行注释的写法一样,同样支持换行操作。
- 使用变量接收它,它就是字符串
- 不使用变量接收它,就可以作为多行注释使用
- 单引号定义法,可以内含双引号
- 双引号定义法,可以内含单引号
- 可以使用转移字符(\)来将引号解除效用,变成普通字符串
1.3.2 字符串拼接
1.3.3 字符串格式化
快速格式化–f"{}{}"
表达式格式化
1.3.4 精度控制
1.4 int、float、string的数据类型转换
1.5 运算符
算术运算符
赋值运算符
1.6 输入与输出
1.6.1 输入
1.6.2 输出
2 判断语句
2.1 if
2.1.1 注意点:
2.1.2 if-elif-else
3 循环语句
3.1 while
3.2 for
range语句
语法
作用域
3.3 break与continue
3.4 对比
4 函数
4.1 定义及语法
4.2 返回值
应用场景
4.3 局部变量与全局变量–global
4.4 函数进阶
4.4.1 函数的多个返回值
4.4.2 多种传参方式
位置参数
关键字参数
缺省参数
不定长参数
位置传递
关键字传递
4.4.3 匿名函数
函数作为参数传递
作用
lambda匿名函数
注意事项
5 数据容器
5.1 list
5.1.1 索引
反向索引
嵌套索引
5.1.2 方法
查询 .index()
修改
指定位置
插入和追加
删除
统计
方法总览
5.1.3 特点
5.2 元组
5.2.1 定义
5.2.2 相关操作
注意事项
5.3 字符串
5.3.1 定义及下标
5.3.2 常用操作
替换
分割
规整
统计
汇总
5.4 序列
5.4.1 定义
5.4.2 切片
演示
5.5 集合
5.5.1 定义
5.5.2 常用操作
添加与移除
取出与清空
取差集
消除差集
合并
常用功能总结
5.6 字典、映射
5.6.1 字典定义
获取
注意事项
5.6.2 常用操作
新增与更新
删除与清空
获取所有key与遍历
总结
5.7 对比总结
5.7.1 分类
5.7.2 特点
5.7.3 应用场景
5.7.3 通用功能
6 文件操作
6.1 文件打开–open()
mode访问模式
6.2 文件读取–read()
连续读取,第二次读取是在第一次的结尾开始,不管是哪个read方法
for读取
关闭文件对象
6.1-6.2汇总
6.3 文件写入–write()
追加写入
7 异常
7.1 捕获异常
常规异常
指定异常
多个异常
捕获异常并输出基本信息
捕获所有异常
7.2 异常else
7.3 异常finally
8 模块
8.1 定义
8.2 导入方式
8.3 自定义模块
8.4 测试模块
8.5 all
9 包
9.1 定义
9.2 导入包
9.3 安装第三方包
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple 包名称
10 面向对象
10.1 初识
10.2 类的定义和使用
10.2.1 成员方法
注意事项
10.2.2 构造方法
问题
定义
注意事项
10.2.3 其他内置方法
魔术方法
__str__字符串方法–类似于java toString
__lt__小于符合比较方法
__le__小于等于比较符号方法
__eq__比较运算符
10.2.4 私有成员–封装
访问限制
10.3 继承
10.3.1 单继承
10.3.2 多继承
注意事项
pass关键字
10.3.3 复写
调用父类同名成员
10.4 类型注解
10.4.1 为什么需要类型注解
10.4.2 定义
10.4.3 语法
变量的
函数(方法)的
形参注解
返回值注解
Union类型
10.5 多态
10.5.1 概念
10.5.2 抽象类
11 Spark
11.1 介绍
11.2 pyspark
11.2.1 入口对象
11.2.2 编程模型
11.2.3 RDD对象
py数据容器转RDD
文件转RDD
11.2.3 数据计算
map方法
from pyspark import SparkConf, SparkContext
import os
os.environ['PYSPARK_PYTHON'] = "D:\python\python.exe"
conf = SparkConf().setAppName('test').setMaster('local[*]')
sc = SparkContext(conf=conf)
rdd = sc.parallelize([1, 2, 3, 4, 5])
def func(data):
return data * 10
rdd2 = rdd.map(lambda x: x * 5 + 5)
print(rdd2.collect())
sc.stop()
flatMap
reduceByKey
filter
distinct
sortBy
全局排序设置分区数为1
11.2.4 RDD对象转python对象
collect
reduce
take
count
11.2.5 RDD对象输出到文件中
saveAsTextFile
注意事项
修改RDD分区->输入到一个文件
12 python进阶技巧
12.1 闭包
12.1.1 概念
12.1.2 注意事项
12.2 装饰器
12.2.1 概念
12.2.2 写法
12.3 设计模式
12.3.1 单例
12.3.2 工厂
12.4 多线程
threading
import time
import threading
def sing(msg):
while True:
print(msg)
time.sleep(1)
def dance(msg):
while True:
print(msg)
time.sleep(1)
if __name__ == '__main__':
sing_thread = threading.Thread(target=sing, args=("lalalalla",))
dance_thread = threading.Thread(target=dance, kwargs={"msg": "wtqwrqr"})
sing_thread.start()
dance_thread.start()
12.5 网络编程
12.5.1 服务端
socket
服务端编程
12.5.2 客户端
12.6 正则表达式
12.6.1 基础方法
12.6.2 元字符匹配