引言
2020 年完成了 Python 基础学习 系列文章,也实践到工作上,写了一些好用的小工具,Python 是一门非常实用的编程语言,易学,易用。2021 年圣诞期间连休了多天年假,正好可以集中整理 Python 进阶学习 玩转数据系列,数据处理太重要了,Python 提供非常丰富强大的数据处理功能,取到事倍功半功效。期待以后能来一个 Python 高阶学习 机器学习系列,这是我的一个心愿,但愿以后有机会能实现。
Python 进阶学习 玩转数据 系列大纲
NumPy 模块
NumPy ndarray Attributes 多维数组属性 ndim shape size axis
NumPy ndarray 数组的创建
NumPy ndarray Array Indexing, Slicing, Striding, View Subarray,Copy Subarray
原理剖析
动态类型 共享引用 垃圾回收 参数传递
图解 Python 赋值,浅拷贝 copy.copy() 和 深拷贝 copy.deepcopy() 原理
NumPy ndarray 数组 和 Python list 列表的区别
Pandas 模块
Pandas 抽象数据类型 index series DataFrame
Pandas Indexing and Slicing
Pandas 增删改查 CRUD: Create, Read, Update, Delete
数据读写
数据读写 Data I/O for NumPy Arrays
数据读写 Data I/O: Pandas 读写 CSV 和 Excel XLSX
数据读写 Data I/O: Pandas 读写 JSON File Format
数据读写 Data I/O for XML File Format
数据处理
Pandas 数据处理 查询,过滤,拆分数据 subset filter
Pandas 数据处理 追加 df.append()
Pandas 数据处理 合并 pd.merge() df1.merge(df2)
数据清洗
Pandas 数据清洗 处理缺失值 None NA NaN inf dropna fillna isin isnull