Python-数据分析
文章平均质量分 95
numpy和pandas
南河Aure
学习笔记记录
展开
-
04 数据清洗与准备
目录 1. 处理缺失值 1.1 过滤缺失值 1.2 补全缺失值 2. 数据转换 2.1 删除重复值 2.2使用函数或映射进行数据转换 2.3 替代值 2.4重命名轴索引 2.5离散化和分箱 2.6检测和过滤异常值 2.7置换和随机抽样 2.8计算指标/虚拟变量 3 字符串操作 3.1字符串对象方法 3.2正则表达式 3.3pandas中的向量化字符串函数 1. 处理缺失值 pandas对象的所有描述性统计信息默认情况下是排除缺失值的。 对于数值型...原创 2022-03-27 15:17:09 · 5170 阅读 · 0 评论 -
03 数据载入、存储及文件格式
目录 1. 文本格式数据的读写 1.1分块读入文本文件 1.2将数据写入文本格式 1.3使用分隔格式 1.4JSON数据 1.5XML和HTML:网络抓取 1.5.1使用lxml.objectify解析XML 2. 二进制格式 2.1使用HDF5格式 2.2读取Microsoft Excel文件 3.与Web API交互 4.与数据库交互 1. 文本格式数据的读写 表格型数据读取为DataFrame对象是pandas的重要特性。read_csv和read_...原创 2022-03-26 15:49:10 · 2295 阅读 · 0 评论 -
02 pandas入门
目录 1. pandas数据结构介绍 1.1 Series 1.2DataFrame 1.3 索引对象 2. 基本功能 2.1 重建索引 2.2轴向上删除条目 2.3索引、选择与过滤 2.3.1使用loc和iloc选择数据 2.4 整数索引 2.5 算术和数据对齐 2.5.1使用填充值的算术方法 2.5.2DataFrame和Series间的操作 2.6函数应用和映射 2.7 排序和排名 2.8含有重复标签的轴索引 3.描述性统计的概述与计算 3.1相...原创 2022-03-25 18:51:48 · 1764 阅读 · 0 评论 -
01 NumPy基础
目录 1. NumPy ndarray:多维数组对象 1.1 生成ndarray 1.2 ndarray的数据类型 1.3NumPy数组算术 1.4基础索引与切片 1.4.1 数组的切片索引 1.5 布尔索引 1.6 神奇索引 1.7数组转置和换轴 2. 通用函数:快速的逐元素数组函数 3. 使用数组进行面向数组编程 3.1 将条件逻辑作为数组操作 3.2 数学和统计方法 3.3 布尔值数组的方法 3.4 排序 3.5唯一值与其他集合逻辑 4. 使用进行文件输入和输...原创 2022-03-22 20:01:04 · 1659 阅读 · 0 评论 -
01 Python-函数
函数,生成器,异常,文件原创 2022-03-21 16:39:20 · 1195 阅读 · 0 评论 -
00 Python-元组、列表、字典、集合
元组、列表、字典、集合原创 2022-03-21 10:23:29 · 1116 阅读 · 0 评论