《利用python进行数据分析》学习
文章平均质量分 83
基于《利用python进行数据分析》与Github:https://github.com/yingl/pydata-book上进行学习,对疑点难点做笔记
哎呦-_-不错
读书太少而想太多
展开
-
利用python进行数据分析—9.数据规整:连接、联合与重塑
文章目录引言9.1分层索引9.1.1重排序与层级排序8.1.2按层级进行汇总统计8.1.3使用DataFrame的列进行索引9.2联合与合并数据集9.2.1 数据库风格的DataFrame连接引言 在很多应用中,数据可能分布在多个文件或数据库中,抑或以某种不易分析的格式进行排列。9.1分层索引 分层索引即允许在一个轴上拥有两个或两个以上索引的层级。分层索引提供了一种在更低维度的形式中处理更高维度数据的方式。 Series对象的分层索引 使用unstack方法将Series数据在Dat原创 2021-03-19 17:02:34 · 396 阅读 · 0 评论 -
利用python进行数据分析—8.数据清洗与准备
文章目录引言8.1处理缺失值8.1过滤缺失值8.1.2补全缺失值8.2数据转换8.2.1删除重复值7.2.2使用函数或者映射进行数据转换8.2.3替代值8.2.4重命名轴索引8.2.5 离散化与分箱8.2.6检测和过滤异常值8.2.7随机排序与随机抽样8.2.8计算指标/哑变量8.3字符串操作8.3.1python内建字符串对象方法8.3.2正则表达式8.3.3 pandas中的向量化字符串函数引言 在进行数据分析与建模的过程中,大量的时间都花在数据的准备上:加载、清洗、转换与重新排列。8.1处理缺原创 2021-03-18 17:24:46 · 1259 阅读 · 0 评论 -
利用python进行数据分析—七、绘图与可视化—matplotlib与seaborn
文章目录引言7.1matplotlib绘图7.1.1 图片与子图7.1.1调整子图周围的间距7.1.2 颜色、标记与线类型7.1.3刻度、标签、图例7.1.3.1设置标题、轴标签、刻度和刻度标签7.1.3.2添加图例7.1.4注释与子图加工7.1.5将图片保存到文件中7.1.6matplotlib设置7.2 使用pandas与seaborn绘图7.2.1折线图7.2.2柱状图(垂直或水平)7.2.3直方图和密度图7.2.4散点图与点图7.2.5分面网格和分类数据引言 matplotlib是一个用于生成原创 2021-03-17 20:35:03 · 2984 阅读 · 5 评论 -
利用python进行数据分析—六、文本格式数据读写函数以及pd.read_csv和pd.read_table中的常用参数
文章目录6.1文本格式数据的读写6.1文本格式数据的读写 将表格型数据读取为DataFrame对象时pandas的重要特性。以下列出Pandas函数原创 2021-03-17 13:06:09 · 2734 阅读 · 0 评论 -
利用python进行数据分析—五、pandas入门
文章目录引言5.1pandas数据结构介绍5.1.1Series5.1.2DataFrame5.1.3索引对象5.2基本功能5.2.1重建索引5.2.2删除指定轴上的项5.2.3索引、选择、过滤5.2.3.1使用loc和iloc选择数据5.2.4整数索引5.2.5算术与数据对齐5.2.5.1使用填充值的算术方法5.2.5.2DataFrame与Series间的广播机制5.2.6函数的应用与映射5.2.7排序5.2.8排名5.2.9含有重复标签的轴索引5.3描述性统计5.3.1相关性与协方差5.3.2唯一值、原创 2021-03-14 20:25:23 · 2366 阅读 · 0 评论 -
利用python进行数据分析—四、Numpy基础:数组与向量化计算
文章目录引言4.1 ndarray:多维数组对象4.1.1生成ndarray4.1.2 ndarray的数据类型4.1.3 Numpy数组算术4.1.4基础索引与切片4.1.5布尔索引4.1.6神奇索引4.1.7数组转置与换轴4.2通用函数:快速的逐元素数组函数4.3使用数组进行面向数组编程4.3.1将条件逻辑作为数组操作4.3.2基础数组统计方法4.3.3布尔值数组的方法4.3.4排序4.3.5唯一值与其他集合逻辑4.4使用数组进行文件输入和输出4.5线性代数4.6伪随机数的生成4.8示例:随机漫步引言原创 2021-03-14 14:20:47 · 391 阅读 · 0 评论