![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据分析
LanceJerry
Always Be Coding & Delightful
展开
-
python数据分析总结
数据聚合与分组运算在将数据集加载、融合、准备好之后,通常就是计算分组统计或生成透视表。pandas提供一个灵活高效地groupby功能,使得能以一种自然的方式对数据集进行切片、切块、摘要等操作。关系型数据库和SQL能够如此流行的原因之一就是其能够方便地对数据进行连接、过滤、转换和聚合。但pandas同样具有强大的表达能力,可以执行复杂的分组运算:1)使用一个或多个键(函数、数组或者DataF...原创 2019-12-18 22:30:01 · 1499 阅读 · 0 评论 -
利用python进行数据分析
绘图和可视化信息可视化(绘图)是数据分析中最重要的工作之一,他可能是探索过程的一部分。它可以协助找出异常值、必要的数据转接,得出有关模型的idea。同时实现一个可交互的数据可视化也是工作的最终目标。python有许多库可以进行静态或动态的数据可视化,本节主要关注matplotlib。matplotlib是用于创建出版质量图标的桌面绘图包(主要是2D方面)。matplotlib和IPython社...原创 2019-12-07 00:01:54 · 1236 阅读 · 0 评论 -
利用python进行数据分析
利用python进行数据分析(其四)数据规整:聚合、合并和重塑在许多应用中,数据可能分散在许多文件或数据库中,存储的形式将不利用分析,因此可以使用聚合、合并、重塑数据的方法来对数据进行规整。1.层次化索引层次化索引是pandas的一项重要功能,可以在一个轴上拥有多个(两个以上)索引级别,因此能以低维度形式处理高纬度数据。举例来说明:In [9]: data = pd.Series(np....原创 2019-12-03 22:22:42 · 487 阅读 · 0 评论 -
python数据分析总结
利用python进行数据分析(其三)数据清洗和准备在数据分析和建模的过程中,在数据准备上(加载、清理、转换以及重塑)需要相当多的时间。因此,pandas和内置的Python标准库提供了一组高级的、灵活的、快速的工具,可以有效地将数据规整成所想要的格式。1. 处理缺失数据缺失数据在pandas中呈现的方式比较不完美,对于数值数据,pandas使用浮点值NAN(Not a Number)表示缺...原创 2019-10-29 22:28:46 · 4293 阅读 · 1 评论 -
python数据分析总结
利用python进行数据分析(其三)数据加载、存储与文件格式输入输出通常可以划分为几个大类:读取文本文件和其他更高效的磁盘存储格式,加载数据库中的数据,利用Web API的操作网络资源。读写文本格式的数据pandas提供一些用于表格型数据读取为DataFrame对象的函数,其中对其进行总结为以下:将文本数据转换为DataFrame这些函数的选项可以划分为以下几个大类:索引:将一个或...原创 2019-10-21 23:13:24 · 1743 阅读 · 0 评论 -
python数据分析总结
利用python进行数据分析(其二)pandas入门pandas含有使数据清洗和分析工作变得更快更简单的数据结构和操作工具,可同数值计算工具NumPy和SciPy,分析库statsmodels和scikit-learn和数据可视化库matplotlib。其中pandas是专门为处理表格和混杂数据设计,而NumPy更常用于处理统一的数据数组数据。pandas的数据结构1.Series,一种类...原创 2019-10-15 22:49:47 · 741 阅读 · 0 评论 -
python数据分析总结
利用python进行数据分析(其一)NumPy基础NumPy的ndarray:一种多维数组对象创建ndarrayndarray的数据类型NumPy数组的运算基本索引和切片切片索引本文实验环境、工具:anoconda,Jupyter notebook,python3.6NumPy基础NumPy (Numerical Python) 是Python关于数值计算最重要的基础包,可以构建科学计算的库...原创 2019-10-10 23:06:12 · 1199 阅读 · 0 评论