![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Python数据分析与可视化
喵了个汪q
这个作者很懒,什么都没留下…
展开
-
Python数据分析与可视化(清洗数据)
清洗数据缺失数据本节主要讲解对数据集中缺失数据的处理缺失数据填充缺失数据使用统计值使用模型查找和删除缺失数据缺失数据当我们读入数据时发现某些值缺失!我们可以怎么处理呢?首先,我们应该尽量搞明白为什么缺少数据点。他们是不是随机丢失了?当数据集足够大的时候,我们可以删除随机丢失的数据。如果数据由于某种原因而丢失,那么丢失数据意味着源数据为0?还是意味着某些故障?我们应该对这些非随机缺失值进行处理。例如,如果它们应该为0,则将它们设置为零。其次,我们应该考虑所拥有的数据中有多原创 2020-08-08 11:00:14 · 1912 阅读 · 0 评论 -
Python数据分析与可视化(数据分析)
数据分析数据统计与计算本节讨论使用Pandas来对数据进行处理和分析,主要包括以下内容获取数据的统计信息显示数据类型转换数据类型去除数据的重复值对数据进行分组寻找数据间的关系计算百分比在上一节“数据读取”中,我们用到了Pandas。现在我们将更深入了解Pandas在处理数据方面的应用。首先先复习一下上节课中用Pandas读取CSV文件的代码:import pandas as pd# 创建列名列表names = ['age', 'workclass', 'fnlwgt', '原创 2020-07-30 12:34:02 · 13377 阅读 · 0 评论 -
Python数据分析与可视化(读取数据)
读取数据含有逗号分隔符文件JSON文件源文件含有逗号分隔符文件本节主要讲CSV类型的文件以及如何使用Pandas库来读取CSV文件。CSV文件的简介用Pandas来读取CSV文件CSV文件的简介在机器学习中以逗号作为分隔符的文件很常见(CSV文件),这种类型的文件每一行都有数据,每行的数据元素之间通过通过逗号分隔,用Pandas可以很方便的读取这类文件。用Pandas来读取CSV文件这是详细的说明文档在读取文件之前先了解一下三个参数sep-指定分隔符,如果不指定默认值是’,原创 2020-07-24 21:53:15 · 9726 阅读 · 5 评论 -
Python数据分析与可视化(基础知识)
757原创 2020-07-23 20:07:52 · 5556 阅读 · 1 评论