![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据分析学习笔记
文章平均质量分 96
作为自己学习数据分析的笔记
同时做现有知识的的拓展
小陈步吃人
生活让你变得窘迫,让你为之穷其一生,但也让你抓住每个机会,好也不好,这就是生活!
展开
-
Python数据探索性分析和预处理
除了上面介绍的三种基于分布的方法,还有使用算法基于距离的异常值判定,比如:使用KNN算法,依次计算每个样本点与它最近的K个样本的平均距离,再利用计算的距离与阈值进行比较,如果大于阈值,则认为是异常点。在搜集数据的某些情况下,有些时候并不一定会收集到数据,因而会造成观测值或变量的数据有缺失,这些缺失的数据就称之为缺失值。总之,处理缺失值是需要研究数据规律与缺失情况来进行处理的,复杂的算法不一定有好的效果,因此,还要具体问题具体分析,尤其是要搞明白字段含义以及缺失意义,这往往容易被忽略。...原创 2022-08-15 14:35:05 · 5572 阅读 · 7 评论 -
数据分析入门导读
导读文章,针对刚开始的读者,讲解什么是python,python的基础介绍一些需要的包以及数据处理的流程原创 2022-08-03 08:45:00 · 337 阅读 · 0 评论