数据清洗系列
不温卜火
大数据开发/数据采集/数据清洗/数据分析/数据可视化
关注我!共同学习!!!
展开
-
数据清洗 Chapter08 | 基于模型的缺失值填补
这篇文章讲述的是简单的数据缺失处理方法。希望这篇数据清洗的文章对您有所帮助!如果您有想学习的知识或建议,可以给作者留言~Chapter08 | 简单的数据缺失处理方法...原创 2020-07-14 10:55:57 · 5625 阅读 · 43 评论 -
数据清洗 Chapter07 | 简单的数据缺失处理方法
这篇文章讲述的是简单的数据缺失处理方法。希望这篇数据清洗的文章对您有所帮助!如果您有想学习的知识或建议,可以给作者留言~Chapter07 | 简单的数据缺失处理方法一、删除法一、删除法把数据看作是一个NxD的二维矩阵,N代表数据记录的数量,D代表属性的数量如果缺失值数量较少,样本数据足够大,删除缺失数据是最方便的处理方...原创 2020-07-13 10:09:55 · 5465 阅读 · 48 评论 -
数据清洗 Chapter06 | 数据缺失概述
这篇文章讲述的是数据分组与数据不平衡。希望这篇数据清洗的文章对您有所帮助!如果您有想学习的知识或建议,可以给作者留言~Chapter06 | 数据缺失概述1、数据缺失的原因2、缺失值表示1、数据缺失的原因数据采集过程可能会造成数据缺失数据通过网络等渠道进行传输时可能出现数据丢失或出错,造成数据丢失在数据整合过程中也可能引...原创 2020-07-12 10:09:46 · 4659 阅读 · 36 评论 -
数据清洗 Chapter05 | 数据分组与数据不平衡
> 大家好,我是不温卜火,是一名计算机学院大数据专业大二的学生,昵称来源于成语—`不温不火`,本意是`希望自己性情温和`。作为一名互联网行业的小白,博主写博客一方面是为了记录自己的学习过程,另一方面是总结自己所犯的错误希望能够帮助到很多和自己一样处于起步阶段的萌新。但由于水平有限,博客中难免会有一些错误出现,有纰漏之处恳请各位大佬不吝赐教!暂时只有csdn这一个平台,博客主页:[https://buwenbuhuo.blog.csdn.ne一、数据分组数据分组时数据分析...原创 2020-07-11 09:44:16 · 4823 阅读 · 42 评论 -
数据清洗 Chapter04 | 数据整合
这篇文章讲述的是以数据可视化的方式对数据集进行初步探索包括数据的分布方式、正态检验等。希望这篇数据清洗的文章对您有所帮助!如果您有想学习的知识或建议,可以给作者留言~Chapter04 | 数据整合一、数据库风格的DataFrame合并二、索引上的合并三、轴向连接12一、数据库风格的DataFrame合并使用Pandas库中...原创 2020-04-22 10:47:11 · 5018 阅读 · 35 评论 -
数据清洗 Chapter03 | Seaborn常用图形
这篇文章讲述的是以数据可视化的方式对数据集进行初步探索包括数据的分布方式、正态检验等。希望这篇数据清洗的文章对您有所帮助!如果您有想学习的知识或建议,可以给作者留言~Chapter03 | Seaborn常用图形1、散点图2、盒图(箱线图)3、直方图4、柱状图5、核密度图6、小提琴图7、点对图8、回归图Seaborn是一个画图...原创 2020-04-19 09:47:22 · 4860 阅读 · 37 评论 -
数据清洗 Chapter02 | Matplotlib常用图形
这篇文章讲述的是以数据可视化的方式对数据集进行初步探索包括数据的分布方式、正态检验等。希望这篇数据清洗的文章对您有所帮助!如果您有想学习的知识或建议,可以给作者留言~Chapter02 | Matplotlib常用图形一、可视化探索二、Matplotlib1、Matplotlib简介2、折线图3、散点图4、条形图5、drawstyl...原创 2020-04-18 09:44:15 · 3827 阅读 · 35 评论 -
数据清洗 Chapter01 | 数据清洗概况
不登高山,不知天之高也;不临深溪,不知地之厚也。 ——荀子这篇文章讲述的是数据存储方式和数据类型等基本概念、数据清洗的必要性和质量评价的关键点。希望这篇数据清洗的文章对您有所帮助!如果您有想学习的知识或建议,可以给作者留言~Chapter01 | 数据清洗概况一、什么是数据1、数据的类型2、表格数据3、属性类别二、数据清洗1、什么是数据清洗2、为什么要进行数据清洗3、数据存在的问题三、数据...原创 2020-04-17 09:33:43 · 5591 阅读 · 33 评论