数据挖掘
文章平均质量分 90
-Heres-
他每做一件小事的时候,都像救命稻草一样抓着。有一天我一看,嚯,好家伙!他抱着的是已经让我仰望的参天大树了。
展开
-
数据预处理(1)——数据清洗
一、介绍 数据清洗主要内容是删除原始数据集中的无关数据、重复数据,平滑噪声数据,刷选掉与挖掘主题无关的数据,处理缺失值、异常值等。二、缺失值处理 缺失值处理的方法分为三类:删除记录、数据插补和不处理。常见的数据插补方法如下图:其中,需要介绍的两个插值法为:拉格朗日插值法和牛顿插值法。2.1 拉格朗日插值法2.2 牛顿插值法3、关于拉格朗日插值法的示例#拉格朗日插值代码import p...原创 2018-04-22 17:12:11 · 3938 阅读 · 0 评论 -
数据预处理2——数据集成
一、介绍 数据挖掘需要的数据往往分布在不同的数据集中,数据集成就是将多个数据集合并放在一个一致的数据存储中的过程。对于DataFrame来说,它的连接有时候是通过索引的。三、代码示例# coding: utf-8# In[2]:from pandas import DataFrame import pandas as pdimport numpy as np###dataf...原创 2018-04-22 17:27:49 · 1111 阅读 · 0 评论