机器学习大数据
Sun sky
这个作者很懒,什么都没留下…
展开
-
机器学习——数据预处理(1)数据清洗
1.1包括删除原始数据集中的无关数据,重复数据,平滑噪声数据,筛除掉与挖掘主题无关的数据,处理缺失值,异常值等。1.1.1缺失值处理1删除记录2数据插补3不处理后期拟合1.1.2异常值处理1删除2视为缺失值3平均值修正4不处理...原创 2020-06-18 12:57:19 · 437 阅读 · 0 评论 -
什么是Timestamp——时间戳?
在看大数据挑战赛时,数据有一项是Timestamp。不知道,故百度后记录一下。百科:时间戳是指格林威治时间1970年01月01日00时00分00秒起至当下的总秒数。通俗的讲, 时间戳是一份能够表示一份数据在一个特定时间点已经存在的完整的可验证的数据。 它的提出主要是为用户提供一份电子证据, 以证明用户的某些数据的产生时间。个人理解:就是一个时间记录,对数据产生的时间进行一个唯一认证,不可更改。...原创 2020-05-31 18:30:07 · 12228 阅读 · 0 评论