- 博客(3)
- 资源 (1)
- 收藏
- 关注
原创 数据挖掘--模型选择
名称 假设 /关键 优缺点 模型 策略 算法 感知机 拉格朗日对偶 1.初值不同结果不同 2.无法处理非线性 3.对偶形式将内积存储(Gram矩阵),加速计算 误分类点总数最小 梯度下降 KNN 1.k值选择(交叉验证法) 2.距离度量 3.分类决策规则 1.对异常点不敏感 2.不具有显示学习过程(可解释行差) 3.适用于...
2018-04-23 10:04:26
3342
原创 特征工程
特征工程:利用数据领域的相关知识来创建能够使机器学习算法达到最佳性能的特征的过程。特征构建:是原始数据中人工的构建新的特征。特征提取:自动地构建新的特征,将原始特征转换为一组具有明显物理意义或者统计意义或核的特征。特征选择:从特征集合中挑选一组最具统计意义的特征子集,从而达到降维的效果· 依据先验经验人工挑选。如题目描述中的天气预测问题,可以预先确定湿度、温度、是否有云、风向、风速、近几日天气状...
2018-04-02 17:39:10
413
原创 数据挖掘流程
1.数据挖掘流程2.数据集选取与构造根据任务的目的,选择数据集(公开现有),或者从实际中构造自己需要的数据,如通信数据一般采用抓包解析等采集方式,此外还有大量的社交、图像、音视频等。3.数据预处理: 提高数据质量(准确性、完整性和一致性),包括数据清理、数据集成、数据规约和数据变换方法。 (1)数据清理忽略元祖、人工填写缺失值、使用属性的中心度量填充、给定同一类所有样本的属性均值或中位数填充、最可...
2018-03-30 10:46:23
450
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人