![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
面试准备
文章平均质量分 80
nancy5_9
这个作者很懒,什么都没留下…
展开
-
wap准备
1. 最长上升子序列 DP算法,注意最终daan原创 2014-11-05 15:38:03 · 296 阅读 · 0 评论 -
【数据挖掘】课本整理
第二章 数据预处理 a. 数据清理 脏数据 填充缺失值 使用缺省值、平均值、最可能的值【贝叶斯 决策树等】 光滑噪声 封箱【箱均值 箱边界】 回归 聚类 识别离群点 【原则】唯一性原则 连续性原则 空值原则 b. 数据集成 合并多个数据源的数据 解决一致性 模式集成 对象匹配 实体识别问题 冗余:通过相关分析 检测到。根据数据度量的一个属性能在多大程度上蕴含另一个 --皮尔逊积矩系数【Pearson Product coefficient】 大于零 则原创 2015-03-26 16:43:39 · 503 阅读 · 0 评论 -
面试遇到的问题
1.朴素贝叶斯为什么叫朴素? 2.朴素贝叶斯如何聚类? 3.simhash为什么结果能让相似文本hash值差不多 4.二叉树的删除原创 2015-03-27 15:24:46 · 370 阅读 · 0 评论