算法
机器学习
数据挖掘
关于机器学习的要素:
1.特征工程(特征的提取,转换,选择)
提取:转换:方便计算,
选择:
2.有监督学习(分类,回归)
通过已经有的数据获得未知的
3.无监督学习(聚类)
画圈圈:在空间上的分布
注重数据之间的相似性,空间相似度的你拟和
数据挖掘:
1.数据预处理(数据清洗,特征构造)
2.分类(决策树(if else),最近邻(同流合污(?),svm(线性回归,几何划分),贝叶斯:(超几何分布)概率模型)
3.聚类(基于距离,基于密度(蚂蚁),基于图,基于概率(根据注意))
4.关联规则/Apriori(啤酒尿布,错字推荐)
5.离群点检测(安全维护常用,不正常访问)
书籍:信息检索导论,机器学习