- 博客(3)
- 收藏
- 关注
原创 机器学习——决策树
决策树(Decision Tree)ID3算法概述决策树是一个预测模型;他代表的是对象属性与对象值之间的一种映射关系。树中每个节点表示某个对象,而每个分叉路径则代表的某个可能的属性值,而每个叶结点则对应从根节点到该叶节点所经历的路径所表示的对象的值。决策树仅有单一输出,若欲有复数输出,可以建立独立的决策树以处理不同输出。数据挖掘中决策树是一种经常要用到的技术,可以用于分析数据,同样也可以用来作预测。
2017-12-28 11:33:52 489
原创 机器学习——K近邻算法
K-近邻算法(K Nearest Neighbor, KNN)概述KNN采用测量不同特征值之间的距离方法来进行分类。 KNN算法的核心思想是如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。 优点 :精度高、对异常值不敏感、无数据输入假定 缺点 :计算复杂度高、空间复杂度高 适用数据范围: 数值型和标称型算法流
2017-12-22 11:00:53 519
原创 统计学学习笔记——(10)t检验
t分布当我们不知道总体标准偏差时,用t检验是最好的方式,用样本标准偏差来取代。t统计量(t-statistic):计算t统计量与计算z统计量非常相似,可以用以下公式计算: t=x¯−μσn√t=\frac{\bar{x}-\mu}{\frac{\sigma}{\sqrt{n}}}我们同样必须计算样本的自由度(df): df=n−1df=n-1与z统计量一样,我们可以使用来获取低于特定值或在特定值
2017-12-01 11:07:27 7451
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人