- 博客(4)
- 资源 (3)
- 收藏
- 关注
原创 logistic regression 逻辑回归
逻辑回归一、优缺点及适用数据类型优点:计算代价不高,易于理解和实现缺点:容易欠拟合,分类精度可能不够适用数据类型:数值型和标称型数据二、基本算法 1.Logistic回归目的是寻找一个非线性函数Sigmoid的最佳拟合参数2.用Sigmoid函数作为预测函数:H(z)=1/(1+exp(-z))z=w0x0+w1x1+w2x2+…+wnx
2017-11-26 13:18:51 496
原创 决策树算法简介
决策树(decision tree)一、背景知识符号xi的信息量:L(xi) = - log2p(xi)熵:H = -∑p(xi)log2p(xi)信息增益:特征A对训练数据集D的信息增益g(D,A)= H(D) - H(D|A)其中,定义集合D的经验熵H(D)与特征A给定条件下D的经验条件熵H(D|A)之差二、优缺点及适用数据类型
2017-11-26 12:53:42 550
原创 kNN(K-Nearest Neighbor)算法简介
kNN(K-Nearest Neighbor)算法——监督学习中的一种常见分类算法一、kNN(K-Nearest Neighbor)算法优缺点及适用数据范围 优点:精度高、对异常值不敏感、无数据输入假定 缺点:计算复杂度高、空间复杂度高 适用数据范围:数值型和标称型二、基本算法 1.将新数据的每个特征和样本集中的数据对应特征进
2017-11-20 13:50:28 495
原创 机器学习简介
一、什么是机器学习?是一门研究计算机模拟人类学习行为的学科不需要外部的明显指示,计算机自己通过数据进行建模和学习来进行建模和预测简单的说,就是利用计算机把无序的数据转换为有用的信息的一门学科二、什么是深度学习?是基于机器学习延伸出来的一个新的领域以人的大脑结构为启发的神经网络算法为起源加之模型结构深度的增加发展并伴随大数据和计算能力的提高而产生的一系
2017-11-19 09:36:10 340
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人