机器学习
长野飘荡
花开花落,人走茶凉
展开
-
机器学习-分类-KNN算法
KNN概述测量不同特征值之间的距离来进行分类优点: 精度高、对异常值不敏感、无数据输入设定缺点: 计算复杂度高、空间复杂度高 1.样本集中的每个数据都有分类标签2.输入一个新数据3.分别计算新数据和样本集中所有的数据之间的距离4.取前K个距离最近的样本的标签作为新数据的标签有如下二维平面,其中红点代表A类,绿点代表B类,现在有一个蓝点,那么,这个蓝点是属于A类还是属于B类?...原创 2019-08-13 17:03:45 · 333 阅读 · 0 评论 -
机器学习-分类-朴素贝叶斯算法
朴素贝叶斯(Naive Bayes)是一种基于概率统计的分类方法,在文本处理领域有着广泛的应用“朴素” — 条件独立假设,即事件之间没有关联关系何解?比如,投掷一个骰子两次,第1次和第2次出现的数字是独立的、不相关的,那么这两个事件则是条件独立贝叶斯定理:P(A∣B)=P(A)P(B∣A)P(B)P(A|B)=\frac{P(A)P(B|A)}{P(B)}P(A∣B)=P(B)P(A)...原创 2019-08-11 21:54:24 · 276 阅读 · 0 评论 -
机器学习-分类-逻辑回归算法
逻辑回归概述接受含多个特征值输入样本,输出预测分类优点:计算代价不高,易于理解和实现缺点:容易欠拟合,分类精度可能不高需要用到 Sigmoid 函数来对输出做二元分类,公式如下:σ(x)=11+e−x\sigma(x) = \frac{1}{1 + e^{-x}}σ(x)=1+e−x1 假设有 mmm 个样本,每个样本有 nnn 个特征,这些样本分别属于两类,记为 0 和 1...原创 2019-08-22 18:24:05 · 222 阅读 · 0 评论 -
机器学习-分类-支持向量机
SVM概述基于最大间隔来对数据进行分类优点: 泛化错误率低,计算开销不大,结果易解释。缺点: 对参数调节和核函数的选择敏感下图中蓝色直线为分隔超平面,用 WTx+b=0W^Tx+b=0WTx+b=0 来表示,其中 WTW^TWT 和 bbb 要求解的,在支持向量机的求解中,需要找到离分隔面最近的那些点,这些点叫做支持向量,然后确保它们离分隔面的距离尽量的远,支持向量到分隔面的距离称为mar...原创 2019-09-02 18:59:56 · 210 阅读 · 0 评论