机器学习
数分虐我千百遍
这个作者很懒,什么都没留下…
展开
-
朴素贝叶斯(上)
朴素贝叶斯算法是有监督的学习算法,解决的是分类问题,如客户是否流失、是否值得投资、信用等级评定等多分类问题。该算法的优点在于简单易懂、学习效率高、在某些领域的分类问题中能够与决策树、神经网络相媲美。但由于该算法以自变量之间的独立(条件特征独立)性和连续变量的正态性假设为前提,就会导致算法精度在某种程度上受影响朴素贝叶斯理论假设现在我们有一个数据集,它由两类数据组成,数据分布如下图所示:我们现在用p1(x,y)表示数据点(x,y)属于类别1(图中红色圆点表示的类别)的概率,用p2(x,y)表示数.原创 2020-11-08 09:58:59 · 309 阅读 · 1 评论 -
决策树
文章目录引入决策树工作原理ID3算法(判断要不要去打篮球)?C4.5 算法Cart算法ID3算法Python实现(基于信贷数据集)基于Sklearn库的决策树模型(Titanic乘客生存预测)基于cart算法的分类树基于cart算法的回归树引入想象一下一个女孩的妈妈给她介绍男朋友的场景:女儿:长的帅不帅?妈妈:挺帅的。女儿:有没有房子?妈妈:在老家有一个。女儿:收入高不高?妈妈:还不错,年薪百万。女儿:做什么工作的?妈妈:IT 男,互联网公司做数据挖掘的。女儿:好,那我见见。在现实生原创 2020-10-27 11:02:00 · 780 阅读 · 0 评论 -
机器学习 树回归
树回归分类回归树(Classification And Regression Trees,CART)是一种构造树的监督学习方法。和ID3决策树作比较:1. ID3每次直接用最佳特征分割数据,即如果当前特征有4个可能值,那么数据将被分成4份,处理的是标称型数据,不能直接处理连续型数据。CART则利用二元切分来处理连续型变量,每次会找一个最佳特征的阈值,把数据集分成两部分,也就是左子树和右子树。...原创 2019-12-21 22:14:55 · 232 阅读 · 0 评论 -
机器学习 回归问题(线性回归 岭回归 逐步回归)
一.线性回归线性回归就是将输入项分别乘以一些常量,在将结果加起来得到输出。 假定输入数据存放在矩阵 x 中,而回归系数存放在向量 w 中。 那么预测结果可以通过Y=X的转置*W得出。所以我们求解线性回归模型的核心就在于求解w,如何求呢?首先,我们一定是希望预测出来的值和实际值之间的误差越小越好,所以我们评判w好坏,就可以采用实际值与真实值之差表示,但是这个差有正有负,为了避免正负相互抵消的情况,...原创 2019-12-21 17:39:27 · 1227 阅读 · 0 评论 -
机器学习 AdaBoost算法
#!/usr/bin/env python# encoding: utf-8from __future__ import print_functionfrom numpy import *import matplotlib.pyplot as pltdef loadSimData(): ''' 加载数据集 :return: dataM...原创 2019-12-14 11:36:06 · 351 阅读 · 0 评论 -
机器学习task3 朴素贝尔斯
朴素贝尔斯kNN 和 kD-Tree 都只能明确地判断一个数据是否属于一个类,这里给出的是 guess, 也就是说结果可能会像这样: “ xx 最有可能在 yy 分组中,可能性为 zz%”,但是之前计算可能性我们是直接按照 targetNum / totalNum,太过粗暴Bayesian 决策: 选择可能性最高的决策Conditional probablity:naive Bayes 的...原创 2019-11-27 19:20:05 · 156 阅读 · 0 评论 -
机器学习 logistic算法
线性分类器给定一些数据集合,他们分别属于两个不同的类别。例如对于广告数据来说,是典型的二分类问题,一般将被点击的数据称为正样本,没被点击的数据称为负样本。现在我们要找到一个线性分类器,将这些数据分为两类(当然实际情况中,广告数据特别复杂,不可能用一个线性分类器区分)。用X表示样本数据,Y表示样本类别(例如1与-1,或者1与0)。我们线性分类器的目的,就是找到一个超平面(Hyperplan)将两类...原创 2019-11-27 19:19:44 · 561 阅读 · 0 评论