机器学习入门实战
小白入门机器学习
方圆猿
程序人生
展开
-
机器学习笔记11-线性回归(上)
蛮力法-暴力求解转载 2020-03-22 21:26:16 · 223 阅读 · 0 评论 -
机器学习笔记10-Adaboost
一、基础知识1 集成学习方法通过组合多个弱基分类器来实现强分类器目的,从而提高分类性能。集成学习是一类算法,而不是指一个算法。集成学习策略有非常多种,包括数据层面、模型层面和算法层面三个方面集成。常用的两种集成学习方法是:bagging袋装法,典型代表随机森林(random forests)...原创 2020-03-19 13:40:18 · 162 阅读 · 0 评论 -
机器学习笔记9-Logistic回归实战
一、改进的随机梯度上升算法对于上一节的梯度上升算法:def gradAscent(dataMatIn,classLabels): # 转换成numpy的mat dataMatrix = np.mat(dataMatIn) # 转换成numpy的mat并进行转置 labelMat = np.mat(classLabels).transpose() # 返回...原创 2020-03-16 21:25:09 · 271 阅读 · 0 评论 -
机器学习笔记8-Logistic回归基础
一、基础知识1 回归的含义回归即为最佳拟合,用一条直线对这些点进行拟合的过程,逻辑回归过程即为寻找最佳拟合参数的过程,使用的是最优化理论。2 最优化理论中常用的优化算法梯度下降法和梯度上升法随机梯度下降法批量梯度下降法小批量随机梯度下降法牛顿法和拟牛顿法共轭梯度法拉格朗日乘数法启发式优化算法-智能算法人工神经网络,模拟退火算法,禁忌搜索算法,粒子群算法,蚁群算法,鱼群算法...原创 2020-03-16 12:24:01 · 193 阅读 · 0 评论 -
机器学习笔记7-朴素贝叶斯实战
11111原创 2020-03-15 08:43:33 · 82 阅读 · 0 评论 -
机器学习笔记6-朴素贝叶斯基础
一、朴素贝叶斯理论1、贝叶斯决策理论贝叶斯决策理论核心思想:如果p1(x,y) > p2(x,y),那么类别为1如果p1(x,y) < p2(x,y),那么类别为2哪个概率高则选择哪一个类别。其中,p1(x,y)表示数据点(x,y)属于类别1的概率。2、贝叶斯准则-条件概率(conditional probability)计算P(A∣B)=P(A∩B)P(B)P(A|...原创 2020-03-09 20:39:12 · 156 阅读 · 0 评论 -
机器学习笔记5-决策树(下)
一、前言 前一节讲述了机器学习决策树的原理,以及如何选择最优特征作为分类特征。本节主要内容:决策树构建决策树可视化(白盒模型,神经网络是黑盒模型)使用决策树进行分类预测决策树存储与读取sklearn预测隐形眼镜类型二、决策树构建**决策树生成原理:**得到原始数据集,然后基于最好的属性值划分数据集,由于特征值可能多于两个,因此可能存在大于两个分支的数据集划分。第一次划分之后,...原创 2020-03-07 12:15:32 · 248 阅读 · 0 评论 -
机器学习笔记4-sklearn&决策树(上)
决策树两大核心如何划分数据集;何时停止划分数据集一、决策树构造特征选择,决策树生成,决策树修剪决策树简介决策树由结点(node)和有向边(directed edged)组成。结点有两种类型:内部结点(internal node)和叶结点(lead node)。内部结点表示一个特征或属性,叶结点表示一个类。如下图,长方形和椭圆都是结点,其中,长方形结点属于内部结点,代表判断模块(decis...原创 2020-03-01 20:33:31 · 184 阅读 · 0 评论 -
机器学习笔记3-KNN机器学习实战
一、KNN01 爱情片or动作片?输入四个电影的打斗镜头和接吻镜头个数,区分输入电影属于爱情片还是动作片import numpy as npimport operator #运算符模块def createDataSet(): # 四组二维特征 group = np.array([[3,104],[2,100],[101,10],[99,5]]) # 四组特征的标签...原创 2020-02-25 22:10:46 · 252 阅读 · 0 评论 -
机器学习笔记2-KNN
KNN(K-NearestNeighbor)–k最近邻,NN代表神经网络的意思k最近邻,就是k个最近的邻居的意思,说的是每个样本都可以用它最接近的k个邻居表示核心思想:如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并且具有这个类别样本的特性。算法三要素k值的选取距离度量的方式分类决策规则k值的选择对于k值的选择,没有一个固定的经验,一...原创 2020-02-19 17:27:49 · 461 阅读 · 0 评论 -
机器学习笔记1-算法分类
机器学习算法分类分类(Classification)Y值相当于判断好人还是坏人,结果是离散值,应用场合更多二分类(binary classification):只涉及到两个类别的分类任务正类:二分类中,关注的那个类;反之,为反类多分类:涉及多个类别的分类回归(regression)Y值结果通常是连续值,预测实现更难,预测趋势更常见,应用场合少于分类聚类(clustering)没有...原创 2020-02-12 16:55:21 · 182 阅读 · 0 评论