MachineLearning
poppy_MCT
开开心心搞技术
展开
-
机器学习知识点【1】----阿里机器学习算法一面
一、归一化算法有哪些?目的:加速训练两种常用的归一化方法(1)min-max标准化(Min-Max Normalization)(线性函数归一化)定义:也称为离差标准化,是对原始数据的线性变换,使得结果映射到0-1之间。本质:把数变为【0,1】之间的小数。转换函数:(X-Min)/(Max-Min)如果想要将数据映射到-1,1,则将公式换成:(X-Mean)/(Max-Min)其...原创 2019-03-14 16:03:25 · 553 阅读 · 0 评论 -
统计学习方法第5章【2】----决策树的生成
5.3 决策树的生成5.3.1 ID3算法核心是在决策树各个节点上应用信息增益准则,递归地构建决策树。算法5.2(ID3算法)输入:训练数据集D,特征集A,阈值;输出:决策树T(1)若D中所有实例属于第一类,则T为单结点树,并将类作为该节点的标记,返回T(2)若,则T为单结点树,并将D中实例最大的类作为该结点的类标记,返回T(3)否则,按算法5.1计算A中各特征对D...原创 2019-04-16 21:54:59 · 297 阅读 · 0 评论 -
统计学习方法第5章【3】----决策树之CART算法
5.5 CART算法分类与回归树(classification and regression,CART)模型是应用广泛的决策树学习算法。CART同样由特征选择、树的生成、剪枝组成,即可以用于分类,也可以用于回归。CART是在给定输入随机变量X条件下输出随机变量Y的条件概率分布的学习方法。CART假设决策树是二叉树,内部结点特征的取值为“是”和“否”,左分支是取值为“是”分支,右分支为取值为...原创 2019-05-06 21:55:19 · 900 阅读 · 0 评论 -
统计学习方法第5章【1】----决策树
决策树是用于分类与回归的方法。我们主要讨论分类。决策树成树形结构,表示基于特征对实例进行分类的过程。可以认为是定义在特征空间与类空间上的条件概率分布。优点是模型具有可读性,分类速度快。学习时,利用训练数据,根据损失函数最小化的原则建立决策树模型。预测时,对新的数据,利用决策树模型进行分类。决策树学习通常包括3个步骤:特征选择、决策树的生成和决策树的修剪。(决策树学习常用算法ID3、C4.5、CAR...原创 2019-04-15 17:02:23 · 434 阅读 · 0 评论 -
统计学习方法第四章----朴素贝叶斯法
朴素贝叶斯法是基于贝叶斯定理和特征条件独立假设的分类方法。4.1 朴素贝叶斯法的学习与分类4.1.1 基本方法输入空间n维向量的集合,输出空间为标记集合.P(X,Y)是X和Y的联合概率分布。训练数据集由P(X,Y)独立同分布产生。朴素贝叶斯法通过训练数据集学习联合概率分布P(X,Y)。具体的,学习以下先验概率分布及条件概率分布。先验概率分布: ...原创 2019-04-04 16:43:12 · 429 阅读 · 1 评论 -
机器学习知识点【3】----腾讯暑期实习数据分析笔试
1.以下几种优化方法中,那种对超参数最不敏感?(C)A.SGD(stochastic gradient descent) B.BGD(batch gradient descent) C.Adadelta D.Momentum2.克莱姆法则是线性代数中一个关于求解线性方程组的定理。对一亿个具有N个方程,N个未知数的方程组,下列说法正确的是:(A、B)A.当方程组的系数...原创 2019-04-08 10:16:05 · 838 阅读 · 0 评论 -
模型评价----AUC方法
AUC是什么混淆矩阵(Confusion matrix)混淆矩阵是理解大多数评价指标的基础,毫无疑问也是理解AUC的基础。这里用一个经典图来解释混淆矩阵是什么。混淆矩阵包含四部分的信息:1.True negative(TN),表示将负类预测为负类数2.False positive(FP),表示将符类预测为正类数3.False negative(FN),表示将正类预测为负...原创 2019-04-01 15:04:07 · 637 阅读 · 0 评论 -
百度笔试问答题
问题描述韩梅梅和李雷是百度的实习生,他们刚入职就接受了一项任务,用机器学习的方法来预测某个行业query和广告之间的点击率。该模型将会用于对广告展现时,根据点击率,对展现的广告做重排序。他们两个都采用了LR方法来解决问题,具体的做法是:(1)根据一个月该行业的日志,找到每次搜索时,当时展现的所有广告(一次展现固定出三条广告)。他们把每个广告的每次展现当作样本,当时是否点击为LR的y值:0或...原创 2019-04-01 10:30:20 · 486 阅读 · 0 评论 -
机器学习知识点【2】----旷视现场笔试题
1.计算以下三个二维数据的协方差矩阵[[0,2],[1,1],[2,0]]参考链接:https://blog.csdn.net/ybdesire/article/details/6270328/2.Adaboost和随机森林都属于什么的范畴(多选)(A C)A.集成学习 B.强化学习 C.有监督学习 D.无监督学习3.以下哪些措施可以缓解过拟合(A CE F)...原创 2019-03-26 22:02:26 · 288 阅读 · 1 评论