
机器学习
求个offer救救俺
这个作者很懒,什么都没留下…
展开
-
机器学习(二)
1、xgboost为啥用二阶泰勒展开利用泰勒公式去逼近任何函数,在GBDT一阶导数的基础上引入二阶导更加精确同时在二阶导的基础上可以转化为关于叶子结点权重的一元二次方程,在顺序扫描计算增益损失时更加精准,因为本身二阶导在推导过程中可以更精确的反应梯度是如何变化的,从而更精确的实现loss下降同时因为xgboost的损失函数是基于MSE的,这样有更好的扩展性,任何可以进行二阶泰勒展开的都可以自定义其损失函数,既可分类也可回归。2、过拟合的解决方案重新清洗样本,增加样本数量进行样本集扩充,最简单原创 2020-08-19 11:40:02 · 2435 阅读 · 0 评论 -
sklearn机器学习库学习笔记
1.1广义线性模型普通最小二乘法from sklearn import linear_modelreg = linear_model.LinearRegression()reg.fit([[0,0],[1,1],[2,2]],[0,1,2])reg.coef_和reg.intercept_中会保存权重参数和初始化参数类型岭回归,对系数大小增加惩罚项,最小化带惩罚项的残差平方和>>> from sklearn import linear_model>>原创 2020-05-29 21:17:23 · 358 阅读 · 0 评论 -
数据分析之概率问题
1、有一苹果,两个人抛硬币来决定谁吃这个苹果,先抛到正面者吃。问先抛的人先吃到苹果的概率是多少?设先抛的人吃到的概率为p1,后抛的人吃到苹果的概率为p2,其中p1+p2=1,但是p2只有在p1没有吃到苹果的条件下p2才能吃到,即他们之间的关系是p2=1/2 * p1,因为p2的样本空间少了一半,所以解得p1 = 1/32、一条长度为l的线段,随机在其上选2个点,将线段分为3段,问这3个子段能组成一个三角形的概率是多少?3、一副扑克牌54张,现分成3等份每份18张,问大小王出现在同一份中的概率原创 2020-05-19 22:52:56 · 1547 阅读 · 0 评论 -
NLP概念基础入门
1、说一下隐马尔可夫类型和条件随机场在序列标注中的应用 在隐马尔可夫类型中(HMM)定义了观测序列、状态序列、以及观测概率矩阵和状态转移矩阵。这三个要素也构成了隐马尔可夫类型的三要素,包括他的初始状态,转移矩阵,和观测矩阵。在隐马尔可夫类型中主要有三个问题,首先第1个是概率计算问题已知模型参数和观测序列求在某时刻的输出概率, 第2个是去利用EM算法去预估测模型中的参数, 第3个问题是...原创 2020-04-30 18:07:56 · 293 阅读 · 0 评论 -
机器学习专题
1、KNN之k近邻python版本实现:np.argsort函数返回的是数组值从小到大的索引值One dimensional array:一维数组>>> x = np.array([3, 1, 2])>>> np.argsort(x)array([1, 2, 0])import numpy as npdef c...原创 2020-04-23 12:23:58 · 792 阅读 · 0 评论