机器学习
文章平均质量分 82
moledyzhang
这个作者很懒,什么都没留下…
展开
-
机器学习算法之线性回归
何为线性回归有监督学习 => 学习样本为 :D=(xi,yi)Ni=1D={(x^i,y^i)}{^N_{i=1}}输出/预测的结果yi为连续值变量需要学习映射ƒ : χ\chi → yy假定输入x和输出y之间有线性相关关系测试/预测阶段对于给定的x,预测其输出y^=f(x)=wTx+b\hat{y}=f( x)=w^Tx+b (可以利用最小二乘法对w和b进行估计)分类根据自变量个数可原创 2018-01-19 22:44:51 · 413 阅读 · 0 评论 -
线性回归与逻辑回归
线性回归和逻辑回归的应用场景?答:线性回归主要用来解决连续值预测的问题,逻辑回归用来解决分类的问题,输出的属于某个类别的概率,工业界经常会用逻辑回归来做排序线性回归线性回归(Linear Regression)是利用称为线性回归方程的最小平方函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析。模型hθ=θTxh_\theta=\theta^Tx 损失函数J(θ)=12m∑i=1m(hθ(x原创 2018-03-16 13:52:21 · 479 阅读 · 0 评论 -
机器学习常见问题整理?
机器学习项目流程?答:理解实际问题,抽象成数学模型(分类、回归、聚类)——>获取数据——>特征预处理与特征选择——>训练模型与调优——>模型诊断(过拟合、欠拟合等)——>模型融合——>上线运行。机器学习算法的分类?答:监督学习、非监督学习、半监督学习、强化学习。特征选择与降维的区别?答:两者达到的效果是一样的,都是试图去减少特征数据集...原创 2018-03-12 19:17:26 · 5376 阅读 · 0 评论 -
XGBoost理解
什么是XGbbostXGBoost是Extreme Gradient Boosting的简称,对应的模型就是一堆CART树,思想是将每棵树的预测值加到一起作为最终的预测值(可谓简单粗暴)。下图就是CART树和一堆CART树的示例,用来判断一个人是否会喜欢计算机游戏: 图二说明了如何用一堆CART树做预测,就是简单将各个树的预测分数进行相加。 注:gboost为什么使用CART树而不是用普通的决原创 2018-03-12 22:05:59 · 2286 阅读 · 0 评论 -
隐马尔科夫模型HMM
应用隐马尔科夫模型(HMM,Hidden Markov Model)可用标注问题,在语音识别、NLP、生物信息、模式识别等领域被实践证明是有效的算法。定义隐马尔科夫模型是关于时序的概率模型,描述由一个隐藏的马尔科夫链随机生成不可观测的状态的序列,再由各状态随机生成一个观测而产生观测序列的模型(参考李航的《统计学习方法》第10章)。 隐马尔科夫模型随机生成的状态随机序列,称为状态序列;...原创 2018-03-13 19:21:01 · 373 阅读 · 0 评论 -
xgboost 中的gain freq, cover
assuming that you're using xgboost to fit boosted treesfor binary classification. The importance matrix is actually a data.tableobject with the first column listing the names of all the features actua原创 2018-04-11 18:03:44 · 3108 阅读 · 1 评论