机器学习
Android_chunhui
人不一定能什么都擅长,有自己的特点就好!
展开
-
ubuntu22 GTX1050TI / 1060安装驱动 cuda
使用nvidia-smi命令查看安装结果。原创 2024-05-19 18:58:29 · 363 阅读 · 0 评论 -
最小错误贝叶斯决策
转载原文地址:http://www.cnblogs.com/justcxtoworld/p/3451571.html 摘要:旁听了清华大学王建勇老师的 数据挖掘:理论与算法 的课,讲的还是挺细的,好记性不如烂笔头,在此记录自己的学习内容,方便以后复习。一:贝叶斯分类器简介1)贝叶斯分类器是一种基于统计的分类器,它根据给定样本属于某一个具体类的概率来对其进行分类。2)贝叶斯分类器的理论基础是贝叶斯理转载 2016-11-05 14:04:24 · 1978 阅读 · 0 评论 -
最小风险贝叶斯决策
转载地址:http://blog.csdn.net/Angel_Yuaner/article/details/47066105 在决策中,除了关心决策的正确与否,有时我们更关心错误的决策将带来的损失。比如在判断细胞是否为癌细胞的决策中,若把正常细胞判定为癌细胞,将会增加患者的负担和不必要的治疗,但若把癌细胞判定为正常细胞,将会导致患者失去宝贵的发现和治疗癌症的机会,甚至会影响患者的生命。这两种类型转载 2016-11-05 14:18:34 · 2097 阅读 · 0 评论 -
最小二乘法与曲线拟合
通过最小二乘法算法实现多项式拟合的公式推导见http://blog.csdn.net/jairuschan/article/details/7517773/对于给定样本空间D[(x1,y1),(x2,y2)...(xn,yn)],求解权值向量W,使得 Xi*W=Yi.根据最小二乘法,W=(X'X)-1X'Y,其中X是每个样本Xi构成的范德蒙矩阵的转置,(X'X)-1是X的伪逆。下面使用Pyth原创 2016-11-07 23:32:10 · 1052 阅读 · 0 评论 -
SVM算法原理以及sklearn实例
今天重新学习了一遍SVM的内容,发现好多以前看不懂的推导公式都能理解了,赶紧记录下来。作者属于菜鸟级别,文中如有错误认识还请大家不吝赐教!SVM(support vector machine,支持向量机),是一种可应用与线性或非线性的一种分类器。以下我们按照SVM的发展顺序以及问题求解依次介绍。1. 线性支持向量机(LSVM)我们先假设样本集线性可分,也就是最简单的情况。由于是线性分类器,所以分原创 2016-12-22 17:06:45 · 3291 阅读 · 0 评论 -
sklearn logistic使用
class sklearn.linear_model.LogisticRegression(penalty='l2', class_weight=None,solver='liblinear',multi_class='ovr')这里只列出了几个经常设置的参数 1. penalty 正则化参数:’l1’,’l2’.默认是’l2’。 在调参时如果我们主要的目的只是为了解决过拟合,原创 2016-12-25 16:45:16 · 1357 阅读 · 0 评论 -
对正则化项L1,L2讲解
使用lasso回归可以进行特征选择和降维。转载 2016-12-21 10:13:20 · 655 阅读 · 0 评论 -
boost算法总结
boosting算法是集成的方式之一,使用前向分部算法(Forward stagewise additive modeling)构建一个加法模型,每次迭代时根据模型与标签值的误差创建一个基分类器叠加到模型上,逐步减少模型的偏差。前向分部是一种贪心算法,下面的Adaboost和GBDT也是基于这个算法进行的。流程如下 第三步L(yi,fm−1(xi)+βb(xi;γ))L(yi,fm−1(xi...原创 2018-06-13 11:18:18 · 3309 阅读 · 0 评论 -
lightbgm理解
直方图方式处理特征。在xgboost中构建叶子节点时,对一个数值特征(xgb不能直接处理类别特征)要先对该特征的所有样本排序,然后寻找一个切分点使二分之后信息增益最大,也就是预排序操作。预排序耗时,在lgbm中使用直方图 对数值特征(不管连续还是离散)进行处理,根据特征范围将其放入一个一个bin里,间接实现了排序操作,寻找最优切分点时只需要在bins之间找就可以了。这样处理既实现了特征离散化...原创 2019-07-24 10:58:05 · 563 阅读 · 0 评论