![](https://img-blog.csdnimg.cn/20190918140158853.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
机器学习-算法入门
文章平均质量分 72
算法入门
C--G
这个作者很懒,什么都没留下…
展开
-
18、指数移动平均——EMA
EMA原创 2023-03-09 22:56:01 · 1232 阅读 · 0 评论 -
17、经验贝叶斯估计
经验贝叶斯估计原创 2023-03-08 17:55:13 · 1519 阅读 · 0 评论 -
16、参数估计
参数估计原创 2023-03-08 11:45:54 · 323 阅读 · 0 评论 -
15、条件概率、全概率公式、贝叶斯公式、马尔科夫链
概率原创 2023-02-26 15:47:17 · 2732 阅读 · 0 评论 -
14、KL散度
KL散度原创 2023-02-26 12:19:24 · 897 阅读 · 1 评论 -
13. 集成学习进阶二——lightGBM
lightGBMlightGBM演进过程AdaBoost算法GBDT算法以及优缺点lightGBM入门lightGBM是2017年1⽉,微软在GItHub上开源的⼀个新的梯度提升框架。介绍链接higgs数据集介绍:这是⼀个分类问题,⽤于区分产⽣希格斯玻⾊⼦的信号过程和不产⽣希格斯玻⾊⼦的信号过 程。数据链接lightGBM原理基于Histogram(直⽅图)的决策树算法Lightgbm 的Histogram(直⽅图)做差加速带深度限制的Leaf-wise的叶⼦⽣原创 2022-03-09 23:56:38 · 2104 阅读 · 1 评论 -
12.集成学习进阶一——xgboost
xgboost算法XGBoost(Extreme Gradient Boosting)全名叫极端梯度提升树,XGBoost是集成学习⽅法的王牌,在Kaggle数据挖掘 ⽐赛中,⼤部分获胜者⽤了XGBoost。最优模型的构建⽅法XGBoost的⽬标函数推导⽬标函数确定CART树的介绍树的复杂度定义...原创 2022-03-07 00:28:39 · 1552 阅读 · 0 评论 -
11.EM算法、HMM模型
EM算法入门算法介绍极⼤似然估计EM算法实例描述EM算法流程EM算法实例EM初级版EM进阶版HMM模型入门马尔科夫链⻢尔科夫链即为状态空间中从⼀个状态到另⼀个状态转换的随机过程。例子HMM简介例子例子进阶解决问题二解决问题一解决问题三HMM模型基础定义⻬次⻢尔科夫链假设观测独⽴性假设HMM模型实例HMM观测序列的⽣成HMM模型的三个基本问题前向后向算法评估观察原创 2022-03-04 20:21:07 · 2904 阅读 · 0 评论 -
10.支持向量机 SVM
SVM算法定义超平面最大间隔硬间隔和软间隔硬间隔软间隔分类算法原理定义输入数据线性可分⽀持向量机SVM的计算过程与算法步骤推导⽬标函数⽬标函数的求解朗格朗⽇乘⼦法对偶问题参考资料整体流程确定例子另外一种计算方式SVM的损失函数最好的是0/1损失,但是难度大,常用Hinge损失,Logistic损失要求太高,容易过拟合SVM的核⽅法例子一例子二下⾯这张图位于第⼀、⼆象限内。我们关注红⾊的⻔原创 2022-03-02 22:55:44 · 311 阅读 · 0 评论 -
9.朴素贝叶斯
朴素贝叶斯简介(概率分类)概率基础联合概率、条件概率与相互独立贝叶斯公式介绍案例API商品评论情感分析导入依赖import pandas as pdimport numpy as pyimport jiebaimport matplotlib.pyplot as pltfrom sklearn.feature_extraction.text import CountVectorizerfrom sklearn.naive_bayes import Mul原创 2022-02-15 21:44:51 · 806 阅读 · 0 评论 -
8.聚类算法
简介应用概念聚类算法与分类算法最大的区别聚类算法是⽆监督的学习算法,⽽分类算法属于监督的学习算法。API案例流程分析导入依赖import matplotlib.pyplot as pltfrom sklearn.datasets import make_blobsfrom sklearn.cluster import KMeansfrom sklearn.metrics import calinski_harabasz_score创建数据# X为样本特征,Y为样原创 2022-02-15 20:29:02 · 441 阅读 · 0 评论 -
7.集成学习
什么是集成学习机器学习的两个核心任务集成学习中boosting和BaggingBaggin集成原理实现流程随机森林构造过程面试题包外估计(Out-of-Bag Estimate)定义用途随机森林APIbagging集成优点随机森林案例(以泰坦尼克号乘客生存预测为例)from sklearn.ensemble import RandomForestClassifierfrom sklearn.model_selection import Gr原创 2022-02-14 23:08:52 · 764 阅读 · 0 评论 -
6.决策树算法
介绍熵决策树划分依据一-信息增益案例决策树划分依据二-信息增益率案例一案例二C4.5流程总结为什么C4.5更好决策树划分依据三-基尼值和基尼指数案例CART算法流程CART 剪枝为什么要剪枝常用的剪枝方法预剪枝后剪枝两种剪枝方法对比特征工程-特征提取API字典特征提取例子案例from sklearn.feature_extraction import DictVectoriz原创 2022-02-14 16:15:51 · 381 阅读 · 0 评论 -
5.逻辑回归
什么是逻辑回归应用场景逻辑回归的原理掌握逻辑回归,必须掌握以下两点逻辑回归中,其输入值是什么如何判断逻辑回归的输出输入激活函数衡量损失损失优化API肿瘤预测案例数据介绍代码实现import pandas as pdimport numpy as npfrom sklearn.model_selection import train_test_splitfrom sklearn.preprocessing import StandardScaler原创 2022-02-13 17:33:16 · 339 阅读 · 0 评论 -
4.线性回归
APIfrom sklearn.linear_model import LinearRegression# 获取数据x = [ [80,86], [82,80], [85,78], [90,90], [86,82], [82,90], [78,80], [92,84] ]y = [84.2,80.6,80.1,90,83.2,87.6,79.4,93.4]# 模型训练# 实例化一个估计器estimator = Line原创 2022-02-12 18:08:50 · 1547 阅读 · 1 评论 -
3.knn-数据分割-留出法,交叉验证法和自助法
留出法from sklearn.model_selection import train_test_splitx_train,x_test,y_train,y_test = train_test_split(x,y,random_state=2,test_size=0.25)from sklearn.model_selection import LeaveOneOut# 留一法data = [1,2,3,4]loo = LeaveOneOut()for train,test in lo.原创 2022-02-11 16:21:40 · 1843 阅读 · 0 评论 -
2.Knn案例-facebook位置预测
FaceBook位置预测案例数据介绍数据官网导入依赖import pandas as pdfrom sklearn.model_selection import train_test_split,GridSearchCVfrom sklearn.preprocessing import StandardScalerfrom sklearn.neighbors import KNeighborsClassifier获取数据data = pd.read_csv("./FBlocation原创 2022-02-11 14:38:38 · 836 阅读 · 0 评论 -
1.k-近邻算法(KNN)
概念根据你的“邻居”判断你的类别流程KNN api 初步使用机器学习流程Scikit-learn工具安装pip3 install scikit-learn==0.19.1注:需要Numpy,Scipy等库的支持Python (>= 3.5),NumPy (>= 1.11.0),SciPy (>= 0.17.0),joblib (>= 0.11).检验安装import sklearnScikit-learn包含内容K-近邻算法API测原创 2022-02-08 18:03:15 · 6636 阅读 · 3 评论