自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 机器学习评估方法

在评估有监督学习的回归问题和分类问题时,所需的指标不同分类问题回归问题混淆矩阵均方误差MSE正确率决定系数精确率MAE召回率F值AUC与ROC。

2022-12-28 00:07:31 746 1

原创 主成分分析——PCA

在实际问题研究中,多变量问题是经常会遇到的。变量太多,无疑会增加分析问题的难度与复杂性,而且在许多实际问题中,多个变量之间是具有一定的相关关系的。因此,人们会很自然地想到,能否在相关分析的基础上,用较少的新变量代替原来较多的旧变量,而且使这些较少的新变量尽可能多地保留原来变量所反映的信息?事实上,这种想法是可以实现的,主成分分析方法就是综合处理这种问题的一种强有力的工具。主成分分析是把原来多个变量划为少数几个综合指标的一种统计分析方法。从数学角度来看,这是一种降维处理技术。一、PCA。

2022-12-27 17:59:49 3222

原创 聚类模型——k-means

物以类聚,人以群分”,所谓的聚类,就是将样本划分为由类似的对象组成的多个类的过程。聚类后,我们可以更加准确的在每个类中单独使用统计模型进行估计、分析或预测;也可以探究不同类之间的相关性和主要差异。

2022-12-26 23:24:10 3349

原创 KNN——K近邻

KNN最邻近分类算法的实现原理:为了判断未知样本的类别,以所有已知类别的样本作为参照,

2022-12-26 19:42:38 693

原创 感知机和BP神经网络

生物上的神经元就是接收四面八方的刺激(输入),然后做出反应(输出),给它一点刺激就灿烂。仿生的ANN一样,整进去一些特征出来一个预测值或者类别。。。

2022-12-24 23:26:51 496

原创 决策树与随机森林

决策树(decision tree):是一种基本的分类与回归方法。基本原理是通过对一系列问题进行if/else的推导,最终实现相关决策。通过连续的逻辑判断得出最后的结论,其关键在于如何建立这样一棵“树”。随机森林(Random Forest,简称 RF ),是以决策树为基学习器的 Bagging 集成算法,它通过自助法(bootstrap)重采样技术,从原始训练样本集N中有放回地重复随机抽取k个样本生成新的训练样本集合,是Bagging 集成算法中性能最强的。

2022-12-21 21:54:54 2248 2

原创 分类模型(2)——朴素贝叶斯

朴素贝叶斯(Naive Bayes)是经典的机器学习算法之一,是基于概率论的分类算法。在机器学习分类算法中,朴素贝叶斯和其他绝大多数的分类算法都不同。比如决策树,KNN,逻辑回归,支持向量机等,他们都是判别方法,也就是直接学习出特征输出Y和特征X之间的关系,要么是决策函数,要么是条件分布。但是朴素贝叶斯却是生成方法。

2022-12-19 23:54:21 433

原创 分类模型(1)——逻辑回归和SVM

1)线性属性非线性:特征转换(多项式回归)全局性非线性:线性分类 激活函数(逻辑回归)系数非线性:神经网络 ,感知机2)全局性线性样条回归:决策树3)数据未加工PCA,流形硬分类1)线性判别分析:fisher2) 感知机软分类生成式:Gaussion Discriminal Analysis判别式:Logistic Regression逻辑回归利用上一章的多元线性回归模型进行回归。写成向量乘积形式:根据上一章讨论的内生性问题:只能取0或者1(回归系数估计出来不一致且有偏)显然。

2022-12-18 23:44:22 2656 1

原创 多元回归分析

回归分析是数据分析中最基础也是最重要的分析工具。通过研究自变量X和因变量Y的相关关系,尝试去解释Y的形成机制,进而达到通过X去预测Y的目的。常见的回归分析有:线性回归,0-1回归,定序回归,计数回归和生存回归。其划分的依据是因变量Y的类型。一、回归的思想回归分析:研究X和Y之间的相关性。相关性:不解释Y:因变量,类型:1)0-1变量:1是好瓜,0是坏瓜。2)定序变量:Y为a,b,c,d或者为1,2,3,4....表示不同的水平3)计数变量:次数,非负整数(完成作业的次数)

2022-12-12 12:58:29 7869 1

原创 电路基础和电路模拟——复习

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录前言 一、pandas是什么? 二、使用步骤 1.引入库 2.读入数据 总结前言提示:这里可以添加本文要记录的大概内容:例如:随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的基础内容。提示:以下是本篇文章正文内容,下面案例可供参考一、第一章电路基础1,参考方向、关联参考方向的物理意义参考方向:在不知道电流(或电压)的

2022-01-06 21:38:34 7821 4

原创 数据库系统基础

目录一、数据库系统基础 1.1概念1.1.1 基础芝士 1.1.2 SQL语言分类 1.1.3数据独立性(物理独立性,逻辑独立性) 1.2概念模型 1.2.1实体,属性,码(键),实体类型,实体集,联系 1.2.2 ER图和关系模型1.3数据库系统的结构 二、关系数据库 1.基础芝士 1.1概念: ...

2022-01-04 14:26:57 2608 1

原创 期末复习笔记——图

任意两个点都有一条边相连无向完全图的边数:n(n-1)/2有向完全图的边数:n(n-1)

2021-12-13 19:26:51 3252 3

原创 期末复习笔记——树和二叉树

前言一、树1,树型结构树型结构是一种非线性结构,与之前的线性表,栈,队列还有字符串,数组,广义表不同。相比与之前一对一的线性结构,树型结构展示为一对多的非线性结构。2,树的定义,术语,森林太多了,不打了。。。直接二叉树二、二叉树二叉树,这个树比较重要,结构简单,规律性强,普通树也可以通过转化为二叉树进行运算,简化步骤。其中运用二叉树的算法也有很多,像最优二叉..

2021-12-06 15:55:36 997

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除