统计学习小笔记——分类篇

最新推荐文章于 2020-11-18 21:44:30 发布

家中常备歪脑筋

最新推荐文章于 2020-11-18 21:44:30 发布

阅读量169

点赞数

本文链接：https://blog.csdn.net/midailaoqi/article/details/80224694

版权

一、logistics回归

与回归一样都是有指导的学习，给定x需要预测Y的值 or Y的发生概率（也就是Y属于哪一类，接近1属于，，接近0属于，，）。

一般的回归模型只是对Y建模，logistics回归对Y的概率建模，所以希望其在[0,1]。

使用logistics函数，其可以让概率在[0,1]，所以回归模型：p(x)=e**(beta0+beta1*x)/(1+e**(beta0+beta1*x))，经过变换得到对数发生比形式：log(p(x)/1-p(x))=beta0+beta1*x

系数估计方法：极大似然法（思想：寻求一个估计，使得得到的预测概率与真实发生的概率接近）

缺点：常适用只有两类的分类，多类的可寻求他法。

二、kmeans

首先要想好要分几类 K

具体算法：

（1）为每个观测值随机分配1~K的数字，也就是随机分类

（2）重复以下，直到分类停止

a.分别计算K个类的类中心

b.将每个观测分配到距离最近的类中心处

由于最开始分类是随机的，且目标是局部最优not全局最优，所以不同开始状态，得到最终的目标值不同，可多重复实验几次。

缺点：不能有效的处理干扰

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

家中常备歪脑筋

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

统计学习基础笔记与习题答案

09-20

统计学习笔记之基础篇

未知的世界

08-28

315

一、简述只看知识点的绕路，以下是个人学习经历之谈。接触机器学习半年多来，一开始对理论云云一脸蒙圈，于是直接上手看代码。虽然过程还是略头疼，但事实证明，“talk”确实“cheap”，"show code”确实是个简单粗暴却好用的方式。就我个人学习习惯来说，对于一些看不见摸不着的理论没什么耐心，我知道有些论文说得很好，然而对于有的文章就呵呵了，还不如贵坛某些经验之谈有意义。到现在，在彻底算搞...

参与评论您还未登录，请先登录后发表或查看评论

统计学习基础ESL笔记目录

Spicywings的博客

07-10

645

The Elements of Statistical Learning 笔记目录篇在学校课程中学习了 ‘An Introduction to Statistical Learning’（简称ISL），但实际上ISL这本书很多地方只是对算法的简单介绍，许多部分并不详细（硬核），因此买了一本更硬核的书’The Elements of Statistical Learning’（简称ESL），这两本书结构类似，但内容难易程度与侧重点不同，会结合ISL的边读边更新与修改，本文作为目录与导航，以供查看。 ...

统计学习基础（ESL）中文版

热门推荐

龙哥盟

11-25

6万+

ESL 指的是 The Elements of Statistical Learning。因为自己也是统计学专业，所以想研读这本书，同时实现书中的算法及其例子，并尝试解决习题。说明参考文献保留原书的写法，如 “Efron and Tibshirani (1993)” 指的是 “Efron, B. and Tibshirani, R. (1993). An Introduction to th...

统计学基础笔记

m0_48812571的博客

11-18

521

C语言学习笔记——小浪神

10-04

C语言学习笔记——小浪神本笔记是关于C语言的学习笔记，涵盖了C语言的基本概念、历史发展、语言特点、数据类型、变量、常量、算法等方面的知识点。计算机程序的概念计算机程序是指一组能够被计算机识别和执行...

Python学习笔记——大数据之SPARK核心

01-27

【Python学习笔记——大数据之SPARK核心】 Spark作为大数据处理框架的核心在于其Resilient Distributed Datasets（RDD），这是一种弹性分布式数据集。RDD是Spark设计的基石，它将大量数据分布在多台机器上，可以...

Solidworks学习笔记——随形变化.docx

07-13

Solidworks是一款强大的三维计算机辅助设计(CAD)软件，广泛应用于机械工程、汽车制造、航空航天等领域。在Solidworks中，随形变化（Vary Sketch）功能是实现特征阵列时进行尺寸变化的重要工具，它允许用户在阵列特征...

统计学基础（一）----读书笔记

minghegao的博客

02-24

1107

第一章统计与数据 1.数据分析的5个W和一个H：数据分析的第一步，明确你为什么（why，也就是目的）要分析这些数据，数据表中的每一行指代的是谁（who），涉及哪些变量（what，数据表中的列名），至少在明确认识了这三个因素之后，才能进行数据的描述和解释。此外，最好知道when（时间），where（地点）以及how（如何解决的） 2.抽样调查抽样调查的种类： 1）简单随机抽样 ...

统计学复习笔记整理

lxx199603的博客

05-20

1580

上周为了准备期末考试，整理了统计学的主要内容，涉及参数估计、置信区间、假设检验、线性回归等内容。

《统计学习方法》笔记一

TheOneAc1的博客

09-09

982

统计学习对象统计学习对象是数据，从数据出发，提取出特征，抽象出数据模型，发现数据知识，用于对回溯的分析和预测中统计学习方法获取新年数据集合确定所有可能包含模型的假设空间，即学习模型的集合（模型）确定模型选择准则（策略）实现最优求解模型的算法（算法）选择最优模型利用最优模型分析预测新数据监督学习每一个输入实例由一个输入向量表示回归：输入输出变

统计学习方法学习笔记一

秋水顽石

03-16

1万+

第一章统计学习方法概论统计学习的主要特点是统计学习的对象统计学习方法的分类统计学方法的三个要素统计学方法的步骤统计学习的研究监督学习supervised leaning 三要素模型策略算法训练误差与测试误差过拟合训练误差和测试误差与模型复杂度之间的关系模型的选择方法正则化和交叉验证生成模型和判别模型几种模型评估标准第一章统计学习方法概论统计学习的主要特点是

【超强组合】基于淘金优化算法GRO-BP-Adaboost的数据分类预测算法Matlab实现.rar

10-08

1.版本：matlab2014/2019a/2024a 2.附赠案例数据可直接运行matlab程序。 3.代码特点：参数化编程、参数可方便更改、代码编程思路清晰、注释明细。 4.适用对象：计算机，电子信息工程、数学等专业的大学生课程设计、期末大作业和毕业设计。替换数据可以直接使用，注释清楚，适合新手

VMware Workstation Pro 和 VMware Fusion 安装与配置指南

10-08

内容概要：本文档详细指导了如何在不同的主机环境下，通过 VMWare 的两款产品——Workstation Pro 和 Fusion 进行新虚拟机的构建流程以及具体的操作要点说明。适用人群：希望在单一机器上部署多操作系统的工作环境或学习测试场景的技术人员和学生。使用场景及目标：旨在帮助初学者搭建属于自己的虚拟机实验平台，从而方便进行软件测试或者研究操作系统相关的新特性等任务，同时也有利于团队间的协作和资源调配。注意事项：文中涉及的具体操作如下载源文件、配置网络参数时要注意版权合法性问题和技术安全防范。此外还需依据各自电脑的软硬件条件适当增减虚拟机的资源设定。

科研经费管理系统 SSM毕业设计源码+数据库+论文（JAVA+SpringBoot+Vue.JS）.zip

10-08

科研经费管理系统 SSM毕业设计源码+数据库+论文（JAVA+SpringBoot+Vue.JS）启动教程：https://www.bilibili.com/video/BV1GK1iYyE2B

使用Python Matplotlib进行图形输出与保存详解（包含详细的完整的程序和数据）

10-08

内容概要：本文详细介绍了使用 Python 的 Matplotlib 库来输出和保存图形的方法。不仅涉及了基本流程，如生成图表并将之导出成PNG、PDF和SVG等不同格式的内容，还包括高级话题如设置透明度、分辨率以及制作包含图形元素的HTML页面等。文章通过一个具体的示例代码讲解了各个环节的关键细节和技术要点。适用人群：对数据可视化有兴趣的初学者及具有一定基础想要深入学习 Matplotlib 使用技巧的技术人员。使用场景及目标：适用于需要掌握 Matplotlib 不同输出选项及其特点的应用场合，尤其是当需要生成用于打印或网页展示的高质量、可自定义外观的图形时。

【数字信号分离】基于matlab自然梯度算法盲信号分离（含串音信号变步长）【含Matlab源码 8813期】.zip

10-08

CSDN海神之光上传的代码均可运行，亲测可用，直接替换数据即可，适合小白； 1、代码压缩包内容主函数：main.m；调用函数：其他m文件；无需运行运行结果效果图； 2、代码运行版本 Matlab 2019b或2023b；若运行有误，根据提示修改；若不会，私信博主； 3、运行操作步骤步骤一：将所有文件放到Matlab的当前文件夹中；步骤二：双击打开main.m文件；步骤三：点击运行，等程序运行完得到结果； 4、仿真咨询如需其他服务，可私信博主或扫描博客文章底部QQ名片； 4.1 博客或资源的完整代码提供 4.2 期刊或参考文献复现 4.3 Matlab程序定制 4.4 科研合作功率谱估计：故障诊断分析：雷达通信：雷达LFM、MIMO、成像、定位、干扰、检测、信号分析、脉冲压缩滤波估计：SOC估计目标定位：WSN定位、滤波跟踪、目标定位生物电信号：肌电信号EMG、脑电信号EEG、心电信号ECG 通信系统：DOA估计、编码译码、变分模态分解、管道泄漏、滤波器、数字信号处理+传输+分析+去噪（CEEMDAN）、数字信号调制、误码率、信号估计、DTMF、信号检测识别融合、LEACH协议、信号检测、水声通信

基于多元宇宙优化算法MVO优化CNN-BiGRU-Attention锂电池健康寿命预测算法研究Matlab实现.rar