z3wood_-CSDN博客

原创支持向量机

支持向量机几何间隔与硬间隔最大化支持向量机(Support vector machine, 简称SVM)最初是用于解决二分类问题的。给定训练样本集D={(x1,y1),(x2,y2),…,(xN,yN)},yi∈{−1,+1}D=\left\{\left(\boldsymbol{x}_{1}, y_{1}\right),\left(\boldsymbol{x}_{2}, y_{2}\right), \ldots,\left(\boldsymbol{x}_{N}, y_{N}\right)\right\}

2021-04-26 14:21:32 231

原创指数分布族与广义线性模型

指数分布族与广义线性模型指数分布族定义连续型分布的概率密度函数（离散型分布的分布律）可以写成如下形式的分布均属于指数分布族f(y;θ)=s(y)t(θ)ea(y)b(θ)f(y ; \theta)=s(y) t(\theta) e^{a(y) b(\theta)}f(y;θ)=s(y)t(θ)ea(y)b(θ)也即可以写成如下形式f(y;θ)=exp⁡[a(y)b(θ)+c(θ)+d(y)]f(y ; \theta)=\exp [a(y) b(\theta)+c(\theta)+d(y)]

2021-04-24 23:22:36 420

原创 K近邻法

K近邻法KNN算法流程K近邻法思想非常简单：给定测试样本?基于某种距离度量找出训练集中与其最靠近的k 个训练样本，然后基于这k 个" 邻居"的信息来进行预测. 通常，在分类任务中可使用"投票法" 即选择这k 个样本中出现最多的类别标记作为预测结果;在回归任务中时使用"平均法" ，即将这k 个样本的实值输出标记的平均值作为预测结果;还可基于距离远近进行加权平均或加权投票，距离越近的样本权重越大这里直接给出其算法流程：[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-z3

2021-04-24 00:02:47 184 1

原创聚类分析

聚类分析在"无监督学习" (unsupervised learning) 中，训练样本的标记信息是未知的，目标是通过对无标记训练样本的学习来揭示数据的内在性质及规律，为进一步的数据分析提供基础。此类学习任务中研究最多、应用最广的是"聚类"(clustering)聚类试图将数据集中的样本划分为若干个通常是不相交的子集，每个子集称为一个"簇" (cluster)。通过这样的划分，每个簇可能对应于一些潜在的概念(类别)。需说明的是，这些概念对聚类算法而言事先是未知的，聚类过程仅能自动形成簇结构，簇所对应的概念

2021-04-23 00:23:08 206

原创树相关模型与集成学习

树相关模型与集成学习决策树决策树基本概念决策树是一种基本的分类与回归方法，它可以看作if-then规则的集合，也可以认为是定义在特征空间与类空间上的条件概率分布决策树学习本质上是从训练数据集中归纳出一组分类规则，从所有可能的决策树中选取最优决策树是NP完全问题，所以通常采用启发式方法，近似求解这一最优化问题决策树学习基本算法[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-gf4TXxtj-1619061741452)(imgs/decisiontree.png)]

2021-04-22 11:22:53 124

原创指派问题算法

指派问题指派问题数学模型指派问题的一般形式如下：KaTeX parse error: No such environment: align* at position 8: \begin{̲a̲l̲i̲g̲n̲*̲}̲\min\ &z=\sum_…特别地，当m=nm=nm=n时，简化为如下形式：KaTeX parse error: No such environment: align* at position 8: \begin{̲a̲l̲i̲g̲n̲*̲}̲\min\ &z

2021-04-12 01:42:59 3332 1

原创机器学习入门系列(1) - 快速了解机器学习

机器学习入门系列(1) - 快速了解机器学习绪论引言机器学习正是这样一门学科，它致力于研究如何通过计算的手段，利用经验来玫善系统自身的性能。在计算机系统中，“经验"通常以"数据"形式存在，因此机器学习所研究的主要内容，是关于在计算机上从数据中产生"模型"的算法，即"学习算法” (learning algorithm)。有了学习算法，我们把经验数据提供给它，它就能基于这些数据产生模型，在面对新的情况时模型会给我们提供相应的判断基本术语数据准备相关：数据集（训练集、测试集、验证集）、样本、特征（属性

2021-04-08 01:29:43 130

原创数据结构与算法入门系列(1) - 快速了解数据结构与算法

数据结构与算法入门系列(1) - 快速了解数据结构与算法数据结构分类按物理结构分为顺序存储结构链式存储结构按逻辑结构分为集合结构线性结构：数组、单链表、队列、栈等树形结构图形结构常用数据结构数组在连续的内存空间中，存储一组相同类型的元素访问/索引 O(1)O(1)O(1)搜索元素 O(n)O(n)O(n)插入元素 O(n)O(n)O(n)删除元素 O(n)O(n)O(n)特点：适合频繁访问，不适合频繁插入和删除，读多写少# 1. 创建数组，python中用L

2021-04-04 16:48:19 271

原创 Leetcode刷题系列(1)

1.两数之和https://leetcode-cn.com/problems/two-sum/原题给定一个整数数组 nums 和一个整数目标值 target ，请你在该数组中找出和为目标值的那两个整数，并返回它们的数组下标。你可以假设每种输入只会对应一个答案。但是，数组中同一个元素不能使用两遍。你可以按任意顺序返回答案。示例 1：输入：nums = [2,7,11,15], target = 9输出：[0,1]解释：因为 nums[0] + nums[1] == 9 ，返回

2021-03-30 12:37:52 97

原创 MySQL入门系列(2) - 检索数据

MySQL入门系列(2) - 检索数据基础用法# 检索单列select column_name from table_name# 检索多列select column1_name,column2_name,... from table_name# 检索所有列 * 通配符匹配任意多个字符select * from table_name# 检索不同的值select distinct column_name from table_name## 此时只要(column1_name, col

2021-03-29 12:59:37 115

原创 Git入门系列(1) - 快速了解Git

Git入门系列(1) - 快速了解Git关于版本控制本地版本控制系统：复制整个项目目录的方式来保存不同的版本集中化的版本控制系统：有一个单一的集中管理的服务器，保存所有文件的修订版本。如SVN分布式版本控制系统：客户端并不只提取最新版本的文件快照，而是把代码仓库完整地镜像下来，包括完整的历史记录。如Git基本的 Git 工作流程Git 项目拥有三个阶段：工作区、暂存区以及 Git 仓库在工作区中修改文件。将你想要下次提交的更改选择性地暂存，这样只会将更改的部分添加到暂存区。提交更新

2021-03-28 22:19:48 143

原创 MySQL入门系列(1) - 快速了解MySQL

MySQL入门系列(1) - 快速了解MySQL了解SQL一、数据库的好处1、可以持久化数据到本地2、结构化查询二、数据库的常见概念1、DB：数据库，存储数据的容器2、DBMS：数据库管理系统，又称为数据库软件或数据库产品，用于创建或管理DB3、SQL：结构化查询语言，用于和数据库通信的语言，不是某个数据库软件特有的，而是几乎所有的主流数据库软件通用的语言三、数据库存储数据的特点1、数据存放到表中，然后表再放到库中2、一个库中可以有多张表，每张表具有唯一的表名用来标识自己3、表中有一

2021-03-27 22:33:02 106

z3wood的博客