自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

转载 Logistics回归系数解读

Logistic回归虽然名字叫”回归” ,但却是一种分类学习方法。使用场景大概有两个:第一用来预测,第二寻找因变量的影响因素。一、从线性回归到Logistic回归线性回归和Logistic回归都是广义线性模型的特例。假设有一个因变量y和一组自变量x1, x2, x3, … , xn,其中y为连续变量,我们可以拟合一个线性方程:y =β0 +β1x1 +β2x2 +β3x3 +…+βnxn并通过最小二乘法估计各个β系数的值。如果y为二分类变量,只能取值0或1,那么线性回归方程就会遇到困难: 方程右

2021-03-09 05:41:41 9569

原创 周志华西瓜书学习笔记(一)

周志华西瓜书学习笔记第一章 绪论数据处理分为三个阶段:收集,分析,预测。一、基本概念机器学习致力于研究如何通过计算的手段,利用经验来改善系统自身的性能。Mitchell给出的更形式化的定义为:假设用P来评估计算机程序在某任务T上的性能,若一个程序通过利用经验E在T中获得了性能改善,我们就可以说T和P,该程序对E进行了学习。(一)泛化(generalization)学得的模型适用于新样本的能力,称之为泛化能力。具有强泛化能力的模型能够更好地使用于整个样本空间。(二)独立同分布(i.i.d)通

2020-12-24 14:00:30 937 2

原创 R语言实战之描述性统计分析

R语言实战之描述性统计分析下面展示一些 描述性统计分析的R代码语言。vars <- c("mpg","hp","wt")head(mtcars[vars])#创造一个统计的函数列表#通过sapply()计算描述性统计变量(包括偏度和峰度)mystats <- function(x,na.omit = FALSE){ if(na.omit) x <- x[!is.na(x)] m <- mean(x) n <- length(x) s &lt

2020-12-24 11:29:50 6065 1

原创 R语言实战之如何对数据进行缺失值处理

R语言实战之如何对数据进行缺失值处理以下是对于数据中含有部分缺失值的处理方式,代码十分详尽基础:下面展示一些 基础代码。manager <- c(1,2,3,4,5)date <- c("10/24/08","10/28/08","10/1/08","10/12/08","5/1/09")country <- c("US","US","UK","UK","UK")gender <- c("M","F","F","M","F")age <- c(32,45,25,3

2020-11-29 12:51:46 2029

原创 R语言实战之控制流语句(小白也可看懂)

下面展示一些关于R中的控制流语句的具体运用。#if函数a <- -1if(a<0)result = 0 else if (a<1)result = 1 else result = 2result#switch函数switch(2, mean(1:10),1:5,1:10)#输出后三个列表或值中的第二个,超过则输出空值y <- "fruit"switch(y, fruit = "apple", vegetable = "brocolli", meat =

2020-11-28 20:25:21 592

原创 R语言实战之如何绘制线性回归图表(附详细代码解释,小白也可看懂~)

R语言实战之如何绘制线性回归图表线性回归是统计学中最简单的模型之一,此章节主要讲述如何利用R语言来绘制线性图表,尽可能用最简单的语句写出所需的图表,适合帮助没有R语言编程基础的同学写出好看的论文~下面展示一个依剂量对比药物A和药物B的响应情况的例子。pdf("drug analyse.png")#将之后数据生成的图表保存为当前工作路径下的名为drug analyse的png格式图片dose <- c(20,30,40,45,60)drugA <- c(16,20,27,40,60)

2020-11-27 11:19:19 5993

原创 机器学习之异常检测--孤立森林(Isolation Forests)

机器学习之异常检测–孤立森林(Isolation Forests, iForests)异常检测在机器学习领域内的应用场景广泛。比如帮助银行参与检测是否洗钱,识别金融欺诈,帮助保险领域识别是否可能骗保以及监测网络入侵等等。iForests是异常检测中的一种离群检测方法,可以明确地分离异常样本。与随机森林由大量决策树组成一样,iForests也由大量的树组成。iForest算法是一种基于相似度的模型,属于无监督的方法,该算法主要通过从训练数据集中随机选取一个特征,在该特征的最大值最小值之间随机选取一个分裂点

2020-11-25 20:37:10 1008

原创 机器学习之人脸识别(Face Recognition)

机器学习之机器是如何识别人脸(Face Recognition)的?目前,一些机器学习技术已经被广泛应用于人脸识别、人脸支付以及身份认证领域,例如支付宝的FACEID,阿里的Alipay,ETC等等。这个领域内的算法多以传统的Eigen Face, LBP Face, Adaboost为主,面对一张人脸时,我们首先要进行的是进行人脸特征的提取,比如鼻子、眼睛等,之后对这些特征进行分析比对,确认人物基本信息。而机器主要是通过数学模型学习轮廓、纹理等细节,将机器提取出来的细节(1.特征提取,Feature

2020-11-24 15:42:52 8157

原创 机器学习之交叉验证(cross-validation,CV)

马思敏@机器学习机器学习之交叉验证(cross-validation,CV)人和计算机的主要区别在于人可以对问题进行思考,而计算机只会计算。从AI角度来看,人们将大量无序嘈杂的数据简单清洗之后喂(feed)给计算机,训练使其得出含参数的模型,在模型的基础上,利用数据对模型的参数进行估计,通过参数化后的模型来描述数据的内在关系(pattern),从而以一个科学(maybe哲学~)的角度预测未来。在对模型的选择上,可用的模型若干,不存在所谓最优解,我们只能认为对于某个确切问题来说,某个模型的解释能力更强。

2020-11-23 19:09:52 1646 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除