logistic回归学习

最新推荐文章于 2024-03-01 11:06:11 发布

j3smile

最新推荐文章于 2024-03-01 11:06:11 发布

阅读量1.5k

点赞数

分类专栏：数据挖掘

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/j3smile/article/details/17680557

版权

数据挖掘专栏收录该内容

6 篇文章 0 订阅

订阅专栏

logistic回归为概率型非线性回归模型，是研究分类观察结果(y)与一些影响因素(x)之间关系的一种多变量分析方法

可解决的问题:
因变量为二分类的称为二项logistic回归，因变量为多分类的称为多元logistic回归。
因变量的类型:
可为连续变量、等级变量、分类变量。
适用性

两元因变量的logistic回归模型方程讲解

一个自变量与Y关系的回归模型如：记为p（y=1/x）表示某暴露因素状态下，结果y=1的概率（P）模型。

或者:
Logistic回归函数的几何图形为
模型中的参数（βi）估计

通常用最大似然函数 (maximum likelihood estimate， MLE)估计β，由统计软件包完成。
梯度下降法

logistic回归方法补充多元线性回归的不足

多元线性回归方法要求 Y 的取值为计量的连续性随机变量。
多元线性回归方程要求Y与X间关系为线性关系。
多元线性回归结果不能回答“发生与否”

最大似然估计的原理

给定一个概率分布，假定其概率密度函数（连续分布）或概率质量函数（离散分布）为，以及一个分布参数，我们可以从这个分布中抽出一个具有个值的采样，通过利用，我们就能计算出其概率：

但是，我们可能不知道的值，尽管我们知道这些采样数据来自于分布。那么我们如何才能估计出呢？一个自然的想法是从这个分布中抽出一个具有个值的采样，然后这些采样数据来估计. 一旦我们获得，我们就能从中找到一个关于的估计。最大似然估计会寻找关于的最可能的值（即，在所有可能的取值中，寻找一个值使这个采样的“可能性”最大化）。这种方法正好同一些其他的估计方法不同，如的非偏估计，非偏估计未必会输出一个最可能的值，而是会输出一个既不高估也不低估的值。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

博客等级

码龄13年

138
原创

10
点赞

32
收藏

23
粉丝

关注

私信

热门文章

分类专栏

c++基础 16篇
opencv 5篇
linux 5篇
工具软件 8篇
工作 7篇
hadoop 21篇
windows 1篇
日常 2篇
java 12篇
gentoo 9篇
学习 7篇
shell 2篇
数据库 8篇
eclipse 5篇
文档写作
数据挖掘 6篇
hive 10篇
ubuntu 3篇
草稿 9篇
项目 6篇
sqoop 1篇
R 4篇
olap 8篇
excel 1篇
python 1篇
细节实现 1篇

最新评论

hadoop远程客户端安装配置、多用户权限配置
学无止境-修身为正回复圆圆一直在修炼: 是的，要安装的
cvCreateStructuringElementEx
真是滑稽: 为什么一个元素是5个数啊？
hadoop远程客户端安装配置、多用户权限配置
圆圆一直在修炼: 您好！我是想在集群以外的机器上安装flume agent向集群的HDFS上抽取日志，这样的话是不是我的flume agent机器上也要安装hadoop客户端！
关于distinct 和group by的去重逻辑浅析
小虚竹: 有用
解决问题的思路
kxcc_sx: saiku的中文问题是由于Mysql 数据连接需要指定utf8 编码否则在筛选或者mdx 出现中文的时候在底层匹配不上在datasource 连接时候加上 ?useUnicode=true&characterEncoding=utf8 就ok了

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。