最小二乘，极大似然，交叉熵

最新推荐文章于 2024-02-20 17:53:11 发布

highoooo

最新推荐文章于 2024-02-20 17:53:11 发布

阅读量170

点赞数

分类专栏： AI

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/highoooo/article/details/119593794

版权

AI 专栏收录该内容

27 篇文章 0 订阅

订阅专栏

这篇博客探讨了人工智能模型与人脑模型之间的差距，通过最小二乘法、极大似然估计和交叉熵等概念进行解释。文章指出，这些数学工具用于量化模型的误差和优化，以更接近人脑的决策过程。交叉熵作为衡量信息量和预测准确性的指标，揭示了模型预测的不确定性。此外，KL散度被用来评估模型熵之间的差异，进一步刻画模型的相似性。

摘要由CSDN通过智能技术生成

评估模型与人脑模型的差距

最小二乘：累加错误的数值（平方而不是绝对值是为了方便求导，1/2是为了方便化简）在这里插入图片描述
极大似然估计：x1,x2—xn是人脑模型 W,b是网络模型求使P最大的W,b（极大似然） P值越大越与人脑模型接近

log改连乘为连加不影响单调性

改max为min- 求极小值

交叉熵：
中国1%赢球的信息量6.6 法国99%赢球的信息量0.01
比利时和阿根廷都是1
左边的熵 = 0.5+0.5 =1 右边的熵 =0.01+0.06 = 0.07
在这里插入图片描述
（KL散度、相对熵的定义）用于比较两个模型熵的差距

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
最小二乘，极大似然，交叉熵

评估模型与人脑模型的差距最小二乘：累加错误的数值（平方而不是绝对值是为了方便求导，1/2是为了方便化简）极大似然估计：x1,x2—xn是人脑模型 W,b是网络模型求使P最大的W,b（极大似然） P值越大越与人脑模型接近log改连乘为连加不影响单调性改max为min- 求极小值交叉熵：中国1%赢球的信息量6.6 法国99%赢球的信息量0.01比利时和阿根廷都是1左边的熵 = 0.5+0.5 =1 右边的熵 =0.01+0.06 = 0.07（KL散度、相对熵的定义）用于比较两个
复制链接

扫一扫

专栏目录

博客等级

码龄4年

179
原创

130
点赞

483
收藏

2199
粉丝

关注

私信

热门文章

分类专栏

papers 8篇
感知算法 2篇
Computer Vision 34篇
python 26篇
interview
CUDA 1篇
TensorRT 11篇
AI 27篇
C/C++知识 30篇
C++ 35篇
segmentation 3篇
jetson 7篇
C/C++ OpenCV 10篇
ubuntu 8篇
rknn 1篇
ffmpeg 3篇
GAN 2篇

最新评论

C/C++ TensorRT引擎多线程推理多个rtsp流并显示或保存
HuangYison: 第一种没试过，二三四方式都试了，如果engine都是同一个的话没必要实例化多个，实例化一个然后每个线程都创建自己的context和cudaStream执行推理是可以并行处理的(c++)，如果内存够大可以每个线程都申请一块内存去计算，就不用加锁或者队列了，实测这样并行处理可以快很多，处理结果目前是正确的（官方文档说context不是线程安全的），但是输入数据稍微多点很容易就内存爆掉
C/C++ TensorRT引擎多线程推理多个rtsp流并显示或保存
HuangYison: 单线程下使用tensorrt的batch推理实际GPU并没有完全的并行处理，batch的推理时间只是略小于单张图片推理时间*batch_size，然后多batch串行执行的话更慢了，根本提不了多少速度
C/C++ TensorRT引擎多线程推理多个rtsp流并显示或保存
菜鸟的追梦旅行: 没有推理多路视频了，只推理了一路。请问你解决了吗
DeeplabV3 预测、模型转换、trt加速
weixin_45198884: 请问pth怎么转动态onnx
Python 轨道区域检测（基于霍夫变换）
Mr_G27: 1913286105@qq.com 感谢。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。