- 博客(4)
- 收藏
- 关注
原创 深度学习平台总结
在我所研究过的框架中,PyTorch最富灵活性。PyTorch是Torch深度学习框架的一个接口,可用于建立深度神经网络和执行张量计算。Torch是一个基于Lua的框架,而PyTorch则运行在Python上。PyTorch是一个Python包,它提供张量计算。张量是多维数组,就像numpy的ndarray一样,它也可以在GPU上运行。PyTorch使用动态计算图,PyTorch的Autograd软件包从张量生成计算图,并自动计算梯度。
2023-04-29 10:00:00 244 1
原创 循环神经网络基础
在RNN中,存在一个很重要的问题,就是梯度消失问题,一开始我们不能有效的解决长时依赖问题,其中梯度消失的原因有两个:BPTT算法和激活函数Tanh∂W∂E3k0∑3∂y3∂E3∂s3∂y3jk1∏3∂sj−1∂sj∂W∂sk有两种解决方案,分别是ReLU函数和门控RNN(LSTM).
2023-04-28 10:39:21 120 1
原创 目标检测基础概念
目标检测(Object Detection)的任务是找出图像中所有感兴趣的目标(物体),确定它们的类别和位置,是计算机视觉领域的核心问题之一。由于各类物体有不同的外观、形状和姿态,加上成像时光照、遮挡等因素的干扰,目标检测一直是计算机视觉领域最具有挑战性的问题。分类-Classification:解决“是什么?”的问题,即给定一张图片或一段视频判断里面包含什么类别的目标。定位-Location:解决“在哪里?”的问题,即定位出这个目标的的位置。检测-Detection:解决“是什么?在哪里?
2023-04-20 11:41:28 246 1
原创 OCR论文复现:Multi-Granularity Prediction for Scene Text Recognition
论文解读:[[ECCV2022] MGP-STR:一种基于视觉Transformer的多粒度文字识别方法(已开源)]
2023-04-20 11:39:05 442 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人