![](https://img-blog.csdnimg.cn/20190927151132530.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
热点:AGI ,OpenLLM,OpenAgent
1:揭示最前沿有价值的研究成果
2:梳理系统性持续性的科学技术
3:编写改领域的技术实现的教程
Eric An
standing on shoulders of Giants!
我的码云地址:https://gitee.com/NavySeals
展开
-
通用大模型研究重点之二:model history
十年前,上面的这篇文章算是为自然语言领域的RNN和Attention奠定了基础,BiRNN1997年,RNN encoder-decoder2014年分别为该论文奠定了基础,在这篇论文中详细阐述了通过软注意力解决对齐问题,也就是硬注意力和软注意力的一个区别,主要作用在隐含层得分问题上的基础研究。大佬之所以是大佬是能对一个现象级问题进行抽象并建模分析,同时先通过定性后定量实现系统性研究,下图是当时大佬们在这项研究中的核心工作。原创 2024-01-24 19:13:12 · 474 阅读 · 0 评论 -
通用大模型研究重点之三:model App
当然,现在有一些更先进的模型,比如 BERT,GPT 等,它们生成的是上下文相关的词嵌入,即词的嵌入会根据上下文变化,这样一定程度上弥补了传统词嵌入模型的不足。Word Embedding:词嵌入通常被用来生成词的向量表示,这个过程通常是静态的,即一旦训练完成,每个词的向量表示就确定了。然而,词嵌入并不能理解上下文信息,即相同的词在不同的上下文中可能有不同的含义,但词嵌入无法区分这些含义。更好的理解和利用上下文信息:例如,动态的、可变长度的上下文,以及更复杂的上下文结构。原创 2024-03-12 11:51:36 · 468 阅读 · 0 评论 -
深度学习调试规则
目前的神经网络模型已经变得比较庞大,通常可以理解为一个模型系统。而这种解决方案的庞大会导致我们在自己场景中使用背景限制。那么如何优化成为我们需要深度掌握的方向!在我个人的工作和学习过程中总结如下:1、数据数量:epoch、batch、iteration计算2、计算的输入规则3、模型的损失评估方法4、结构体作用5、代码块链接方式6、batchszie的选择7、learning rat...原创 2019-03-31 08:13:09 · 190 阅读 · 0 评论 -
向量场在实例分割与三维物体识别应用
自然场景文本检测https://amds123.github.io/2018/11/30/TextMountain-Accurate-Scene-Text-Detection-via-Instance-Segmentation/物体识别和三维重建https://blog.csdn.net/u014636245/article/details/84829810...原创 2018-12-28 11:29:08 · 367 阅读 · 0 评论 -
应用光学
原创 2021-01-13 17:06:36 · 259 阅读 · 0 评论 -
图像质量评估
https://blog.csdn.net/caoleiwe/article/details/49045633https://blog.csdn.net/ztgyztgy/article/details/79553598https://blog.csdn.net/edogawachia/article/details/79894305https://blog.csdn.net/edogawa...转载 2019-05-10 13:51:47 · 738 阅读 · 0 评论 -
ImageNet数据集
imagenet2012数据集下载百度云盘 链接:https://pan.baidu.com/s/1TkOZikEQt9qnmt3OUElvpg提取码:ux59下载地址http://www.image-net.org/challenges/LSVRC/2012/nnoupb/ILSVRC2012_img_test.tar(12.75G)http://www.image-net.org/c...原创 2019-12-20 16:18:50 · 960 阅读 · 0 评论 -
目标跟踪
一、数字图像处理方法 1、帧差法 2、光流法 3、背景消除法opencv的八种包 BOOSTING Tracker Haar cascades(AdaBoost) MIL Tracker KCF Tracker CSRT Tracker TLD Tracker MOSSE Tracker GOTURN Tracker二、深度学习方法 数据集 OTB2015 VOT16/18/18-LT LasOT UAV123 单目标跟踪算法 SiamDW原创 2019-11-16 05:24:37 · 278 阅读 · 0 评论 -
论文阅读
亚像素超分辨模型与论文https://github.com/wangxuewen99/Super-Resolutionhttps://antkillerfarm.github.io/图像超分辨(SISR/VSR单图像超分辨率,后者叫做视频超分辨率)ESPCN论文:《Real-Time Single Image and Video Super-Resolution Using an Ef...原创 2019-03-11 14:55:57 · 478 阅读 · 0 评论 -
深度学习面试总结
百度面试经历请自我介绍一下看到你项目写到使用过 Faster rcnn,请问 Faster rcnn 的优势是什么,为什么在这个项目使用 Faster rcnn?能介绍一下 Faster rcnn RPN 的作用和原理吗?ROI pooling 的主要作用是什么?知道 ROI align 吗? 它们两个的区别是什么?说一下 Faster rcnn anchor 机制,分别说一下 RP...转载 2019-04-18 15:15:40 · 845 阅读 · 0 评论 -
文字识别
从去年开始文字识别工程化后一直思考一个问题:汉子在复杂在背景下怎么更好的识别,阅读了大量的论文累计有300篇左右和清华出版社的那本字典一样的书发现贝叶斯这种理论确实存在上下限问题这就导致你inference一旦某些字识别错误将会整个识别系统np.NAN,这个问题的具体如果喜欢研究可以发邮件深入讨论。在此我非常幸运感谢前辈帮我们踩坑把线性和非线性的问题直接解决,而如今我在深度学习中发现已经不是那种单...原创 2019-05-12 09:41:37 · 219 阅读 · 0 评论 -
python矩形掩码
方法一:import cv2import numpy as npa = cv2.imread('c5.jpg', 1)b = np.zeros(a.shape, dtype=np.uint8)# 上下左右边距b[5:50, 15:100] = 255c = cv2.bitwise_and(b, a)d = cv2.bitwise_and(a, c)cv2.imwrite('c1.jpg', c)方法二:import cv2a = cv2.imread('c5.jpg',原创 2021-02-25 09:47:19 · 656 阅读 · 0 评论 -
深度学习面试问题总结
计算机视觉常见面试问题编程基础树图排序数据的增删改查算法感知机BPDPMkmeansKNNopencv的经典算法这种算法在显著性检测时候效果非常好:https://www.cnblogs.com/zyly/p/9651261.html滤波灰度二值边缘检测寻找轮廓HOG+SVMDPM匹配faster的结构RPN中的NMS八种图像增强的方法1、直方图...原创 2019-04-18 15:16:30 · 631 阅读 · 0 评论 -
图像质量评估仿真
原创 2019-07-04 17:11:55 · 249 阅读 · 0 评论 -
对图像的重新思考
由于近期在计算方面的研究发发现:计算视觉的图像分为图和像1:图是一种用于承担像的特征知识表示便于计算和抽象。2:像是一种直观物理可观察的知识表示现象图的理论是:矩阵论、数论、概率论、谱论、图论像的理论是:计算摄影学、物理光学、计算图形学...原创 2019-06-14 07:26:21 · 151 阅读 · 0 评论 -
计算机视觉一种解决不均衡问题新Loss
一般在目标检测解决类别不均衡问题是使用RetinaNet模型中的Focal loss,改结构是在模型上是将resnet+FPN+FCN方法结合成为的检测模型所以稳定有效,在他们的误差计算过程中使用了一种先交叉熵损失函数(cross_entropy)的思想,这种思想在理论是有依据因此可以深入学习,而在实现这个算法过程中使用ce_loss*bbox的训练贡献度指数式来实现极度不均衡目标检测的los...原创 2019-11-24 00:52:43 · 290 阅读 · 0 评论 -
存储一体架构芯片笔记
![在这里插入图片描述](https://img-blog.csdnimg.cn/20201126173309982.jpg?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3l1bnhpbmFu,size_16,color_FFFFFF,t_70#pic_center原创 2020-11-26 17:36:57 · 169 阅读 · 0 评论 -
keras模型可视化方法
keras模型可视化1、安装所需要的相关库macos系统brew install graphvizpip install pydot-ngwindowsconda install graphvizpip install pydot-ngkeras可视化代码from keras.utils.visualize_util import plotfrom IPpython....原创 2019-03-11 12:03:41 · 303 阅读 · 0 评论 -
图像检索之图像视频检检索模型阅读
Image retrieval(图像检索)之图像视频检检索Cross-model-trtrieval模型阅读Abstract计算机视觉在研究发展的历程中受到自然语言的指导,按照人对客观事物的感知通常是直观可以观察到图像中的图,通过计算机编解码为像。那么这种像是比较抽象的离散数据具备差分特征,对于这种差分特征的数据域在部分区域内是连续一个信号,这样就可以更好的使用CNN来先杀多模态(文...原创 2020-02-11 09:47:49 · 1660 阅读 · 3 评论 -
YOLOv4论文阅读笔记整理
YOLOv4论文阅读笔记整理摘要作者在YOLOv3基础上使用了WRC(weighted-Redsidual-Connections)加权残差链接、CSP(Cross-Stage-Partial-Connections)跨阶部分链接、CmBN(Cross mini-Batch Normalization) 跨小批量标准化 、SAT(Self-adversarial-training)自对抗训练、Mish(Mish-activation )激活函数、Mosaic(Mosaic data augm原创 2020-07-01 17:10:43 · 333 阅读 · 0 评论 -
数据集分布可视化seaborn
使用seaborn工程实现数据集分布可视化是写论文和相关报表的基础官方地址:http://seaborn.pydata.org/中文教程:https://zhuanlan.zhihu.com/p/27570774原创 2019-03-14 13:53:27 · 709 阅读 · 0 评论 -
底层视觉关键点检测
NARF 算法原创 2019-05-15 11:43:58 · 161 阅读 · 0 评论 -
目标检测和图像分类及其相关计算机视觉的图像分布
图片尺寸的分布一致,图片类别的分布一致,图片分辨率分布一致原创 2018-10-08 17:00:09 · 617 阅读 · 0 评论 -
scaled-yolov4模型结构对比
原创 2020-11-23 18:45:13 · 1385 阅读 · 3 评论 -
图像分割
目前主流的主流的图像分割是Mask R-CNN,获得ICCV 2017最佳论文后吸引了大量业内研究者的兴趣。10个月后,FAIR官方公布了源代码,以及基于Caffe 2的开源物体检测平台Detectron。由于caffe2平台的技术难度对大部分研究人员带来挑战,因此相继在tensorflow下实现是必要的思路,拥有着成熟的可视化工具和文档带给开发人员是一种非常体验。 相关论文:Mask R-CN...原创 2018-07-24 08:38:48 · 299 阅读 · 0 评论 -
通过HR光流估计学习视频超分辨率
Learning for Video Super-Resolution through HR Optical Flow Estimation论文地址:https://arxiv.org/abs/1809.08573代码地址:https://github.com/LongguangWang/SOF-VSR原创 2019-03-22 15:47:55 · 913 阅读 · 0 评论 -
细粒度图像识别
最近为了解决自己的问题关注三个问题一、细粒度图像分类识别Keras Xception Multi loss 细粒度图像分类https://www.jianshu.com/p/dbe7ba76f02f二、注意力https://blog.csdn.net/weixin_41977512/article/details/83243160https://blog.csdn.net/paper_...原创 2019-01-21 11:45:48 · 2933 阅读 · 0 评论 -
显著性目标检测
https://mmcheng.net/tag/salient-object-detection/目标检测http://machinethink.net/blog/object-detection/原创 2019-06-11 22:11:43 · 4513 阅读 · 0 评论 -
F1指数计算
def f1_loss(predict, target):loss = 0lack_cls = target.sum(dim=0) == 0if lack_cls.any():loss += F.binary_cross_entropy_with_logits(predict[:, lack_cls], target[:, lack_cls])predict = torch.sigmo...原创 2019-04-18 15:17:50 · 1981 阅读 · 0 评论 -
算法工程师入门学习笔记与深度思考
问题一:算法工程师去自己想去的地方需要什么样的基础(1):请大家清楚的认识到一个问题,算法工程师想去自己想去的公司需要的是编程基础(这里的编程基础不只是你会几句python而是会写项目)(2):算法工程的编程基础基础是首先会调试开源的算法、能看懂自己数据集的特征、清晰定位自己的算法领域。同时需要完善的计算机编程基础,很多人找不到工作正常,因为跨专业和普通院校学生基本没有机会去完成大型项目和实习机会。单纯靠比赛去到大公司由于个人编程基础薄弱导致工作压力很大或者不能在时间节点完成基本的工程任务。解决办法:原创 2020-11-23 18:40:05 · 160 阅读 · 0 评论 -
图像处理方法源码
源码地址:https://github.com/Eric3911/Code-with-Life原创 2020-09-25 14:00:34 · 124 阅读 · 0 评论 -
学习一下mxNet(致自己已经身心疲惫的心)
最近有点爆炸感觉; 1、单位能考试的绝对烤死 2、fastcnn一直徘徊在83%左右准确率 为什么提不高?鲁棒性这么差(仅工程应用方面)? 3、五篇经典论文读傻了 4、https://github.com/apache/incubator-mxnet/tree/master/example/ssd贫穷限制了我的思考和想象(计算资源不够) 5、https://github.com/ap原创 2017-12-27 10:48:43 · 1454 阅读 · 0 评论 -
复杂性科学与现代理论下的自然科学价值特点
http://yerevann.com/a-guide-to-deep-learning/ Deep learning is a fast-changing field at the intersection of computer science and mathematics. It is a relatively new branch of a wider field called mach原创 2017-03-23 18:57:46 · 1090 阅读 · 0 评论 -
EfficientDeRainy:一种高效的图像去雨雾算法
AAAI 20211. Motivation1.之前的去雨方法很多都是基于去雨模式假设或者先验知识的,去雨网络需要大量的细调优化过程,非常耗时的同时无法覆盖真实降雨场景的各种情况。因此,本文将去雨问题看作是普通的图像增强问题,用逐像素预测滤波核的方法去做去雨,是一种无模式的去雨方法。2.单一尺度的逐像素滤波核无法适应不同厚度、强度以及尺度的降雨条纹,因此本文提出Multi-dilated image filtering and fusion,即用不同膨胀率卷积来代表不同尺度的滤波核,以此来解决多尺度的原创 2021-05-26 18:07:40 · 1739 阅读 · 0 评论 -
视觉感受野采样
原创 2019-05-18 22:34:23 · 665 阅读 · 0 评论 -
自然场景文本检测的一些最新前沿的博客笔记
https://blog.csdn.net/peaceinmind/article/details/51387367如何训练yolo文字检测 及 crnn ocr文字识别 #59https://github.com/chineseocr/chineseocr/issues/59https://github.com/chineseocr/chineseocrhttps://ptorch.co...原创 2018-10-11 17:12:05 · 1649 阅读 · 0 评论 -
深度学习模型评估方法
深度学习模型评价指标原创 2020-06-08 22:49:33 · 1169 阅读 · 0 评论 -
pb文件转为pbtxt脚本问题
import tensorflow as tffrom tensorflow.python.platform import gfilefrom google.protobuf import text_formatdef convert_pb_to_pbtxt(filename): with gfile.FastGFile(filename, 'rb') as f: ...原创 2019-06-03 10:01:23 · 5519 阅读 · 9 评论 -
目标检测与图像中的损失函数问题
模型损失函数1、focal loss(焦点损失)2、skrinkage loss(收敛损失)3、lossless Triplet loss一种高效的siamese网络损失函数4、Repulsion loss5、sample can be faster Than Optimization采用可以比优化更快收敛MSE均方误差损失函数SVM合页损失函数Cross Entropy交叉熵损失...原创 2019-03-14 11:50:50 · 3757 阅读 · 0 评论 -
计算机视觉服务系统
tornado教程HTTP教程Eureka教程Eureka1Eureka2原创 2021-02-23 16:58:55 · 217 阅读 · 2 评论