第五十三篇:2021基于transformers的胶囊内窥镜小肠影像的快速定位
Deep transformers for fast small intestine grounding in capsule endoscope video
作者:Xinkai Zhao
目的:使用transformers模块实现WCE视频的快速定位(场景分类出胃、小肠、大肠)
方法:通过识别出小肠的始端和末端从而实现场景分类。使用cnn提取特征,这里的cnn使用的是resnet和densenet两组。然后使用transformers模块进行识别分类。其识别分类不需要真个视频的搜索小肠,而是沿着中间目标边界的方向迭代分离视频片段,使用搜索算法来定位小肠的前后边界。实验还与LSTM分类等多种方法做比较。
数据:中山大学附属六医院113个CEvideo
特别地:其定时耗时较少为109s。
结果:平均IoU达到0.945。
注:学习指数8.5。无代码
第四十五篇:2019基于卷积神经网络和隐马尔科夫模型的内窥镜视频信息帧分类
Informative frame classification of endoscopic videos using convolutional neural networks and hidden Markov models作者:Joost van der Putten
目的:胶囊内镜图像存在较多的干扰图像,将无用信息图片筛选出来
方法:CNN+HMM。先用ResNet将胶囊内镜影像的无用信息进行一遍筛选,然后再用HMM隐马尔可夫模型将时间整合到模型中。将分类精度提高了10%。
特别地:实验做了三组对照,实验表明HMM实验效果较好。
不足:该文献没有实验框架,也没有解释实验细节。
结果:准确率94%。F1=91%
注:学习指数7.5。无代码