CV
文章平均质量分 96
keineahnung2345
这个作者很懒,什么都没留下…
展开
-
KITTI depth completion數據集評測
本文包含筆者試跑KITTI depth completion評測工具的記錄,以及關於評測輸出結果的簡要介紹。在Ubuntu 20.04下跑一共踩了兩個坑(據說在Ubuntu 18.04下跑不會有坑),解決方式也一併列出。原创 2021-03-04 15:33:12 · 3222 阅读 · 8 评论 -
Fully-Convolutional Siamese Networks for Object Tracking論文研讀與問題討論
本篇是目標跟蹤領域SiamRPN系列的首篇論文。本篇的作法為線下similarity learning+線上目標跟蹤。線下:訓練一個孿生網路,用來從一張大的search image裡找出exemplar image。線上:“在search image上使用滑動視窗尋找exemplar image”的步驟被“一個計算兩輸入間互相關(cross-correlation)的雙線性層(bilinear layer)”所取代。原创 2019-09-03 20:35:10 · 652 阅读 · 0 评论 -
Ubuntu下安裝Python版OpenCV
筆者試著要在Ubuntu系統下安裝Python版的OpenCV,一開始只使用pip來安裝,但卻會報錯。後來才發現原來它還需要幾個debian的package才能成功運行。原创 2018-11-20 14:19:01 · 8938 阅读 · 3 评论 -
PIL及matplotlib:OSError: cannot identify image file錯誤及解決方式
這個錯誤是在使用PIL及matplotlib來讀圖(.jpg檔)的時候發生的。這個錯誤只有在讀某個特定的圖檔時才會發生。但是後來去檢查圖片,卻發現可以用一般的圖片瀏覽器打開,並且看不出什麼問題。問題的解決方法是筆者不經意發現的。因為PIL跟matplotlib都無法讀圖,所以想安裝其它的包試試看。一開始試了opencv-python,安裝完成後,發現使用cv2可以成功讀圖。後來試了scikit-image,安裝完成後,使用skimage也可以成功讀圖。筆者嘗試使用PIL跟matplotlib原创 2018-12-26 17:06:43 · 23288 阅读 · 9 评论 -
Feature Pyramid Networks for Object Detection論文研讀與問題討論
本篇文章講述論文Feature Pyramid Networks for Object Detection。本文除了介紹論文本身外,還加入了筆者研讀論文時的碰到的問題及個人的想法。將之記錄於問題討論章節中該論文著重於解決多尺度目標檢測的問題。它使用CNN固有的多尺度,金字塔狀的結構,加上top-down pathway以及lateral connection,來建立feature pyramid。這種做法僅額外多了一點計算量就能提升CNN對小物體檢測的效果。並且FPN還能當作通用的特徵提取器來使用原创 2018-12-26 17:25:41 · 1464 阅读 · 2 评论 -
Mask_RCNN代碼研讀(matterport版本)系列文(二)- Feature Pyramid Network部份
在本系列的第一篇Mask_RCNN代碼研讀(matterport版本)系列文(一)- ResNet部份中,我們了解到ResNet在Mask RCNN的大架構裡扮演的是特徵抽取器(backbone)的角色,而這些feature maps將被Feature Pyramid Network(以下簡稱FPN)用來進一步構建在更層語義訊息皆很強的特徵。在本篇中將會接著對FPN進行探討。對FPN還不了解的同學可以先看看Feature Pyramid Networks for Object Detection論文研讀。原创 2018-12-28 13:57:04 · 900 阅读 · 0 评论 -
Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks論文研讀與問題討論
Faster R-CNN改良自Fast R-CNN,它將Selective Search改為RPN。本篇介紹Faster R-CNN的架構及實作細節。在研讀過程中碰到不太了解的地方,筆者有做了一些研究,將它們整理到問題討論章節中。問題包括了:ZF Net及VGG 16最後一層卷積層的感受野是如何計算出來的?為何classifier head要輸出2*k個值,而非k個值就好?ConvNet backbone輸出的feature map長x寬約為2400?原创 2019-01-18 17:48:43 · 893 阅读 · 0 评论 -
Mask_RCNN代碼研讀(matterport版本)系列文(一)- ResNet部份
在開始閱讀這近三千行的代碼之前,先對模型整體架構有基本的認識會比較好。以下先說說閱讀代碼時需注意的幾個地方:Mask R-CNN的發展歷程是由R-CNN到Fast R-CNN到Faster R-CNN再到Mask R-CNN。它們使用ResNet當backbone來抽取特徵,並且用到了Feature Pyramid Network來解決所謂多尺度目標檢測的問題。這個repo是用Keras+TensorFlow寫成。經筆者實測,使用Keras2.2.2或TensorFlow1.8原创 2018-12-26 17:27:19 · 2293 阅读 · 5 评论