环境安装
1. 创建环境:
conda create -n open-mmlab python=3.8 pytorch==1.8.0 cudatoolkit=10.2 torchvision -c pytorch -y
2. 进入环境:
conda activate open-mmlab
3. 安装mmcv-full:进入网址:https://download.openmmlab.com/mmcv/dist/cu102/torch1.8.0/index.html
选择1.6.0的win版本,选择相应的python,CUDA版本,下载后 cd 到路径后安装
pip install mmcv_full-1.6.0-cp38-cp38m-win_amd64.whl
注:没有安装OpenCV会自动先安装,会报警告,等一会,自动安装OpenCV就可以了
没有安装则,手动安装OpenCV:conda install opencv
4. 安装mmset:
pip install openmim
mim install mmdet
注:此处如果报一些pycocotools的错误,可能是没有安装VS Code,没有C++编译器。直接打开镜像,安装即可。
链接:https://pan.baidu.com/s/1PHymKy5YrXE2OSxPplbSQA
提取码:ggdr
5. 进入下载好的整个工程 mmrotate:
cd mmrotate
6. 安装需要的版本库:(注意:-e 后面有点)
pip install -r requirements/build.txt
pip install -v -e .
7. 再把需要的库安装一下:
pip install -r requirements.txt
8. 验证安装
python demo/image_demo.py demo/demo.jpg oriented_rcnn_r50_fpn_1x_dota_le90.py oriented_rcnn_r50_fpn_1x_dota_le90-6d2b2ce0.pth --out-file result.jpg
- 使用python打开image_demo.py 传入demo.jpg待检测图片
- oriented_rcnn_r50_fpn_1x_dota_le90.py是使用的config模
- oriented_rcnn_r50_fpn_1x_dota_le90-6d2b2ce0.pth是训练好的模型
- result.jpg是输出路径
开了代理无法下载问题
# pip list
matplotlib 3.6.1
mmcv-full 1.6.0
mmdet 2.25.2
mmrotate 0.3.2
more-itertools 9.0.0
numpy 1.23.1
opencv-python 4.6.0.66
path 16.5.0
pip 22.2.2
py 1.11.0
PyYAML 6.0
requests 2.28.1
torch 1.8.0
torchvision 0.9.0
wheel 0.37.1
标注工具安装与使用(RoLabelimg)
- 下载源码:https://github.com/cgvict/roLabelImg
- 重新创建一个环境:
conda create -n Rolabelimg python=3.6
- 进入环境:
conda activate Rolabelimg
- 安装pyqt5:
pip install pyqt5
- 安装lxml:
pip install lxml
- 安装rolabelimg(需要先进入源码的根路径):
pyrcc5 -o resources.py resources.qrc
- 执行程序:
python labelImg.py
为了提高模型的精确度、召回率、MAP等:
- 首先模型需要一个庞大的数据集支撑(这很重要),每个类别的图像都要大于1000张,且最好在不同背景下都有涉及,不然模型的泛化力会很弱,无法预测更换环境后的同一物体
- 其次标签制作一定要细心,并且一定要是一张图像中的全部标签,漏选或者选错标签都会对模型造成较大的影响
- 对于数据集较少的训练模型,batch_size设的小一点会更好,此时模型对于多张图片的整体分析来减少训练时间(本来就很少了)已经不再重要,模型更应该注重每张图片的特征,本人只制作总体不到100份数据集,于是乎batch_size就变成了1,事实证明模型的训练效果会变好