【训练源码】
https://github.com/qianyu-dlut/MVANet
【参考源码】
https://github.com/hpc203/MVANet-onnxrun
【算法介绍】
二分图像分割(DIS)最近出现在从高分辨率自然图像中进行高精度对象分割方面。在设计有效的DIS模型时,主要的挑战是如何平衡高分辨率目标在小感受野中的语义分散和大感受野中高精度细节的损失。现有的方法依赖于繁琐的多个编码器-解码器流和阶段来逐步完成全局定位和局部细化。
人类视觉系统通过从多个角度观察感兴趣的区域来捕捉它们。受此启发,我们将DIS建模为一个多视图对象感知问题,并提供了一个简约的多视图聚合网络(MVANet),该网络将远景和近景的特征融合统一到一个具有一个编码器-解码器结构的单个流中。具体来说,我们将原始视图中的高分辨率输入图像分为具有全局信息的远景图像和具有局部细节的特写图像。因此,它们可以构成一组互补的多视图低分辨率输入补丁。
【效果展示】
【部分实现代码】
using System;
using System.Diagnostics;
using System.Windows.Forms;
using OpenCvSharp;
namespace FIRC
{
public partial class Form1 : Form
{
Mat src = null;
MVANet net = new MVANet();
public Form1()
{
InitializeComponent();
}
private void button1_Click(object sender, EventArgs e)
{
OpenFileDialog openFileDialog = new OpenFileDialog();
openFileDialog.Filter = "图文件(*.*)|*.jpg;*.png;*.jpeg;*.bmp";
openFileDialog.RestoreDirectory = true;
openFileDialog.Multiselect = false;
if (openFileDialog.ShowDialog() == DialogResult.OK)
{
src = Cv2.ImRead(openFileDialog.FileName);
pictureBox1.Image = OpenCvSharp.Extensions.BitmapConverter.ToBitmap(src);
}
}
private void button2_Click(object sender, EventArgs e)
{
if(pictureBox1.Image==null)
{
return;
}
var resultImg = net.Inference(src);
pictureBox2.Image= OpenCvSharp.Extensions.BitmapConverter.ToBitmap(resultImg);
}
private void Form1_Load(object sender, EventArgs e)
{
net.LoadWeights(Application.StartupPath+ "\\weights\\mvanet_1024x1024.onnx");
}
private void button3_Click(object sender, EventArgs e)
{
VideoCapture capture = new VideoCapture(0);
if (!capture.IsOpened())
{
Console.WriteLine("video not open!");
return;
}
Mat frame = new Mat();
var sw = new Stopwatch();
int fps = 0;
while (true)
{
capture.Read(frame);
if (frame.Empty())
{
Console.WriteLine("data is empty!");
break;
}
sw.Start();
var resultImg = net.Inference(frame);
sw.Stop();
fps = Convert.ToInt32(1 / sw.Elapsed.TotalSeconds);
sw.Reset();
Cv2.PutText(resultImg, "FPS=" + fps, new OpenCvSharp.Point(30, 30), HersheyFonts.HersheyComplex, 1.0, new Scalar(255, 0, 0), 3);
//显示结果
Cv2.ImShow("Result", resultImg);
int key = Cv2.WaitKey(10);
if (key == 27)
break;
}
capture.Release();
}
}
}
【测试环境】
netframework4.7.2
opencvsharp==4.8.0
onnxruntime==1.19.0(测试发现1.18.1及其以下不行)
【视频演示】
【源码下载地址】
https://download.csdn.net/download/FL1623863129/89652092
【特别注意】
由于模型参数量大,虽然精度高,但是实时行差