使用nodeitk进行对象识别

前言

东莞,晴,29至27度。忙了一天,终于可以写写东西了。今天继续昨天的话题,我们在昨天的例了基础上完善,通过匹配关键点求出映射从而找到场景中的已知对象。

目标

本文你将学习

  1. 采用nodeitk的findHomography和perspectiveTransform进行对象识别。
  2. 此外,例子基本包含nodeitk的一些基本数据结构的使用:NodeOpenCVMat, NodeOpenCVKeyPoint, NodeOpenCVPoint
  3. 上述基本的数据结构在nodeitk版本稳定后将会在使用手册中说明
代码

var node_itk = require('./node-itk');
var img_object = node_itk.cv.imread( "./images/box.png", node_itk.cv.CV_LOAD_IMAGE_GRAYSCALE );
var img_scene = node_itk.cv.imread( "./images/box_in_scene.png", node_itk.cv.CV_LOAD_IMAGE_GRAYSCALE );
minHessian = 400
detector = new node_itk.cv.NodeOpenCVFeatureDetector("SURF")
detector.Set("hessianThreshold", minHessian)
keypoints_object = detector.Detect( img_object );
keypoints_scene = detector.Detect( img_scene );
extractor = new node_itk.cv.NodeOpenCVDescriptorExtractor("SURF");
descriptors_object = extractor.Compute(img_object, keypoints_object)
descriptors_scene = extractor.Compute(img_scene, keypoints_scene)
matcher = new node_itk.cv.NodeOpenCVDescriptorMatcher("FlannBased");
matches = matcher.Match(descriptors_object, descriptors_scene);
max_dist=0
min_dist=100
for (var i = 0; i < descriptors_object.Rows(); i++ ) {
	dist = matches[i].GetDistance();
	if (dist < min_dist) min_dist = dist;
	if (dist > max_dist) max_dist = dist;
};
console.log("-- Max dist : " + max_dist + "\n")
console.log("-- Min dist : " + min_dist + "\n")
var good_matches = [];
for( var i = 0; i < descriptors_object.Rows(); i++ ){ 
	if( matches[i].GetDistance() <= 3*min_dist )
	{ good_matches.push( matches[i] ); }
}
img_matches = node_itk.cv.DrawMatches(img_object, keypoints_object, img_scene, keypoints_scene, good_matches);
var obj=[], scene=[];
for (var i = 0; i < good_matches.length; i++) {
	obj.push( keypoints_object[good_matches[i].GetQueryIdx()].PT() )
	scene.push( keypoints_scene[good_matches[i].GetTrainIdx()].PT() )
};

H = node_itk.cv.FindHomography( obj, scene, node_itk.cv.CV_RANSAC );

obj_corners = []
obj_corners[0] = new node_itk.cv.NodeOpenCVPoint("Point2d", [0,0])
obj_corners[1] = new node_itk.cv.NodeOpenCVPoint("Point2d", [img_object.Cols(),0])
obj_corners[2] = new node_itk.cv.NodeOpenCVPoint("Point2d", [img_object.Cols(),img_object.Rows()])
obj_corners[3] = new node_itk.cv.NodeOpenCVPoint("Point2d", [0,img_object.Rows()])

tmp = new node_itk.cv.NodeOpenCVPoint("Point2d", [img_object.Cols(),0]);
color = new node_itk.cv.NodeOpenCVScalar("Scalar", [0,255,0]);
scene_corners = node_itk.cv.PerspectiveTransform(obj_corners, H.res);
node_itk.cv.Line(img_matches, scene_corners[0].Add(tmp), scene_corners[1].Add(tmp), color, 2)
node_itk.cv.Line(img_matches, scene_corners[1].Add(tmp), scene_corners[2].Add(tmp), color, 2)
node_itk.cv.Line(img_matches, scene_corners[2].Add(tmp), scene_corners[3].Add(tmp), color, 2)
node_itk.cv.Line(img_matches, scene_corners[3].Add(tmp), scene_corners[0].Add(tmp), color, 2)
node_itk.cv.NamedWindow( "Good Matches & Object detection", node_itk.cv.CV_WINDOW_AUTOSIZE );
node_itk.cv.imshow( "Good Matches & Object detection", img_matches );
node_itk.cv.WaitKey ( 0 );

结果


小结

本文是昨天话题的深化,代码依然比较简洁。这是nodeitk遵循的原则:以简单的方式快速实现图像处理应用。喜欢的朋友就点踩,想说点东西的就评论吧!^_^ 待续

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
机器学习是一种人工智能(AI)的子领域,致力于研究如何利用数据和算法让计算机系统具备学习能力,从而能够自动地完成特定任务或者改进自身性能。机器学习的核心思想是让计算机系统通过学习数据中的模式和规律来实现目标,而不需要显式地编程。 机器学习应用非常广泛,包括但不限于以下领域: 图像识别和计算机视觉: 机器学习在图像识别、目标检测、人脸识别、图像分割等方面有着广泛的应用。例如,通过深度学习技术,可以训练神经网络来识别图像中的对象、人脸或者场景,用于智能监控、自动驾驶、医学影像分析等领域。 自然语言处理: 机器学习在自然语言处理领域有着重要的应用,包括文本分类、情感分析、机器翻译、语音识别等。例如,通过深度学习模型,可以训练神经网络来理解和生成自然语言,用于智能客服、智能助手、机器翻译等场景。 推荐系统: 推荐系统利用机器学习算法分析用户的行为和偏好,为用户推荐个性化的产品或服务。例如,电商网站可以利用机器学习算法分析用户的购买历史和浏览行为,向用户推荐感兴趣的商品。 预测和预测分析: 机器学习可以用于预测未来事件的发生概率或者趋势。例如,金融领域可以利用机器学习算法进行股票价格预测、信用评分、欺诈检测等。 医疗诊断和生物信息学: 机器学习在医疗诊断、药物研发、基因组学等领域有着重要的应用。例如,可以利用机器学习算法分析医学影像数据进行疾病诊断,或者利用机器学习算法分析基因数据进行疾病风险预测。 智能交通和物联网: 机器学习可以应用于智能交通系统、智能城市管理和物联网等领域。例如,可以利用机器学习算法分析交通数据优化交通流量,或者利用机器学习算法分析传感器数据监测设备状态。 以上仅是机器学习应用的一部分,随着机器学习技术的不断发展和应用场景的不断拓展,机器学习在各个领域都有着重要的应用价值,并且正在改变我们的生活和工作方式。
机器学习是一种人工智能(AI)的子领域,致力于研究如何利用数据和算法让计算机系统具备学习能力,从而能够自动地完成特定任务或者改进自身性能。机器学习的核心思想是让计算机系统通过学习数据中的模式和规律来实现目标,而不需要显式地编程。 机器学习应用非常广泛,包括但不限于以下领域: 图像识别和计算机视觉: 机器学习在图像识别、目标检测、人脸识别、图像分割等方面有着广泛的应用。例如,通过深度学习技术,可以训练神经网络来识别图像中的对象、人脸或者场景,用于智能监控、自动驾驶、医学影像分析等领域。 自然语言处理: 机器学习在自然语言处理领域有着重要的应用,包括文本分类、情感分析、机器翻译、语音识别等。例如,通过深度学习模型,可以训练神经网络来理解和生成自然语言,用于智能客服、智能助手、机器翻译等场景。 推荐系统: 推荐系统利用机器学习算法分析用户的行为和偏好,为用户推荐个性化的产品或服务。例如,电商网站可以利用机器学习算法分析用户的购买历史和浏览行为,向用户推荐感兴趣的商品。 预测和预测分析: 机器学习可以用于预测未来事件的发生概率或者趋势。例如,金融领域可以利用机器学习算法进行股票价格预测、信用评分、欺诈检测等。 医疗诊断和生物信息学: 机器学习在医疗诊断、药物研发、基因组学等领域有着重要的应用。例如,可以利用机器学习算法分析医学影像数据进行疾病诊断,或者利用机器学习算法分析基因数据进行疾病风险预测。 智能交通和物联网: 机器学习可以应用于智能交通系统、智能城市管理和物联网等领域。例如,可以利用机器学习算法分析交通数据优化交通流量,或者利用机器学习算法分析传感器数据监测设备状态。 以上仅是机器学习应用的一部分,随着机器学习技术的不断发展和应用场景的不断拓展,机器学习在各个领域都有着重要的应用价值,并且正在改变我们的生活和工作方式。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值