细致入微的理解ROS中的入门级别之手写数字识别在ROS领域的研究

最新推荐文章于 2024-08-19 10:28:37 发布

置顶

暗香独自开

最新推荐文章于 2024-08-19 10:28:37 发布

阅读量1.2k

点赞数 2

分类专栏： AI 算法 python ros 文章标签：ＲＯＳ Tensorflow 手写数字识别

本文链接：https://blog.csdn.net/qq_41058594/article/details/86619113

版权

本文深入探讨了在ROS环境中使用Tensorflow实现手写数字识别的过程。通过分析代码，阐述了ROS话题、发布和接收的概念，以及MNIST数据集的下载和使用。同时，解释了Tensorflow构建模型和训练的两个阶段，鼓励读者一同探索机器学习的原理。

摘要由CSDN通过智能技术生成

一种东西只要懂得他是如何工作的，原理是什么，那么与之类似的东西我们都可以一通百通，就比如手写数字识别被称为进入机器学习的hello world，那么我想如果我们要想学习其他的项目的话，我们只要深刻理解了其基本内涵，我想对于机器学习之路就会得心应手的。
下面来看一个完整的在ROS里边运用Tensorflow来实现手写数字的识别：

#!/usr/bin/env python 
# -*- coding: utf-8 -*-
 
import rospy
from sensor_msgs.msg import Image
from std_msgs.msg import Int16
from cv_bridge import CvBridge
import cv2
import numpy as np
import input_data  
import tensorflow as tf

class MNIST():
    def __init__(self):
        image_topic = rospy.get_param("~image_topic", "")

        self._cv_bridge = CvBridge()

        #MNIST数据输入  
        self.mnist = input_data.read_data_sets("MNIST_data/", one_hot=True)  
          
        self.x = tf.placeholder(tf.float32,[None, 784]) #图像输入向量  
        self.W = tf.Variable(tf.zeros([784,10]))        #权重，初始化值为全零  
        self.b = tf.Variable(tf.zeros([10]))            #偏置，初始化值为全零  
          
        #进行模型计算，y是预测，y_ 是实际  
        self.y = tf.nn.softmax(tf.matmul(self.x, self.W) + self.b)  
          
        self.y_ = tf.placeholder("float", [None,10])  
          
        #计算交叉熵  
        self.cross_entropy = -tf.reduce_sum( self.y_*tf.log(self.y))  
        #接下来使用BP算法来进行微调,以0.01的学习速率  
        self.train_step = tf.train.GradientDescentOptimizer(0.01).minimize(self.cross_entropy)  
          
        #上面设置好了模型，添加初始化创建变量的操作  
        self.init = tf.global_variables_initializer()  
        #启动创建的模型，并初始化变量  
        self.sess = tf.Session()  
        self.sess.run(self.init)  

        #开始训练模型，循环训练1000次  
        for i in range(1000):  
            #随机抓取训练数据中的100个批处理数据点  
            batch_xs, batch_ys = self.mnist.train.next_batch(100)  
            self.sess.run(self.train_step, feed_dict={self.x:batch_xs, self.y_:batch_ys})  

        ''''' 进行模型评估 '''  
        #判断预测标签和实际标签是否匹配  
        correct_prediction = tf.equal(tf.argmax(self.y,1),tf.argmax(self.y_,1))   
        self.accuracy = tf.reduce_mean(tf.cast(correct_prediction, "float"))  
       
        #计算所学习到的模型在测试数据集上面的正确率  
        print( "The predict accuracy with test data set: \n")
        print( self.sess.run(self.accuracy, feed_dict={self.x:self.mnist.test.images, self.y_:self.mnist.test.labels}) )  

        self._sub = rospy.Subscriber(image_topic, Image, self.callback, queue_size=1)
        self._pub = rospy.Publisher('result', Int16, queue_size=1)

    def callback(self, image_msg):
        #预处理接收到的图像数据
        cv_image = self._cv_bridge.imgmsg_to_cv2(image_msg, "bgr8")