python截取摄像头的视频流为图片,输入模型进行物体识别

截取电脑摄像头的视频流,转化为帧并且输入给以inceptionV3训练的pd模型,输出结果。
可以修改阈值。

# -*- coding: cp936 -*-
"""
Author:xxxxxx
Date:2019-09-23
Discription:Read Camaro picture and save
"""

import cv2, os, time
import numpy as np
from multiprocessing import Process
import _thread
# coding: UTF-8
import tensorflow as tf
import os
import numpy as np
import matplotlib.pyplot as plt

class CamaroCap(object):
    # 打开摄像头
    def __init__(self):
        # self.cap = cv2.VideoCapture(0)
        # self.cap = cv2.VideoCapture("rtsp://admin:admin123@172.16.9.23/cam/realmonitor?channel=1&subtype=0")  # 获取网络摄像机
        """
        self.cap.set(cv2.CAP_PROP_FOURCC, cv2.VideoWriter_fourcc('M', 'J', 'P', 'G'))
        self.cap.set(cv2.CAP_PROP_FRAME_WIDTH, 640)
        self.cap.set(cv2.CAP_PROP_FRAME_HEIGHT, 480);
        """

        self.cap = cv2.VideoCapture(0)
    # 图片信息打印
    def get_image_info(self, image):
        print(type(image))
        print(image.shape)
        print(image.size)
        print(image.dtype)
        pixel_data = np.array(image)
        print(pixel_data)


    with tf.gfile.FastGFile('C:/Users/83543/Desktop/output_graph.pd', 'rb') as f:
        graph_def = tf.GraphDef()
        graph_def.ParseFromString(f.read())
        tf.import_graph_def(graph_def, name='')
    # 逐帧读取数据并保存图片到本地制定位置
    def Camaro_image(self):
        i = 0
        with tf.Session() as sess:
            softmax_tensor = sess.graph.get_tensor_by_name(
                'final_result:0')
            while (1):
                """
                ret:True或者False,代表有没有读取到图片
                frame:表示截取到一帧的图片
                """
                ret, frame = self.cap.read()
                ret, frame = self.cap.read()
                # print("打印图片信息")
                #self.get_image_info(frame)

                # 展示图片

                cv2.imshow('capture', frame)
                # 保存图片
                cv2.imwrite(r"C:\Users\83543\Desktop\videopic\\" + str(i) + ".jpg", frame)
                #

                res = ['beerbottle', 'glass', 'metal', 'waterbottle']
                 # 获取新模型最后的输出节点叫做final_result,可以从tensorboard中的graph中看到,其中名字后面的’:’之后接数字为EndPoints索引值(An operation allocates memory for its outputs, which are available on endpoints :0, :1, etc, and you can think of each of these endpoints as a Tensor.),通常情况下为0,因为大部分operation都只有一个输出。
                    # 遍历目录s
                    # for root, dirs, files in os.walk('C:/Users/83543/Desktop/vediopic'):  # 预测图片的位置

                image_data = tf.gfile.FastGFile("C:\\Users\83543\Desktop\\videopic\\"+str(i)+ ".jpg",'rb').read()  # Returns the contents of a file as a string.
                predictions = sess.run(softmax_tensor, {
                                'DecodeJpeg/contents:0': image_data})  # tensorboard中的graph中可以看到DecodeJpeg/contents是模型的输入变量名字
                predictions = np.squeeze(predictions)


                            # 展示图片
                            # img = plt.imread(image_path)#只能读png图,所以不能显示其他图片,训练非png图时把这段注释掉,他只是一个显示作用
                            # plt.imshow(img)
                            # plt.axis('off')
                            # plt.show()

                # top_k = predictions.argsort()[-2:][::-1]  # 概率最高的后2个,然后在倒排一下
                top_k = predictions.argsort()[-1:]
                for node_id in top_k:
                      score = predictions[node_id]
                      print('%s (score=%.5f)' % (res[node_id], score))
                print()
                i = i + 1
                if cv2.waitKey(1) & 0xFF == ord('q'):
                    break



# 创建一个图来存放google调整好的模型 inception_pretrain\classify_image_graph_def.pb
# 结果数组与C:\Users\admin\PycharmProjects\TensorFlowTestNew\TensorFlow\inception利用\output_labels.txt文件中的顺序要一致

if __name__ == '__main__':
    outmasages = CamaroCap()
    # 调用摄像头
    outmasages.Camaro_image()
    # 释放对象和销毁窗口
    outmasages.cap.release()
    cv2.destroyAllWindows()



部分结果图片:

在这里插入图片描述
训练集是白色玻璃罐,标签名字是glass。但是这个绿色的里面装了东西的也检测出来了。效果还可以。

  • 1
    点赞
  • 35
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
### 回答1: 您好!下面是使用 Python 控制摄像头并将拍摄的图片存储到数据库的一些指导思路: 1. 使用 Python 的 `cv2` 模块来访问摄像头。可以使用以下代码打开摄像头: ``` import cv2 # 打开摄像头 cap = cv2.VideoCapture(0) ``` 2. 通过循环捕获并显示摄像头中的帧。您可以使用以下代码: ``` while True: # 从摄像头中捕获帧 ret, frame = cap.read() # 显示帧 cv2.imshow('Camera', frame) # 按 'q' 键退出循环 if cv2.waitKey(1) & 0xFF == ord('q'): break # 释放摄像头 cap.release() # 销毁窗口 cv2.destroyAllWindows() ``` 3. 将捕获的图像保存到数据库中。您可以使用 Python 的 `sqlite3` 模块来连接并操作 SQLite 数据库。下面是一些示例代码,假设您已经创建了一个名为 `images` 的数据表,其中包含了一个名为 `image` 的 `BLOB` 类型的列,用于保存图像数据: ``` import sqlite3 import cv2 import numpy as np # 连接到 SQLite 数据库 conn = sqlite3.connect('database.db') # 获取一个游标 cursor = conn.cursor() # 打开摄像头 cap = cv2.VideoCapture(0) while True: # 从摄像头中捕获帧 ret, frame = cap.read() # 将帧转换 ### 回答2: 要通过Python控制摄像头并将拍摄的图片记录到数据库,首先需要安装相关的库。常用的库包括OpenCV和MySQL Connector。 首先,我们需要使用OpenCV库来控制摄像头。通过使用cv2.VideoCapture()函数,我们可以打开摄像头并读取视频流。然后,我们可以使用cv2.imshow()函数来显示视频流,并使用cv2.waitKey()函数来等待用户按下“拍摄”按钮。 当用户按下拍摄按钮时,我们可以使用cv2.imencode()函数将当前帧编码成图片格式。然后,我们可以将这个图片保存到指定的文件夹中。接着,我们可以使用MySQL Connector库来连接数据库,并将图片的文件名、拍摄时间等信息插入到数据库中。 在插入数据库之前,我们需要先创建一个数据库表。可以使用SQL语句创建一个包含文件名、拍摄时间等字段的表。然后,使用MySQL Connector来连接数据库,执行插入数据的SQL语句,将图片的信息插入到数据库中。 总结起来,控制摄像头并将拍摄的图片记录到数据库的步骤如下: 1. 导入OpenCV和MySQL Connector库。 2. 使用cv2.VideoCapture()打开摄像头并读取视频流。 3. 使用cv2.imshow()显示视频流,并使用cv2.waitKey()等待用户按下“拍摄”按钮。 4. 当用户按下“拍摄”按钮时,使用cv2.imencode()将当前帧编码成图片格式,并保存到指定的文件夹中。 5. 创建一个数据库表,包含文件名、拍摄时间等字段。 6. 使用MySQL Connector连接数据库,并执行插入数据的SQL语句,将图片的信息插入到数据库中。 通过以上步骤,我们可以实现通过Python控制摄像头,并将拍摄的图片记录到数据库。 ### 回答3: Python可以通过调用相应的库来控制摄像头,并且可以将拍摄的图片记录到数据库中。 首先,需要安装相应的摄像头驱动或者使用系统默认的驱动。接下来,使用Python的OpenCV库可以方便地操作摄像头。 1. 安装OpenCV库。可以通过pip命令安装OpenCV库:pip install opencv-python 2. 导入OpenCV库。在Python代码中引入OpenCV库:import cv2 3. 打开摄像头。使用cv2.VideoCapture函数可以打开摄像头,例如:cap = cv2.VideoCapture(0)。这里的0是代表系统默认的摄像头,如果有多个摄像头可以通过更改参数来选择不同的摄像头。 4. 捕捉图像。使用cv2库中的read方法可以从摄像头中读取图像,例如:ret, frame = cap.read()。其中,ret是一个空值,frame是捕捉到的图像帧。 5. 将图像保存到本地。使用cv2库的imwrite方法可以将图像保存到指定的路径,例如:cv2.imwrite('image.jpg', frame)。这里的'image.jpg'是要保存的图片路径,frame是捕捉到的图像帧。 6. 将图像保存到数据库。可以使用Python数据库连接库,如MySQLdb库,连接到数据库,并将图像路径和相关信息记录到数据库表中。 以上就是使用Python控制摄像头,并将拍摄的图片记录到数据库的基本步骤。根据实际需求,可以进一步扩展功能,如在图像中进行图像处理、人脸识别等。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值