牛!Python 也能实现图像姿态识别溺水行为了!

作者 | 李秋键

责编 | Carol

封图 | CSDN 下载自视觉中国

众所周知随着人工智能智能的发展,人工智能的落地项目也在变得越来越多,尤其是计算机视觉方面。

所以今天我们也是做一个计算机视觉方面的训练,用python来判断用户溺水行为,结合姿态识别和图像识别得到结果。其中包括姿态识别和图像分类。

首先图像分类是根据各自在图像信息中所反映的不同特征,把不同类别的目标区分开来的图像处理方法。它是利用计算机对图像进行定量分析,把图像或图像中的每个像元或区域划归为若干个类别中的某一种,以代替人的视觉判读

人体姿态是被主要分为基于计算机视角的识别和基于运动捕获技术的识别。基于计算机视觉的识别主要通过各种特征信息来对人体姿态动作进行识别, 比如视频图像序列、人体轮廓、多视角等。

这里整体程序的流程如下:

  1. 百度姿态识别图片并标注

  2. CNN网络实现图像分类

  3. 根据分类结果可视化输出结果

最终输出的程序效果如下图:

一、实验前的准备

首先我们使用的python版本是3.6.5所用到的模块如下:

OpenCV:用来调用姿态识别接口绘制姿态识别结果

Baidu-aip:用来加载人体分析模块实现人体姿态识别

configparser :配置文件模块 读写配置文件

keras:用来训练和调用神经网络模型


素材准备

首先我们准备不同的图片放到一个特定文件夹下。图片分为三个类别,一个是溺水图片文件夹,一个是正常游泳图片文件夹,另一个是疑似溺水无法判定的图片文件夹。在这里我们把它放到data文件夹下,

其中疑似图片文件夹,如下图可见:

人体姿态识别搭建

1、姿态配置文件设定:

在这里为了足够的精度和方便调用,我们使用百度提供的人体分析接口。按照官方的规定设定了配置文件。主要就是设定人体各个肢体零件连接配置。

其对应的代码如下:

def draw_line(self, img):
        # nose ---> neck
        cv2.line(img, (int(self.dic['nose']['x']), int(self.dic['nose']['y'])),
                 (int(self.dic['neck']['x']), int(self.dic['neck']['y'])), (0, 255, 0), 2)
        # neck --> left_shoulder
        cv2.line(img, (int(self.dic['neck']['x']), int(self.dic['neck']['y'])),
                 (int(self.dic['left_shoulder']['x']), int(self.dic['left_shoulder']['y'])), (0, 255, 0), 2)
        # neck --> right_shoulder
        cv2.line(img, (int(self.dic['neck']['x']), int(self.dic['neck']['y'])),
                 (int(self.dic['right_shoulder']['x']), int(self.dic['right_shoulder']['y'])), (0, 255, 0), 2)
        # left_shoulder --> left_elbow
        cv2.line(img, (int(self.dic['left_shoulder']['x']), int(self.dic['left_shoulder']['y'])),
                 (int(self.dic['left_elbow']['x']), int(self.dic['left_elbow']['y'])), (0, 255, 0), 2)
        # left_elbow --> left_wrist
        cv2.line(img, (int(self.dic['left_elbow']['x']), int(self.dic['left_elbow']['y'])),
                 (int(self.dic['left_wrist']['x']), int(self.dic['left_wrist']['y'])), (0, 255, 0), 2)
        # right_shoulder --> right_elbow
        cv2.line(img, (int(self.dic['right_shoulder']['x']), int(self.dic['right_shoulder']['y'])),
                 (int(self.dic['right_elbow']['x']), int(self.dic['right_elbow']['y'])), (0, 255, 0), 2)
        # right_elbow --> right_wrist
        cv2.line(img, (int(self.dic['right_elbow']['x']), int(self.dic['right_elbow']['y'])),
                 (int(self.dic['right_wrist']['x']), int(self.dic['right_wrist']['y'])), (0, 255, 0), 2)
        # neck --> left_hip
        cv2.line(img, (int(self.dic['neck']['x']), int(self.dic['neck']['y'])),
                 (int(self.dic['left_hip']['x']), int(self.dic['left_hip']['y'])), (0, 255, 0), 2)
        # neck --> right_hip
        cv2.line(img, (int(self.dic['neck']['x']), int(self.dic['neck']['y'])),
                 (int(self.dic['right_hip']['x']), int(self.dic['right_hip']['y'])), (0, 255, 0), 2)
        # left_hip --> left_knee
        cv2.line(img, (int(self.dic['left_hip']['x']), int(self.dic['left_hip']['y'])),
                 (int(self.dic['left_knee']['x']), int(self.dic['left_knee']['y'])), (0, 255, 0), 2)
        # right_hip --> right_knee
        cv2.line(img, (int(self.dic['right_hip']['x']), int(self.dic['right_hip']['y'])),
                 (int(self.dic['right_knee']['x']), int(self.dic['right_knee']['y'])), (0, 255, 0), 2)
        # left_knee --> left_ankle
        cv2.line(img, (int(self.dic['left_knee']['x']), int(self.dic['left_knee']['y'])),
                 (int(self.dic['left_ankle']['x']), int(self.dic['left_ankle']['y'])), (0, 255, 0), 2)
        # right_knee --> right_ankle
        cv2.line(img, (int(self.dic['right_knee']['x']), int(self.dic['right_knee']['y'])),
                 (int(self.dic['right_ankle']['x']), int(self.dic['right_ankle']['y'])), (0, 255, 0), 2)

2、姿态识别调用:

在设置好基本的配置文件后,我们通过百度申请的账号密匙等等调用接口即可。这里实现的效果如下:

 

对应代码如下:

class BaiDuAPI(object):
    # 特殊 构造函数 初始化函数
    def __init__(self):
        app_id ="20038443"
        api_key = "LhtctcN7hf6VtkHHcUGwXKfw"
        secret_key = "wzWACH340kE0FGhvA9CqWsiRwltf5wFE"
        self.client = AipBodyAnalysis(app_id, api_key, secret_key)
    """ 读取图片 """
    def get_file_content(self, photoPath):
        with open(photoPath, 'rb') as fp:
            return fp.read()
    """ 主函数 """
    def file_main(self, photoPath):
        img = self.get_file_content('{}'.format(photoPath))
        """ 调用人体关键点识别 """
        # 此处只能对一个人进行关键点识别
        # 也就是说一个图片如果有好多人的话,只能标出一个人的关节特征
        # 此处可以做修改,即进行把一张图所有人的关节特征都表达出来
        # ------
        #        print(self.client.bodyAnalysis(img))
        result = self.client.bodyAnalysis(img)['person_info'][0]['body_parts']
        jo = joint.Joint(result)
        jo.xunhun(photoPath)
        # print(result )

CNN识别模型的建立

1、神经网络的搭建:

这里设定的CNN模型挺常见的模型相似,通过设定卷积核、步长、训练批次等等搭建网络。

代码如下:

model = Sequential() #创建一个神经网络对象
#添加一个卷积层,传入固定宽高三通道的图片,以32种不同的卷积核构建32张特征图,
# 卷积核大小为3*3,构建特征图比例和原图相同,激活函数为relu函数。
model.add(Conv2D(input_shape=(IMG_W,IMG_H,3),filters=32,kernel_size=3,padding='same',activation='relu'))
#再次构建一个卷积层
model.add(Conv2D(filters=32,kernel_size=3,padding='same',activation='relu'))
#构建一个池化层,提取特征,池化层的池化窗口为2*2,步长为2。
model.add(MaxPool2D(pool_size=2,strides=2))
#继续构建卷积层和池化层,区别是卷积核数量为64。
model.add(Conv2D(filters=64,kernel_size=3,padding='same',activation='relu'))
model.add(Conv2D(filters=64,kernel_size=3,padding='same',activation='relu'))
model.add(MaxPool2D(pool_size=2,strides=2))
#继续构建卷积层和池化层,区别是卷积核数量为128。
model.add(Conv2D(filters=128,kernel_size=3,padding='same',activation='relu'))
model.add(Conv2D(filters=128,kernel_size=3,padding='same',activation='relu'))
model.add(MaxPool2D(pool_size=2, strides=2))
model.add(Flatten()) #数据扁平化
model.add(Dense(128,activation='relu')) #构建一个具有128个神经元的全连接层
model.add(Dense(64,activation='relu')) #构建一个具有64个神经元的全连接层
model.add(Dropout(DROPOUT_RATE)) #加入dropout,防止过拟合。
model.add(Dense(CLASS,activation='softmax')) #输出层,一共3个神经元,对应3个分类
adam = Adam(lr=LEARNING_RATE) #创建Adam优化器
model.compile(optimizer=adam,loss='categorical_crossentropy',metrics=['accuracy']) #使用交叉熵代价函数,adam优化器优化模型,并提取准确率
train_generator = train_datagen.flow_from_directory( #设置训练集迭代器
    TRAIN_PATH, #训练集存放路径
    target_size=(IMG_W,IMG_H), #训练集图片尺寸
    batch_size=BATCH_SIZE #训练集批次
    )
test_generator = test_datagen.flow_from_directory( #设置测试集迭代器
    TEST_PATH, #测试集存放路径
    target_size=(IMG_W,IMG_H), #测试集图片尺寸
    batch_size=BATCH_SIZE, #测试集批次
    )
print(train_generator.class_indices) #打印迭代器分类
try:
    model = load_model('{}.h5'.format(SAVE_PATH))  #尝试读取训练好的模型,再次训练
    print('model upload,start training!')
except:
    print('not find model,start training') #如果没有训练过的模型,则从头开始训练
model.fit_generator( #模型拟合
                    train_generator,  #训练集迭代器
                    steps_per_epoch=len(train_generator), #每个周期需要迭代多少步
                    epochs=EPOCHS, #迭代周期
                    validation_data=test_generator, #测试集迭代器
                    validation_steps=len(test_generator) #测试集迭代多少步
                    )
model.save('{}.h5'.format(SAVE_PATH)) #保存模型
print('finish {} epochs!'.format(EPOCHS))
2、模型的调用:

同训练的步骤相似,这里我们首先也是是通过调用百度姿态识别进行图片人体分析,然后分类预测结果。

代码如下:

# 载入模型
model = load_model('model_selector.h5')
label = np.array(['正常','疑似','溺水'])
def image_change(image):
 image = image.resize((224, 224))
 image = img_to_array(image)
 image = image / 255
 image = np.expand_dims(image, 0)
 return image
class BaiDuAPI(object):
    # 特殊 构造函数 初始化函数
    def __init__(self):
        app_id ="20038443"
        api_key = "LhtctcN7hf6VtkHHcUGwXKfw"
        secret_key = "wzWACH340kE0FGhvA9CqWsiRwltf5wFE"
        self.client = AipBodyAnalysis(app_id, api_key, secret_key)
    """ 读取图片 """
    def get_file_content(self, photoPath):
        with open(photoPath, 'rb') as fp:
            return fp.read()
    """ 主函数 """
    def file_main(self, photoPath):
        img = self.get_file_content('{}'.format(photoPath))
        """ 调用人体关键点识别 """
        # 此处只能对一个人进行关键点识别
        # 也就是说一个图片如果有好多人的话,只能标出一个人的关节特征
        # 此处可以做修改,即进行把一张图所有人的关节特征都表达出来
        # ------
        #        print(self.client.bodyAnalysis(img))
        result = self.client.bodyAnalysis(img)['person_info'][0]['body_parts']
        jo = joint.Joint(result)
        jo.xunhun(photoPath)
        # print(result )
#预测2.jpg的结果
try:
    image = load_img("2.jpg")
    #plt.imshow(image)
    image = image_change(image)
    baiduapi = BaiDuAPI()
    baiduapi.file_main('2.jpg')
    img=cv2.imread("temp.jpg")
    img_PIL = Image.fromarray(cv2.cvtColor(img, cv2.COLOR_BGR2RGB))
    myfont = ImageFont.truetype(r'C:/Windows/Fonts/simfang.ttf', 40)
    draw = ImageDraw.Draw(img_PIL)
    draw.text((300, 10), label[model.predict_classes(image)][0], font=myfont, fill=(200, 100, 0))
    img_OpenCV = cv2.cvtColor(np.asarray(img_PIL), cv2.COLOR_RGB2BGR)
    cv2.imshow('frame', img_OpenCV)
    cv2.waitKey(0)
except:
    pass
#预测1.jpg的结果
try:
    image = load_img("1.jpg")
    #plt.imshow(image)
    image = image_change(image)
    baiduapi = BaiDuAPI()
    baiduapi.file_main('1.jpg')
    img=cv2.imread("temp.jpg")
    img_PIL = Image.fromarray(cv2.cvtColor(img, cv2.COLOR_BGR2RGB))
    myfont = ImageFont.truetype(r'C:/Windows/Fonts/simfang.ttf', 40)
    draw = ImageDraw.Draw(img_PIL)
    draw.text((300, 10), label[model.predict_classes(image)][0], font=myfont, fill=(200, 100, 0))
    img_OpenCV = cv2.cvtColor(np.asarray(img_PIL), cv2.COLOR_RGB2BGR)
    cv2.imshow('frame', img_OpenCV)
    cv2.waitKey(0)
except:
    pass
#预测3.jpg的结果
try:
    image = load_img("3.jpg")
    #plt.imshow(image)
    image = image_change(image)
    baiduapi = BaiDuAPI()
    baiduapi.file_main('3.jpg')
    img=cv2.imread("temp.jpg")
    img_PIL = Image.fromarray(cv2.cvtColor(img, cv2.COLOR_BGR2RGB))
    myfont = ImageFont.truetype(r'C:/Windows/Fonts/simfang.ttf', 40)
    draw = ImageDraw.Draw(img_PIL)
    draw.text((300, 10), label[model.predict_classes(image)][0], font=myfont, fill=(200, 100, 0))
    img_OpenCV = cv2.cvtColor(np.asarray(img_PIL), cv2.COLOR_RGB2BGR)
    cv2.imshow('frame', img_OpenCV)
    cv2.waitKey(0)
except:
    pass

最终运行程序结果如下:

源码地址:

https://pan.baidu.com/s/1qMwPCTTyqDWPXoPj1XnKgA

提取码:us2k

作者简介:

李秋键,CSDN博客专家,CSDN达人课作者。硕士在读于中国矿业大学,开发有taptap竞赛获奖等等。

推荐阅读
你点的每个“在看”,我都认真当成了AI
  • 12
    点赞
  • 81
    收藏
    觉得还不错? 一键收藏
  • 7
    评论
OpenCV(开源计算机视觉库)是一个开源计算机视觉和机器学习软件库。OpenCV的构建旨在为计算机视觉应用程序提供通用的基础结构,并加速在商业产品中使用机器感知。作为BSD许可的产品,OpenCV使企业可以轻松地使用和修改代码。 该库具有2500多种优化算法,其中包括一整套经典和最新的计算机视觉和机器学习算法。这些算法可用于检测和识别人脸,识别对象,对视频中的人为行为进行分类,跟踪摄像机的运动,跟踪运动的对象,提取对象的3D模型,从立体摄像机生成3D点云,将图像拼接在一起以产生高分辨率整个场景的图像,从图像数据库中查找相似的图像,从使用闪光灯拍摄的图像中消除红眼,跟随眼睛的运动,识别风景并建立标记以将其与增强现实叠加在一起等。OpenCV拥有超过4.7万人的用户社区,下载量估计超过1800万。该库在公司,研究小组和政府机构中得到广泛使用。 除了使用该库的Google,Yahoo,Microsoft,Intel,IBM,Sony,Honda,Toyota之类的知名公司外,还有许多应用创业公司,Applied Minds,VideoSurf和Zeitera等都在广泛使用OpenCV。OpenCV的部署用途包括将街景图像拼接在一起,检测以色列监视视频中的入侵,监视中国的矿山设备,帮助机器人在Willow Garage导航和拾取物体,检测欧洲游泳池溺水事故,在西班牙和纽约,在土耳其检查跑道上的碎屑,检查世界各地工厂产品上的标签,然后在日本进行快速面部识别。 它具有C ++,Python,Java和MATLAB接口,并支持Windows,Linux,Android和Mac OS。OpenCV主要倾向于实时视觉应用,并在可用时利用MMX和SSE指令。 目前,正在积极开发功能齐全的CUDA和OpenCL接口。有500多种算法,而构成或支持这些算法的功能大约是其10倍。OpenCV用C ++原生编写,并具有可与STL容器无缝配合的模板化接口。
图像轮廓识别是一种常见的图像处理技术,可以用于物体检测、边缘检测、模式识别等领域。Python中的OpenCV库提供了丰富的图像处理功能,包括图像轮廓识别功能。下面介绍如何使用Python Opencv实现图像轮廓识别功能。 1. 导入库 首先需要导入OpenCV库。可以使用以下代码导入: ```python import cv2 import numpy as np ``` 2. 读取图像并转化为灰度图像 使用cv2.imread()函数读取图像,并使用cv2.cvtColor()函数将图像转化为灰度图像。代码如下: ```python img = cv2.imread("image.jpg") gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) ``` 3. 进行图像处理 在进行轮廓识别前,需要对图像进行一些处理,如图像平滑、二值化等。这里使用cv2.GaussianBlur()函数进行高斯平滑处理,并使用cv2.threshold()函数进行二值化处理。代码如下: ```python blur = cv2.GaussianBlur(gray, (5, 5), 0) ret, binary = cv2.threshold(blur, 127, 255, cv2.THRESH_BINARY) ``` 4. 进行轮廓识别 使用cv2.findContours()函数进行轮廓识别。该函数返回一个轮廓列表和一个层次结构。代码如下: ```python contours, hierarchy = cv2.findContours(binary, cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE) ``` 5. 绘制轮廓 使用cv2.drawContours()函数绘制轮廓。代码如下: ```python cv2.drawContours(img, contours, -1, (0, 255, 0), 2) ``` 6. 显示图像 使用cv2.imshow()函数显示图像,并使用cv2.waitKey()函数等待按键。代码如下: ```python cv2.imshow("image", img) cv2.waitKey(0) cv2.destroyAllWindows() ``` 完整代码如下: ```python import cv2 import numpy as np img = cv2.imread("image.jpg") gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) blur = cv2.GaussianBlur(gray, (5, 5), 0) ret, binary = cv2.threshold(blur, 127, 255, cv2.THRESH_BINARY) contours, hierarchy = cv2.findContours(binary, cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE) cv2.drawContours(img, contours, -1, (0, 255, 0), 2) cv2.imshow("image", img) cv2.waitKey(0) cv2.destroyAllWindows() ``` 运行代码后,将显示原图像和识别出的轮廓。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值