如何用Pytorch提取视频单帧网络特征+SVM分类 - 非End-to-End

最新推荐文章于 2024-06-23 16:19:59 发布

genous110

最新推荐文章于 2024-06-23 16:19:59 发布

阅读量2k

点赞数

分类专栏： python学习数据读取

python学习同时被 2 个专栏收录

35 篇文章 1 订阅

订阅专栏

数据读取

10 篇文章 1 订阅

订阅专栏

1、提取网络特征

import os
os.environ[‘CUDA_VISIBLE_DEVICES’] = ‘3’
os.system(‘echo $CUDA_VISIBLE_DEVICES’)

import torch
import torch.nn as nn
from torchvision import transforms, models
from torch.autograd import Variable

import numpy as np
from PIL import Image

def pre_image(image_path):
trans = transforms.Compose([transforms.Resize(256),
transforms.CenterCrop(224),
transforms.ToTensor()])

img = Image.open(image_path)
img = trans(img)
x = Variable(torch.unsqueeze(img,dim=0).float(),requires_grad=False).cuda()
return x

model = models.resnet152(pretrained=True).cuda()
extractor = nn.Sequential(*list(model.children())[:-1])

feature_path = ‘/data/FrameFeature/Penn/’
video_path = ‘/home/UPenn_RGB/frames/’
for video in os.listdir(video_path):
for frame in os.listdir(os.path.join(video_path,video)):
image_path = video_path+video+’/’+frame
x = pre_image(image_path)
y = extractor(x)
y = y.data.cpu().numpy().reshape(1,2048)
if not os.path.exists(feature_path+video):
os.mkdir(feature_path+video)
np.savetxt(feature_path+video+’/’+frame.split(’.’)[0]+’.txt’,y,delimiter=’,’)
print video
2、时域pooling以及SVM分类器训练

import os
import numpy as np
import h5py
from sklearn import svm

def load_feature(video_name):
frames = os.listdir(video_name)
feature = []
for frame in frames:
frame_path = os.path.join(video_name,frame)
feature.append(np.loadtxt(frame_path,delimiter=’,’))
feature = np.asarray(feature)
return feature

def mean_pool(feature):
return np.mean(feature,axis=0)

def max_pool(feature):
return np.max(feature,axis=0)

def min_pool(feature):
return np.min(feature,axis=0)

if name == ‘main’:
‘’’ Save Data ‘’’
# with open(’/data/FrameFeature/Penn_train.txt’,‘r’) as fp:
# mean_feat,max_feat,min_feat,diff_feat,dyna_feat,label=[],[],[],[],[],[]
# for line in fp.readlines():
# video_name = line.strip().split(’ ‘)[0]
# video_label= int(line.strip().split(’ ‘)[1])
# video_name = ‘/data/FrameFeature/Penn/’+video_name
# print video_name+’\ttrain’
# feature = load_feature(video_name)
# mean_feat.append(mean_pool(feature))
# max_feat.append(max_pool(feature))
# min_feat.append(min_pool(feature))
# diff_feat.append(sum_diff_pool(feature))
# dyna_feat.append(dynamic_pool(feature))
# label.append(video_label)
# train_mean = np.asarray(mean_feat); del mean_feat
# train_max = np.asarray(max_feat); del max_feat
# train_min = np.asarray(min_feat); del min_feat
# train_diff = np.asarray(diff_feat); del diff_feat
# train_dyna = np.asarray(dyna_feat); del dyna_feat
# train_label= np.asarray(label); del label
# h5file = h5py.File(’/data/FrameFeature/Penn_train.h5’,‘w’)
# h5file.create_dataset(‘train_mean’,data=train_mean)
# h5file.create_dataset(‘train_max’,data=train_max)
# h5file.create_dataset(‘train_min’,data=train_min)
# h5file.create_dataset(‘train_diff’,data=train_diff)
# h5file.create_dataset(‘train_dyna’,data=train_dyna)
# h5file.create_dataset(‘train_label’,data=train_label)
# h5file.close()
#
#
# with open(’/data/FrameFeature/Penn_test.txt’,‘r’) as fp:
# mean_feat,max_feat,min_feat,diff_feat,dyna_feat,label=[],[],[],[],[],[]
# for line in fp.readlines():
# video_name = line.strip().split(’ ‘)[0]
# video_label= int(line.strip().split(’ ‘)[1])
# video_name = ‘/data/FrameFeature/Penn/’+video_name
# print video_name+’\ttest’
# feature = load_feature(video_name)
# mean_feat.append(mean_pool(feature))
# max_feat.append(max_pool(feature))
# min_feat.append(min_pool(feature))
# diff_feat.append(sum_diff_pool(feature))
# dyna_feat.append(dynamic_pool(feature))
# label.append(video_label)
# test_mean = np.asarray(mean_feat); del mean_feat
# test_max = np.asarray(max_feat); del max_feat
# test_min = np.asarray(min_feat); del min_feat
# test_diff = np.asarray(diff_feat); del diff_feat
# test_dyna = np.asarray(dyna_feat); del dyna_feat
# test_label= np.asarray(label); del label
# h5file = h5py.File(’/data/FrameFeature/Penn_test.h5’,‘w’)
# h5file.create_dataset(‘test_mean’,data=test_mean)
# h5file.create_dataset(‘test_max’,data=test_max)
# h5file.create_dataset(‘test_min’,data=test_min)
# h5file.create_dataset(‘test_diff’,data=test_diff)
# h5file.create_dataset(‘test_dyna’,data=test_dyna)
# h5file.create_dataset(‘test_label’,data=test_label)
# h5file.close()
‘’’ Read Data ‘’’
h5file = h5py.File(’/data/FrameFeature/Penn_train.h5’,‘r’)
train_mean = h5file[‘train_mean’][:]
train_max = h5file[‘train_max’][:]
train_min = h5file[‘train_min’][:]
train_diff = h5file[‘train_diff’][:]
train_dyna = h5file[‘train_dyna’][:]
train_label= h5file[‘train_label’][:]
h5file.close()

h5file = h5py.File('/data/FrameFeature/Penn_test.h5','r')
test_mean = h5file['test_mean'][:]
test_max  = h5file['test_max'][:]
test_min  = h5file['test_min'][:]
test_diff = h5file['test_diff'][:]
test_dyna = h5file['test_dyna'][:]
test_label= h5file['test_label'][:]
h5file.close()

''' Train SVM '''
SVM = svm.SVC(kernel='linear')
# Mean
SVM.fit(train_mean, train_label)
print 'Mean: ' + str(SVM.score(test_mean, test_label))
# Max
SVM.fit(train_max, train_label)
print 'Max: ' + str(SVM.score(test_max, test_label))
# Min
SVM.fit(train_min, train_label)
print 'Min: ' + str(SVM.score(test_min, test_label))

作者：Tsingzao-于廷照
来源：CSDN
原文：https://blog.csdn.net/yutingzhaomeng/article/details/80443627
版权声明：本文为博主原创文章，转载请附上博文链接！

genous110

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
如何用Pytorch提取视频单帧网络特征+SVM分类 - 非End-to-End

1、提取网络特征import osos.environ[‘CUDA_VISIBLE_DEVICES’] = ‘3’os.system(‘echo $CUDA_VISIBLE_DEVICES’)import torchimport torch.nn as nnfrom torchvision import transforms, modelsfrom torch.autograd im...
复制链接

扫一扫

专栏目录