- 博客(267)
- 资源 (15)
- 收藏
- 关注
原创 face_recognition实现人脸相似度比较
face_recognitionface_recognition 是github上一个非常有名气的人脸识别开源工具包,我们可以通过以下指令安装到python环境内$ pip install face_recognition加载人脸图片image = face_recognition.load_image_file(src)获取图片人脸定位[(top,right,bottom,left )]face_locations = face_recognition.face_locations(i.
2021-10-29 15:33:13 8975 1
原创 目标检测_利用tensorflow2官方案例-自定义训练目标进行人眼识别
我的数据集:说明:我的数据集一共1035张,并非通过手动标记得到,因此不包含xml文件包含:图片文件,train.csv,test.csv。(图片位置,标记位置,目标名称等)说明:数据集本人通过制作而成,只供学习使用,不得私自滥用。链接:https://pan.baidu.com/s/18FdxUHiLnD1B52Jpt4QC6g提取码:zw6b效果展示:单眼模型效果双眼模型效果工程目录:...
2021-05-31 11:58:47 1723 12
原创 Python音频转文字
import speech_recognition as srfile ="test.wav"r= sr.Recognizer()with sr.AudioFile(file) as src: audio = r.record(src)print("音声データの文字をお越し結果:", r.recognize_google(audio,language="ja"))speech_recognition:https://github.com/Uberi/speech_recognition
2021-01-02 22:34:55 1329 2
原创 Python文字转音频
英语转语音from gtts import gTTSdef get_english_audio(text): tts = gTTS(text) return ttstext="This is a cat!"data = get_english_audio(text)data.save("eg.mp3")汉语转语音from gtts import gTTSdef get_chinese_audio(text): tts = gTTS(text,lang="zh-tw"
2021-01-02 17:29:22 273
原创 日语动词的13种变形
五段动词 一类动词辞书形 ます形 て形 た形 ない形 意志形 可能形 行く 行きます 行って 行った 行かない 行こう 行ける 書く 書きます 書いて 書いた 書かない 書こう 書ける 買う 買います 買って 買った 買わない 買おう 買える 假定形 被动形 使...
2019-06-26 17:44:22 15506 1
原创 Python 爬虫模块py2x与py3x差异
try: import urllib2#version2.xexcept: import urllib.request#version3.x import urllib.errortry: import urllib#version2.xexcept: import urllib.request#version3.x import urll...
2018-11-27 11:19:30 174
原创 [点云学习] 一、点云相关知识了解
点云是一种表示三维空间中对象的数据结构,它由许多离散的点组成。每个点都有自己的位置坐标和可能的其他属性,如颜色、法向量和强度等。点云通常由激光扫描仪、相机或其他传感器捕获,用于创建三维模型、地图或进行遥感分析。在计算机视觉和机器学习领域,点云也被广泛应用于目标检测、物体识别、3D重建和虚拟现实等方面。
2023-05-16 14:55:50 4999
原创 torch 网络模型转换onnx格式,并可视化
1. 网络模型结构2. 转为onnx格式3. 通过netron查看网络结构3.1 netron安装3.2 netron可视化
2022-06-08 14:10:49 1224 1
原创 tensorflow2.0 and pytorch 评价指标
1. pytorchimport torchimport torch.nn as nnimport torch.optim as optimimport torch.nn.functional as Fimport torchvisionfrom torch.autograd import Variableimport torchvision.datasets as datasetsimport torchvision.models as modelsimport torchvision.
2022-03-24 15:22:08 2180
原创 利用卷积反卷积实现图片自编码器
手写数字from tensorflow.keras.layers import Conv2D,MaxPooling2D,Input,Conv2DTranspose,Flatten,Densefrom tensorflow.keras.optimizers import Adamfrom tensorflow.keras.models import Sequential,Model,load_modelimport tensorflow as tfimport numpy as npimport
2022-01-03 13:16:10 973
原创 图像分类卷积神经网络
1. lenet5def lenet5_1(input_shape,classiers_n): #lenet5 inputShape = input_shape model = tf.keras.Sequential([ Conv2D(filters=16,kernel_size=(5,5),padding='valid',activation='relu',input_shape=inputShape), AveragePooling2D(pool_si
2022-01-03 12:17:54 851 1
原创 Pytorch手写数字识别
1. 数据集每个目录下对应数字1000张左右2. 训练#coding=utf-8import torchvisionfrom torchvision import datasets, transforms import torchimport torch.nn as nnimport torch.nn.functional as Fimport torch.optim as optimfrom torch.autograd import Variableimport matplotl
2021-12-09 17:01:22 1435 4
原创 使用卷积神经网络实现简易的语音分类的对话系统
一、思路1.收集简单的语音词汇,数量越多越好,当做数据集。2. 为每个词汇建立词汇内容的标签,建立一个字典,键值为文本词语,键为数字标签,训练时只能使用数字表示。3.建立卷积神经网络或其他网络4.提取音频特征,对应上标签进行训练,输出训练模型5.利用输出的模型对音频文件进行预测6.根据预测的结果,对应相应的回答的音频文件,做出应答。1.数据集收集说明:数据集过小,只是进行网络测试,实际数据较多;而且这里的音频数据都是通过软件合成的数据,比较理想,适合新人学习使用。2. 建立一个映射
2021-12-08 15:48:19 1291
原创 Python 声音降噪
录音文件降噪from scipy.io import wavfileimport noisereduce as nrimport pyaudio import timeimport waverate, data = wavfile.read("001.wav")_,noisy_part = wavfile.read("noise.wav")SAMPLING_FREQUENCY=16000reduced_noise = nr.reduce_noise(y=data, y_noise=noi
2021-11-18 16:06:23 9244 9
原创 自编码器_【手写数字】
自编码器import tensorflow as tffrom tensorflow.keras.layers import Densefrom tensorflow.keras.models import Model import matplotlib.pyplot as pltimport numpy as npprint ("start")def train_model(): mnist=tf.keras.datasets.mnist #获取数据,训练集,测试集
2021-11-16 11:18:16 2158
原创 Linux Mediapipe安装
下载Mediapipe安装bazel升级gcc到gcc8安装opencvhttps://files.pythonhosted.org/packages/1b/82/f4f0e73505fb3a54f974c926bce9f9fe250e50eb57d886daf9042cec0d9b/opencv-contrib-python-4.5.4.58.tar.gzpip3 install -i https://pypi.tuna.tsinghua.edu.cn/simple scikit-build参
2021-11-08 08:42:30 3343
原创 jetbot 小车配置
小车组装参考,https://www.bilibili.com/video/BV1Qb4y1C7cj?from=search&seid=3700412571447605611&spm_id_from=333.337.0.0Ubuntu系统安装系统下载地址,https://developer.nvidia.com/embedded/downloads系统安装参考,https://blog.csdn.net/qq_36780295/article/details/108449150
2021-11-04 15:39:45 628
原创 利用dlib库实现嘴巴位置识别
所需模块安装pip3 install python-opencvpip3 install dlibpip3 install imutils dlib面部关键点信息图我们实现的是嘴巴识别,关键的开始与结束点为49-67。dlib获取嘴巴位置# -*- coding=utf-8 -*-import cv2import dlibimport osfrom imutils import face_utilsshape_detector_path = os.path.join("mod
2021-11-01 21:23:55 1513
转载 训练模型并重建人脸
https://blog.csdn.net/weixin_41943311/article/details/102370766
2021-10-26 10:27:19 164
原创 ResNet50网络
自从ResNet在2015年被提出,在ImageNet比赛classification任务上获得第一名,因为它“简单与实用”并存,之后很多方法都建立在ResNet50或者ResNet101的基础上完成的,检测,分割,识别等领域都纷纷使用ResNet,Alpha zero也使用了ResNet,所以可见ResNet确实很好用。Resnets50 网络结构示意图ResNet50和ResNet101对比...
2021-10-26 09:00:24 726
原创 cv2嵌入PyQt显示图像与视频
import sys, osfrom PyQt5 import QtCore, QtWidgets, QtGuifrom PyQt5.QtWidgets import *from PyQt5.QtGui import *import cv2class CV2_PYQT_Window(QDialog): def __init__(self,src,target="video",parent=None): super(CV2_PYQT_Window,self).__init
2021-10-12 10:49:46 3128
原创 图片处理后进行Kmeans聚类
import randomfrom sklearn import datasetsimport numpy as npimport matplotlib.pyplot as pltfrom mpl_toolkits.mplot3d import Axes3Dimport cv2import numpy as npimport matplotlib.pyplot as pltimport pandas as pdfrom sklearn.cluster import KMeansfrom
2021-10-01 11:59:50 216
原创 Python 对图片RGB进行分离与重组
图片组成[[[245 227 220][245 226 219][245 227 220]…[ 82 123 78][ 83 125 78][ 88 131 80]],[[…]],…]分离RGB值def writeFile(X,filename): if filename!="": with open(filename,"w")as f: json.dump(X,f,indent=4)def getMatrixRGB(
2021-10-01 11:06:26 1043
原创 Python必会操作
命令行参数import sysimport cv2def show_pic(img): cv2.imshow('image',img) cv2.waitKey(0) cv2.destroyAllWindows()def main(): print("start") print (sys.argv) image_1 = sys.argv[1] image_2 = sys.argv[2] src = cv2.imread(image_1) show_
2021-07-24 07:42:37 170 2
原创 HTML使用layer弹出提示框
下载layer下载地址,https://layer.layui.com/说明弹出框依赖组件下载jquery下载地址,https://jquery.com/download/说明 jQuery 是一个 JavaScript 函数库,jQuery 库可以通过一行简单的标记被添加到网页中。下载bootstrap下载地址,https://getbootstrap.com/说明提示框不需要依赖这个框架,它是提供了美化样式的前端控件框架。登录提示框显示<html><head
2021-07-07 20:49:41 822
原创 eclipse搭建第一个java web应用
Eslicpe安装下载地址,https://www.eclipse.org/downloads/tomcat服务器安装下载地址,https://tomcat.apache.org/download-80.cgiDynamic web project如果你的软件里没有它,请向下看,反之,跳过。选择help->Install New Software,并进入点击Next,完成后重启即可。选择Window->Perspective->Customize Perspecti
2021-07-06 10:17:41 428 1
原创 Java基本环境配置
Eslicpe安装下载地址,https://www.eclipse.org/downloads/说明:和平常软件类似,选择安装目录,next,直到完成。配置环境变量新建环境变量Java_HOME,赋值你的安装目录编辑环境变量Path,追加%Java_HOME%\bin说明:配置Java环境变量。Maven安装下载,https://maven.apache.org/download.cgi说明:下载完成后解压一下即可,不需要安装。可以放到软件安装位置,随后配置环境变量。
2021-07-06 09:12:58 241 2
原创 孪生神经网络原理介绍
孪生神经网络定义孪生神经网络(Siamese network)就是“连体的神经网络”,神经网络的“连体”是通过共享权值来实现的。当我们想要提取同一属性的特征的时候,如果使用两个神经网络分别对图片进行特征提取,提取到的特征很有可能不在一个分布域中,此时我们可以考虑使用一个神经网络进行特征提取再进行比较。因此,孪生神经网络可以提取出两个输入图片同一分布域的特征,此时便可以判断两个输入图片的相似性。狭义的孪生神经网络由两个结构相同,且权重共享的神经网络拼接而成 。广义的孪生神经网络,或“伪孪生神
2021-07-05 09:32:28 3651
原创 Java 格式化写入json文件
写入文件操作BufferedWriter out = new BufferedWriter(new FileWriter("file.txt"));out.write("start"+'\n');out.write("end"+'\n');out.close()Gson操作(1)基本数据类型的解析Gson gson = new Gson();int num = gson.fromJson("1000", int.class); //1000double data = gson.fromJ
2021-07-04 20:07:09 2306
原创 目标检测图片相似度比较
目标检测区域写入文件# -*- coding=utf-8 -*-import numpy as np import cv2import osimport csvimport randomimport jsonimport pickleimport timeclass pickle_pic_datasets(object): def __init__(self): self.data = None def get_pic_list(self,filena
2021-06-29 17:18:44 478
原创 tcp/ip 实现局域网内设备通信
客户端单向控制服务器服务器# -*- coding:utf-8 -*-import socketimport osimport timehost = '192.168.1.105'port = 12345def main(): while True: ret = str(conn.recv(1024), encoding="utf-8") if ('End' in ret) or (ret==""): print('客户端断
2021-06-28 16:18:09 864 1
原创 Python 五种图片相似度比较方法
均值哈希算法# -*- coding: utf-8 -*-import cv2import numpy as np# Hash值对比def cmpHash(hash1, hash2,shape=(10,10)): n = 0 # hash长度不同则返回-1代表传参出错 if len(hash1)!=len(hash2): return -1 # 遍历判断 for i in range(len(hash1)): # 相等则n计
2021-06-28 16:04:23 26855 9
原创 caffe 使用命令将图片转换为lmdb
工程目录test 测试图片及其对应的xmltrain 训练图片及其对应的xmldata_txt.py 分别将训练测试图片及其xml写入txt运行data_txt.pyconvert_imageset配置参考https://blog.csdn.net/qq_38641985/article/details/116400423https://blog.csdn.net/qq_38641985/article/details/115286730执行命令convert_imageset.
2021-06-24 10:44:04 81
原创 caffe利用官方手写数字数据训练
案例数据准备下载链接:https://pan.baidu.com/s/10CmpZUdEVmma4A0mziu9dw提取码:dmjr复制这段内容后打开百度网盘手机App,操作更方便哦解压后放到data/mnist进入C:\Windows\System32\WindowsPowerShell\v1.0管理员运行PowerShellPS F:\caffe-windows> examples\mnist\create_mnist.ps1生成两个目录之后将mnist拷贝到自己的工程目录备用
2021-06-22 17:47:54 92
原创 caffe 训练手写数字并预测识别
建立工程目录data_digit 数据集model 模型保存位置digit_uma.py 生成准备文件predict_use.py 预测图片文件train_digit.py 训练生成网络文件数据集说明:0-9每个种类一千张,共10000张,需要求留言digit_uma.py# coding: utf-8import osimport cv2import numpy as npimport randomdef write_img_list(data, filename, nu
2021-06-22 17:19:48 154
Python Qt卡通人物桌面小工具
2020-12-05
斗鱼直播源数据的获取
2020-02-23
Pic_look.zip
2019-08-10
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人