一摩尔自由-CSDN博客

原创 Keras神经网络层学习

Keras有两种类型的模型，序贯模型（Sequential）和函数式模型（Model），函数式模型应用更为广泛，序贯模型是函数式模型的一种特殊情况。 a）序贯模型（Sequential):单输入单输出，一条路通到底，层与层之间只有相邻关系，没有跨层连接。这种模型编译速度快，操作也比较简单 b）函数式模型（Model）：多输入多输出，层与层之间任意连接。这种模型编译速度慢。Ke...

2019-08-21 12:36:18 851

原创面试相关

梯度爆炸或消失原因与解决方案https://blog.csdn.net/qq_25737169/article/details/78847691

2019-08-21 11:20:37 195

原创通过Keras + LSTM进行文本分类

利用LSTM对IMDB Reviwe文本进行分类，数据集可以在kaggle官网上获取，kaggle比赛或者https://pan.baidu.com/s/1EYoqAcW238saKy3uQCfC3w提取码：ilze# 导入相应的包import pandas as pdimport warningsimport reimport matplotlib.pyplot as pl...

2019-08-21 10:28:49 1188

原创 AI研究相关网站

最新论文https://arxiv.org/论文及代码https://paperswithcode.comhttps://github.com/ChristosChristofidis/awesome-deep-learning#papers首先是数据挖掘领域会议有KDD(2019)ICDMSDM(2019)期刊有ACM TKDDIEEE TKDECSDLDMKD然后是机器学习领域...

2019-08-16 14:38:14 367

原创关于音频AEC\AGC\BSS\BF\DOA\NS\DER算法名词解释

关于音频算法的一些缩写网上不好直接找到，最近整理了一下~名词解释AEC（Auto echo cancellation）：自适应回声消除AEC算法早期用在Voip，电话这些场景中，自从智能设备诞生后，智能语音设备也要消除自身的音源，这些音源包括音乐或者TTS机器合成声音。回声消除的基本原理是使用一个自适应滤波器对未知的回声信道:ω \omegaω 进行参数辨识，根据扬声器信号与产生的多...

2019-08-12 13:30:30 9356 1

0 前言在上文中进行ARIMA时序预测后，了解到强大的LSTM在处理时序预测有更为优秀的表现，因此对LSTM进行了学习。LSTM是一种时间递归神经网络，它出现的原因是为了解决RNN的一个致命的缺陷。原生的RNN会遇到一个很大的问题，叫做The vanishing gradient problem for RNNs，也就是后面时间的节点会出现老年痴呆症，也就是忘事儿，这使得RNN在很长一段时间...

2019-08-08 21:38:49 15191 8

原创 Resnet实现CIFAR-10分类

复现何凯明Resnet论文正确率0.9+结果，但是正确率还是没有达到0.9以上，因为 101-layers 和 152-layers 的残差块结构和 34-layers 是有一些区别的。import tensorflow as tfimport osimport numpy as npimport pickle# 文件存放目录CIFAR_DIR = "./cifar-10-ba...

2019-08-08 11:27:14 4380 2

原创迁移学习：keras + vgg16 实现图像识别

迁移学习：将一个领域的已经成熟的知识应用到其他的场景中，例如图像识别中最常见的例子，训练一个神经网络。来识别不同的品种的猫，你若是从头开始训练，你需要百万级的带标注数据，海量的显卡资源。而若是使用迁移学习，你可以使用Google发布的Inception或VGG16这样成熟的物品分类的网络，只训练最后的softmax层，你只需要几千张图片，使用普通的CPU就能完成，而且模型的准确性不差。案例一...

2019-08-07 15:24:49 4366 1

原创 HTML JS调用摄像头

启动本地服务或者远程服务器例如window.location.host，但是无法获取本地摄像头，这是因为目前的浏览器不支持getUSERmedia (安全问题：如果通过未加密的HTTP启用它，则会允许攻击者注入侦听的代码并将对话发送给攻击者。例如，如果您在酒店的私人会议室中使用未加密的WiFi，酒店附近的每个人都可以收听。即使您的应用通常不处理敏感对话，攻击者也可以用当他们正在使用另一个应用...

2019-08-07 11:43:04 6534

原创 python opencv 总结

图像的几何变换imgobj = cv2.imread('pho.png') #读取图像cv2.namedWindow("image") #创建窗口并显示的是图像类型cv2.imshow("image",imgobj)cv2.waitKey(0) #等待事件触发，参数0表示永久等待cv2.destroyAllWindows() #释放窗口# resizer...

2019-08-07 10:29:36 1394

原创 python opencv socket 图像网络传输

本代码主要实现的是利用网络传输图片，用该代码稍加修改就可以传输其他的信息，当然服务端，客户端也可以同时在PC上运行，以验证结果。所以本质还是希望读者借此代码可以了解python的socket编程。代码意义已在注释中详细说明，仅供参考。使用时请注意修改IP地址和端口号。以下是服务端代码：import socketimport timeimport cv2import numpy ...

2019-08-07 10:15:40 4959 1

原创 bat批处理执行python脚本

在执行python脚本时，需要不断地输入参数来测试实验代码，甚是繁琐（尤其是在给别人演示代码的时候）。想着是不是可以设计一个自动化一键执行的脚本bat执行python文件：@echo off::set INTERVAL = 10::timeout %INTERVAL%::Again echo local_cap C: cd %~dp0start pythonw lo...

2019-08-01 17:21:55 12589

转载 Http Response Code对照备忘

SC_ACCEPTED 状态码 (202)，表示一个请求已经被接受处理，但还没有完成。SC_BAD_GATEWAY 状态码 (502)，表明HTTP服务器从一个服务器收到了一个无效的响应，当其作为一个代理服务器或网关时，无法作出判断。SC_BAD_REQUEST 状态码 (400) 表示有客户端发出的请求在语法上是错误的...

2019-07-24 23:01:40 760

原创 python3+opencv 从本地摄像头和网络摄像头截取图片

import cv2import os# 获取本地摄像头# folder_path 截取图片的存储目录def get_img_from_camera_local(folder_path): cap = cv2.VideoCapture(0) i = 1 while True: ret, frame = cap.read() cv2....

2019-07-16 20:04:45 1184 3

原创 Python + opencv 背景去除

import numpy as npimport cv2cap = cv2.VideoCapture(0)fgbg = cv2.createBackgroundSubtractorMOG2(detectShadows = False)# fgbg = cv2.createBackgroundSubtractorKNN()while(cap.isOpened()): ret, ...

2019-07-09 14:01:42 8295 1

转载姿态估计--文献及代码资料

基于OpenCV使用OpenPose进行多个人体姿态估计OpenPose：实时多人2D姿态估计 | 附视频测试及源码链接OpenPose训练自己的数据集模型OpenPose训练过程解析关键点估计之 PCK, PCKh, PDJ 评价度量论文解读Convolutional Pose Machine总结Cascaded Pyramid Network for Multi-Pe...

2019-07-02 11:26:49 454

转载 Pose_Estimation_Material（姿势估计）

2D姿势估计在野外进行准确的多人姿态估计（CVPR_2017）论文：https：//github.com/hackiey/keypoints 使用部分亲和场的实时多人2D姿态估计（CVPR_2017）论文：https ：//arxiv.org/pdf/1611.08050.pdf代码：https：//github.com/ZheC/Realtime_Multi-Per...

2019-07-02 10:23:35 1021

转载从 RGB 到 HSV 的转换详细介绍

从RGB 到 HSV 的转换详细介绍1.RGBRGB是从颜色发光的原理来设计定的，通俗点说它的颜色混合方式就好像有红、绿、蓝三盏灯，当它们的光相互叠合的时候，色彩相混，而亮度却等于两者亮度之总和，越混合亮度越高，即加法混合。红、绿、蓝三个颜色通道每种色各分为256阶亮度，在0时“灯”最弱——是关掉的，而在255时“灯”最亮。当三色灰度数值相同时，产生不同灰...

2019-06-27 11:23:42 24365 1

转载如何理解CNN中的卷积？

转：https://blog.csdn.net/cheneykl/article/details/79740810https://www.cnblogs.com/Yu-FeiFei/p/6800519.html6、计算例子：解析：图中input 7*7*3中，7*7代表图像的像素/长宽，3代表R、G、B 三个颜色通道，可以看到周边有填充0；有两个卷积核Filter w0、Filt...

2019-04-04 12:33:24 261

转载将tensorflow训练好的模型移植到android上

转自：https://www.jianshu.com/p/ddeb0400452f将tensorflow训练好的模型移植到android上说明本文将描述如何将一个训练好的模型植入到android设备上，并且在android设备上输入待处理数据，通过模型，获取输出数据。通过一个例子，讲述整个移植的过程。（demo的源码访问github上了https://github.com/Cryst...

2019-02-19 10:42:40 1378 1

转载半监督学习概述

半监督学习(Semi-Supervised Learning,SSL)类属于机器学习(Machine Learning,ML)。一 ML有两种基本类型的学习任务：1.监督学习(Supervised Learning,SL) 根据输入-输出样本对L={(x1,y1),···,(xl,yl)}学习输入到输出的映射f:X->Y,来预测测试样例的输出值。SL包括分类(Classific...

2018-11-28 18:04:17 3266

原创 python 复制/移动文件

# -*- coding: utf-8 -*-#!/usr/bin/python#test_copyfile.pyimport os,shutildef mymovefile(srcfile,dstfile): if not os.path.isfile(srcfile): print "%s not exist!"%(srcfile) else: ...

2018-11-20 14:06:00 1932

原创 python创建和删除空文件或小文件

#!/usr/bin/python#-*-coding:utf-8-*- #指定编码格式，python默认unicode编码 import osdirectory = "./dir"os.chdir(directory) #切换到directory目录cwd = os.getcwd() #获取当前目录即dir目录下print("-------------------...

2018-11-20 13:41:57 8987

转载 python 获取文件大小，创建时间和访问时间

转自：https://www.cnblogs.com/shaosks/p/5614630.html# -*- coding: UTF8 -*-import timeimport datetimeimport os 1、　　'''把时间戳转化为时间: 1479264792 to 2016-11-16 10:53:12'''　　　　def TimeStampToTime(tim...

2018-11-20 13:34:53 1895

原创小结

这段时间从事了一些工程化的项目，很多很费时间的数据处理等难点，我都用python写了一些脚本，有些也是别人问我，然后才写了一些demo,我不是科班计算机专业出身，程序有很多需要改善的地方欢迎大家提出！...

2018-11-20 13:05:19 296 3

原创 Python对批量wav文件改名

sample = r"C:\Users\Administrator\Desktop\aws-3 " files = os.listdir(sample) files = [sample + "\\" + f for f in files if f.endswith('.wav')] num = len(files) threshold_value = 1 check_repeat =...

2018-11-20 12:59:32 1585

原创 python 声音变速不变调实现

import ctypesimport numpy as npfrom numpy.ctypeslib import ndpointerfrom scipy.io import wavfilelib = ctypes.cdll.LoadLibrary sonic_lib = lib("lib/sonic-master/libsonic.so")fs, wav = wavfile...

2018-11-19 15:56:06 6759 2

原创 some thing need to remember

下载chromedrive驱动：https://chromedriver.storage.googleapis.com/index.html executable_path = C:\Program Files (x86)\Google\Chrome\chromedriver.exe

2018-11-17 16:40:33 251

原创 python wav文件短时能量并plot出来

import waveimport pyaudioimport numpy as npimport pylabimport pylab as pl# 计算每一帧的能量 256个采样点为一帧def calEnergy(wave_data) : energy = [] sum = 0 for i in range(len(wave_data)) : ...

2018-11-17 11:45:30 2392

原创 python wav文件过零率并plot出来

import mathimport waveimport numpy as npimport pylab as pldef ZeroCR(waveData,frameSize,overLap): wlen = len(waveData) step = frameSize - overLap frameNum = math.ceil(wlen/step) ...

2018-11-17 11:43:50 829

转载 18个实时音视频开发中会用到开源项目

实时音视频的开发学习有很多可以参考的开源项目。一个实时音视频应用共包括几个环节：采集、编码、前后处理、传输、解码、缓冲、渲染等很多环节。每一个细分环节，还有更细分的技术模块。比如，前后处理环节有美颜、滤镜、回声消除、噪声抑制等，采集有麦克风阵列等，编解码有VP8、VP9、H.264、H.265等。我们今天汇总了一些能帮助到正在学习或进行音视频开发的实时音视频开发者们的开源项目与几个...

2018-11-06 16:33:29 755

转载振铃信号、拨号音、回铃音、忙音详解

转自：https://www.cnblogs.com/sddai/p/8847950.html1、振铃信号用来呼叫被叫用户。铃流为25±3Hz正弦波，谐波失真不大于10％，输出电压有效值90+-15V，振铃采用5s断续，即一秒送，4s断，断、续时间偏差不超过±10％。2、拨号音用来通知主叫用户可以拨号。拨号音采用频率为450±25Hz的交流电源，发送电平为-10±3dBm，是连续的信...

2018-11-05 16:11:56 11225

原创 Python对批量wav文件加入高斯白噪声

#coding=gbkimport osimport waveimport librosaimport numpy as npdef add_noise(data): wn = np.random.normal(0,1,len(data)) data_noise = np.where(data != 0.0, data.astype('float64') + 0.02...

2018-10-30 16:27:06 4548 2

原创用来评估模型好坏的方差和偏差的概念及区别对比

一、基本概念上的对比解释1、偏差Bias：描述的是预测值（估计值）的期望与真实值之间的差距。偏差越大，越偏离真实数据，对象是单个模型。 2、方差Variance：描述的是预测值的变化范围，离散程度，也就是离其期望值的距离。方差越大，数据的分布越分散，对象是多个模型在忽略噪声的情况下，泛化误差可分解为偏差、方差两部分。偏差：度量学习算法的期望预测与真实结果的偏离程度，也叫拟合能力。方...

2018-10-30 11:39:35 2662

原创 Python对批量文件进行VAD检测和分段

准备：python2.7/3.+ webrtcvadimport collectionsimport contextlibimport sysimport waveimport osimport webrtcvaddef read_wave(path): """Reads a .wav file. Takes the path, and returns...

2018-10-26 18:10:27 6629 5

原创 python2.7安装第三方扩展库报Microsoft Visual C++9.0 required

环境：操作系统：Windows 7 64位语言：Python 2.7.9 Twisted webrtcvad 等第三方扩展库安装，执行如下命令： pip install Twisted/...报错如下：error:Microsoft Visual C++ 9.0 required(Unable to find vcvarsall.bat).解决方法：下载 ...

2018-10-26 10:05:49 954

原创 Python对批量音频文件（wav）进行分段切割并保存

#coding=gbkimport osimport waveimport numpy as npimport pylab as pltCutTimeDef = 1 #以1s截断文件# CutFrameNum =0path = r"..\test"files = os.listdir(path)files = [path + "\\" + f for f in fi...

2018-10-25 16:41:54 22483 9

原创 Python数据统计千万级csv文件

适合从某列分类，再根据某列进行分类，再求和自行扩展~~~~~# coding=utf-8import csvimport pandas as pdcsv_file=csv.reader(open('1.csv','r'))csv_file2=csv.reader(open('2.csv','r'))csv_file3=csv.reader(open('3.csv','r'...

2018-10-22 16:46:20 4903

转载用python批量获取某路径文件夹及子文件夹下的指定类型文件，并按原文件夹结构批量存储处理后的文件

因为是把自己成功运行的整个代码按几部分截取出来的，所以每一小节代码不一定能单独运行，特此说明。1.获取某路径文件夹及子文件夹下的指定pcm类型文件的全部路径import osdef eachfile(filepath): pathdir=os.listdir(filepath) for s in pathdir: newdir = os.path.join...

2018-10-22 16:31:14 1163

转载声纹识别

探秘身份认证利器——声纹识别！声纹识别神秘面纱在这个移动互联网大行其道的年代，人们不用互相见面就可以完成很多事情，比如社交、购物、网上开店、金融交易等等，但是如何验证身份变成了人和人在不见面的情况下最难的事情。传统的解决方案就是密码或者秘钥，它需要你记住或者存起来，容易忘又容易丢，还容易被黑客利用各种手段攻击。有多少人使用“123456“这种简单密码在网络上行走，他们就是黑客们最喜欢的目标...

2018-09-21 10:48:12 2598 2

空空如也

空空如也