szfhy的博客

私信 关注
szfhy
码龄6年
  • 1,338,076
    被访问量
  • 201
    原创文章
  • 2,723
    作者排名
  • 172
    粉丝数量
  • 于 2015-08-27 加入CSDN
获得成就
  • 获得115次点赞
  • 内容获得94次评论
  • 获得432次收藏
荣誉勋章
兴趣领域
  • #人工智能
    #机器学习#TensorFlow#图像处理#视觉/OpenCV#神经网络#深度学习
TA的专栏
  • cuda
    1篇
  • ros
    1篇
  • 算法
    33篇
  • 图像处理
    39篇
  • 模式识别与机器学习
    41篇
  • python
    53篇
  • onvif
    2篇
  • c/c++
    20篇
  • FFMPEG
    9篇
  • linux
    24篇
  • 计算机视觉
    19篇
  • DeepLearning
    12篇
  • tensorflow
    6篇
  • opengl
    12篇
  • 最近
  • 文章
  • 资源
  • 问答
  • 课程
  • 帖子
  • 收藏
  • 关注/订阅

2021-02-20keras basic

from tensorflow.keras import layersfrom tensorflow.keras import initializersimport tensorflow as tffrom keras.models import Sequentialfrom keras.layers import Dense, Flattenfrom keras.layers.convolutional import Conv2D, MaxPooling2Dfrom keras.utils.n
原创
15阅读
0评论
0点赞
发布博客于 14 天前

cuda 入门(一)

环境配置:安装完cuda之后,查看cuda编译器nvcc能否能够正常工作。第一个Helloworld
原创
64阅读
0评论
0点赞
发布博客于 2 月前

ubuntu16.04 install ros kinetic

install guidehttp://wiki.ros.org/kinetic/Installation/Ubuntufailed at:sudo rosdep initrosdep updategot error:ERROR: cannot download default sources list from:https://raw.githubusercontent.com/ros/rosdistro/master/rosdep/sources.list.d/20-defa
原创
175阅读
0评论
0点赞
发布博客于 9 月前

git_ros_dep.zip

when you try to install ros in china without proxy, it is hard for you to do "rosdep init"and you will get errors, in order to solve this issue, you have to download this file to update rosdep
zip
发布资源于 9 月前

opengl保存并加载二进制program

通常情况下,opengl 的shader会被编译成program,然后再将program送到GPU里面去执行。如果我们的应用程序,每次都用源码编译shader,这样效率肯定是不高的,特别是在嵌入式平台上, 性能比较弱的场景下。其实我们可以稍微修改一下我们的程序结构,将编译完的program保存下来,下一次再用的时候,直接加载保存好的二进制program就好了,不必每次都编译,浪费时间。...
原创
381阅读
0评论
0点赞
发布博客于 2 年前

opengl 显示UYVY422格式的数据--性能提升

前面我们分享过,opengl 显示UYVY422格式的数据我们显示的是视频,每帧数据都copy到GPU中去渲染,图像数据一般是挺大的,copy数据的快慢对整个性能的影响还是很大的。在opengl中copy frame data用到的API是glTexImage2D.其实上文中的用法不太好。每帧图像都要渲染,直接在GPU内部分配一个固定的Buffer,不用每帧都去申请,然后再释放。...
原创
649阅读
0评论
0点赞
发布博客于 2 年前

show_uyvy422.zip

通过opengl shader将UYVY422格式的数据解码为RGB,然后显示。
zip
发布资源于 2 年前

opengl 显示UYVY422格式的数据

前面我们分享过如何显示YUV420P的图像,渲染YUV420P数据这此我们分享一下UYVY422格式图像的渲染方法,关于YUV420P和UYVY422的区别,网上有很多图例可以帮大家理解。直接看代码,代码是直接可以运行的。完整代码和资源文件,请访问:https://download.csdn.net/download/szfhy/11940081#include <st...
原创
858阅读
0评论
0点赞
发布博客于 2 年前

show_uyvy422_using_PBO.zip

使用PBO,DMA快速copy 内存的YUV数据到GPU的memory中,shader将YUV转换为RGB再显示出来,自带YUV资源文件。
zip
发布资源于 2 年前

虚拟机通过无线网卡上网的配置办法

虚拟机通过桥接方式上网,跟一个host就可以组件局域网,非常方便。如果host使用的是有线连接,配置非常方便。如下图,选择桥接模式,复制物理网络连接状态可以不选,在“配置适配器中”选择要桥接的有限网卡,开启虚拟机之后就可以DHCP上网了。如果是host主机选择的是无线上网,上面的方法就要调整了。1,选择桥接模式,并且enable复制物理网络连接状态, 选择要桥接的无线网卡,...
原创
5184阅读
0评论
1点赞
发布博客于 2 年前

opengl 使用shader对图像进行锐化处理

在之前的博客中opengl 在显示的YUV视频序列上画多个框如果我们要对输入的视频内容做一个锐化处理,或者其他特效,在shader中如何处理呢?完整code如下,看到code就明白其中的道理了,还是很简单的。// VideoPlayer.cpp : Defines the entry point for the console application.//#include &...
原创
1754阅读
0评论
2点赞
发布博客于 2 年前

opengl GLSL宏加载shader source

在opengl shader的编写过程中,常用的两种方式是:将shader 定义为字符串,然后使用glShaderSource加载static const char *vs = "attribute vec4 vertexIn;
" "attribute vec2 textureIn;
" "varying vec2 textureOut;
" "void main(...
原创
977阅读
0评论
1点赞
发布博客于 2 年前

opengl 保存渲染好的图像

在前面的文章中,我已经可以将媒体文件通过opengl来进行显示。opengl 在显示的YUV视频序列上画多个框opengl 显示BMP图像如果希望将blend,或者其他方法处理过之后的图像数据保存为图像文件,该如何做呢?这个时候我们就要用到glReadPixels函数,GPU渲染完数据在显存,回传内存的唯一方式glReadPixels函数,glReadPixels:读取一些像素。当...
原创
2401阅读
1评论
3点赞
发布博客于 2 年前

numpy中数据拼接的方法

a = np.floor(20 * np.random.random((2,2)))b = np.floor(20 * np.random.random((2,2)))c = np.floor(20 * np.random.random((2,2)))print(a)print(b)print(c)[[ 8. 2.] [16. 15.]][[ 7. 0.] [10. 12.]]...
原创
2317阅读
0评论
0点赞
发布博客于 2 年前

scikit-learn xgboost 预测波士顿房价

xgboost需要单独安装pip install xgboost #安装xgboost库pip install --upgrade xgboost #更新xgboost库import xgboost as xgbfrom xgboost import XGBRegressor as XGBRfrom sklearn.ensemble import RandomForestRegr...
翻译
1698阅读
0评论
1点赞
发布博客于 2 年前

scikit-learn 以线性回归为例学习性能评估指标

代码:from sklearn.linear_model import LinearRegression as LRfrom sklearn.model_selection import train_test_splitfrom sklearn.model_selection import cross_val_scorefrom sklearn.datasets import fetc...
翻译
1076阅读
0评论
0点赞
发布博客于 2 年前

scikit-learn 支持向量机--图视化

代码笔记:from sklearn.datasets import make_blobsfrom sklearn.svm import SVCimport matplotlib.pyplot as pltimport numpy as npX,y = make_blobs(n_samples=50, centers=2, random_state=0, cluster_std=0....
翻译
359阅读
0评论
0点赞
发布博客于 2 年前

scikit-learn 支持向量机-乳腺癌数据集探索

代码笔记:from sklearn.datasets import load_breast_cancerfrom sklearn.svm import SVCfrom sklearn.model_selection import train_test_splitimport matplotlib.pyplot as pltimport numpy as npfrom time im...
翻译
2708阅读
0评论
0点赞
发布博客于 2 年前

scikit-learn 逻辑回归--调参

代码笔记:from sklearn.linear_model import LogisticRegression as LRfrom sklearn.datasets import load_breast_cancerimport numpy as npimport matplotlib.pyplot as pltfrom sklearn.model_selection import...
翻译
5010阅读
0评论
0点赞
发布博客于 2 年前

scikit-learn 主成分分析--数据降维

代码笔记import matplotlib.pyplot as pltfrom sklearn.datasets import load_irisfrom sklearn.decomposition import PCAiris = load_iris()y = iris.targetX = iris.dataimport pandas as pdpd.DataFrame(X...
翻译
394阅读
0评论
0点赞
发布博客于 2 年前

scikit-learn 随机森林代码学习--乳腺癌检测

from sklearn.datasets import load_breast_cancerfrom sklearn.ensemble import RandomForestClassifierfrom sklearn.model_selection import GridSearchCVfrom sklearn.model_selection import cross_val_scor...
翻译
639阅读
0评论
1点赞
发布博客于 2 年前

scikit-lean 随机森林代码学习--红酒

代码笔记%matplotlib inlinefrom sklearn.tree import DecisionTreeClassifierfrom sklearn.ensemble import RandomForestClassifierfrom sklearn.datasets import load_winewine = load_wine()from sklearn....
翻译
630阅读
0评论
0点赞
发布博客于 2 年前

scikit-learn 决策树代码学习-红酒数据

代码笔记1.导库from sklearn import treefrom sklearn.datasets import load_winefrom sklearn.model_selection import train_test_split2. 加载数据,拆分wine = load_wine()Xtrain, Xtest, Ytrain, Ytest = train_...
翻译
857阅读
0评论
0点赞
发布博客于 2 年前

机器学习模型评估混淆矩阵、ROC曲线和AUC以及PR曲线

在机器学习中,当我们基于某个业务建立模型并训练后,接下来我们需要评判模型好坏的时候需要基于混淆矩阵,ROC和AUC等来进行辅助判断。混淆矩阵也叫精度矩阵,是用来表示精度评价,为N *N的矩阵,用来判别分类好坏的指标。混淆矩阵中有以下几个概念:TP(True Positive): 被判定为正样本,实际也为正样本FN(False Negative):伪阴性 ,被判定为负样本,实际为正样...
转载
690阅读
0评论
0点赞
发布博客于 2 年前

python机器学习常用参考手册

pandas:http://pandas.pydata.org/pandas-docs/stable/reference/index.htmlscikit-learn:https://scikit-learn.org/stable/seaborn:http://seaborn.pydata.org/numpyhttps://www.numpy.org/devdocs/
原创
247阅读
0评论
1点赞
发布博客于 2 年前

python可视化50图

http://www.machinelearningplus.com/plots/top-50-matplotlib-visualizations-the-master-plots-python/
原创
1416阅读
0评论
1点赞
发布博客于 2 年前

机器学习-分类性能评价指标-混淆矩阵confusion_maxtrix

关于混淆矩阵,之前看别人的一些教程,感觉作者很牛,图形化显示出来也很酷,最近深挖了一下文档,顿时感觉我们很牛人就间隔一张纸。详细的实现:confusion_matrix顺便添加自己的调试的代码,记个笔记。import numpy as npimport matplotlib.pyplot as pltfrom sklearn import svm, datasetsfrom ...
原创
865阅读
0评论
0点赞
发布博客于 2 年前

jupyter notebook 引入交互式控件

安装pip install ipywidgets配置jupyter nbextension enable --py widgetsnbextension使用from ipywidgets import interactdef f2(x): return xinteract(f2, x='')显示效果
原创
1864阅读
0评论
0点赞
发布博客于 2 年前

jupyter快捷键

Ctrl + Shift + - #将一个 cell拆分为两个cellesc dd #删除一个cell, esc 按一下,切换到命令模式Ctrl+enter #执行本cellshift+enter #执行本cell且 向下建立一个新cellesc+m ...
转载
1827阅读
0评论
3点赞
发布博客于 2 年前

linux samba configure

Install Samba sudo apt-get updatesudo apt-get install samba Set a password for your user in Samba sudo smbpasswd -a <user_name> Note: Samba uses a se...
转载
172阅读
0评论
0点赞
发布博客于 2 年前

opengl 在显示的YUV视频序列上画多个框

在之前的文章中,opengl 在显示的图像视频上画多个框记录了如何将BMP图像通过opengl显示,并在显示画面上叠加图层。这一次我们输入一段YUV序列,利用Shader将YUV转换为RGB并显示,同时叠加多个图层上去。代码中调试遇到了一些问题,图像数据总是不能正常的显示,问题的详细解释如code中的注释所示。// VideoPlayer.cpp : Defines the...
原创
697阅读
0评论
1点赞
发布博客于 2 年前

GPU处理图像 Shader的入门

原文链接:https://www.jianshu.com/p/8687a040eb48Shader着色器Shader出现在OpenGL ES 2.0中,允许创建自己的Shader。必须同时创建两个Shader,分别是Vertex shader和Fragment shader.Shader工具Shader会有很多坑,不过一些工具能够帮助你跳过这些坑GPUImage:https:/...
转载
376阅读
0评论
1点赞
发布博客于 2 年前

openGL shader学习总结

原文地址:https://blog.csdn.net/github_39611196/article/details/78416902着色器是运行在GPU上的小程序,着色器是一种C风格语言——GLSL。一、GLSLGLSL是为图形量身定制的,它为向量和矩阵运算提供了很大帮助。1、着色器的开头总是要声明版本,接着是输入和输出变量、uniform和main函数。main函数时每个着色器的入口...
转载
4497阅读
0评论
0点赞
发布博客于 2 年前

opengl 在显示的图像视频上画多个框

接上一篇,其实blend完成一次之后就相当于一个完整的层,在其时候继续调用glBlendfunc可以继续进行画框的操作,代码如下所示:#include "stdafx.h"#include &lt;GLTools.h&gt; // OpenGL toolkit#include &lt;GLShaderManager.h&gt;#ifdef __APPLE__#include &l...
原创
1241阅读
0评论
0点赞
发布博客于 2 年前

camera接口---MIPI CSI-2接口、DVP接口和FPD-Link III LVDS、GMSL等接口对比

https://blog.csdn.net/weixin_42229404/article/details/81560812
转载
7712阅读
0评论
0点赞
发布博客于 2 年前

opengl 在显示的图像视频上画框

在前面的博客中opengl 显示BMP图像,总结了如何使用opengl显示BMP图像,如何显示BMP图像序列。在做Object detection的一些工作中,经常会将检测到object用一个框标记出来,这次探索一下如何实现这个功能。这要使用Opengl的blend功能。void glBlendFunc(GLenum sfactor,GLenum dfactor);sfactor...
原创
1381阅读
1评论
1点赞
发布博客于 2 年前

opengl 显示BMP图像

本想系统的学习一下OPENGL,最近几天跟蓝皮书的接触效果不太好,索性还是按照自己的想法来。先显示一张图片吧,已经调试过的代码如下:#include &lt;GLTools.h&gt; // OpenGL toolkit#include &lt;GLShaderManager.h&gt;#ifdef __APPLE__#include &lt;glut/glut.h&gt;#e...
原创
2482阅读
2评论
1点赞
发布博客于 2 年前

C++实现线程安全的单例模式

https://www.cnblogs.com/myd620/p/6133420.html在某些应用环境下面,一个类只允许有一个实例,这就是著名的单例模式。单例模式分为懒汉模式,跟饿汉模式两种。首先给出饿汉模式的实现template &lt;class T&gt;class singleton{protected: singleton(){};privat...
转载
338阅读
1评论
0点赞
发布博客于 2 年前

ubuntu 源码编译安装opencv

下载source codeSudo apt-get install cmakeSudo apt-get install libgtk2.0-devSudo apt-get install pkg-config 进入source code目录,/home/aaa/Project/opencv-3.4.0/Mkdir buildMkdir install_opencv 将o...
原创
418阅读
0评论
0点赞
发布博客于 3 年前

Visual Studio 设置环境变量头文件库文件目录

使用VS做为开发工具,经常使用第三方的lib时,需要经常设置include,lib包含目录,这样比较好管理code.运行时,如何找到这些Lib呢?网上看到的解决方法大部分都是设置系统环境变量,然后重启VS。这个方法也可以解决问题,但不是最好的方法。其实可以在VS中设置环境变量,在环境变量中加入相应的路径就好了,也不用重启,也不用设置系统环境变量。如下图。仔细查看环境变量的写法,...
原创
1483阅读
0评论
0点赞
发布博客于 3 年前

pandas 学习笔记

pandas 是一个强大的时间序列数据处理工具包,由两个比较重要的数据结构,series和dataframe,可以简单的将其抽象为一个表格。series可以表达一行数据,理解为一维数组。s = pandas.Series([4,2,5,0,6,3])DataFrame表示二维数组, df = pandas.DataFrame(numpy.random.randn(6,4), columns...
原创
589阅读
0评论
0点赞
发布博客于 3 年前

matplotlib 修改坐标轴,添加注释及公式

坐标轴刻度import matplotlib.pyplot as pltimport numpy as npx=np.arange(1,11,1)plt.plot(x,x)ax = plt.gca()#ax.locator_params(nbins=5) #xy轴同时调整ax.locator_params('x',nbins=10) #只调整x轴ax.locator_para...
原创
5536阅读
0评论
1点赞
发布博客于 3 年前

matplotlib 配置色彩点线样式网格及图列

色彩配置import matplotlib.pyplot as pltimport numpy as npy = np.arange(5)plt.plot(y, color='g')plt.plot(y+1, color='0.5')plt.plot(y+2, color='#ff00ff')plt.plot(y+3, color=(0.1,0.2,0.3))plt.s...
原创
2337阅读
0评论
0点赞
发布博客于 3 年前

matplotlib实现热成像图colorbar和极坐标图

热成像图%matplotlib inlinefrom matplotlib import pyplot as pltimport numpy as npdef f(x, y): return (1 - x / 2 + x ** 5 + y ** 3) * np.exp(-x ** 2 - y ** 2)n = 10x = np.linspace(-3, 3, 4 * n...
原创
8293阅读
1评论
5点赞
发布博客于 3 年前

matplotlib 实现饼图pie和等高线图contourf

饼图import numpy as npimport matplotlib.pyplot as pltlabels='A','B','C','D'fracs = [15,30, 45, 10]explode = [0,0.1,0.05,0]#长宽比为1:1plt.axes(aspect=1)#autopct 控制百分比的设置,使用format字符串或者format funct...
原创
687阅读
0评论
0点赞
发布博客于 3 年前

matplotlib实现直方图hist和折线图

单变量直方图import numpy as npimport matplotlib.pyplot as pltmu = 100 # mean of distributionsigma = 20 #standard deviatioin of distributionx = mu + sigma * np.random.randn(200000)#绘制单变量的直方图plt.his...
原创
3083阅读
0评论
1点赞
发布博客于 3 年前

matplotlib 柱状图bar

import numpy as npimport matplotlib.pyplot as pltN = 5y = [20, 10, 30, 25, 15]index = np.arange(N)plt.bar(left=index, height=y,color='red', width=0.5) #left横坐标,height纵坐标, color颜色 widthplt.show(...
原创
1043阅读
0评论
0点赞
发布博客于 3 年前

matplotlib 实现区域颜色填充

import matplotlib.pyplot as pltimport numpy as npx= np.linspace(0,5*np.pi, 1000)y1 = np.sin(x)y2 = np.sin(2*x)#plt.plot(x,y1)#plt.plot(x,y2)plt.fill(x,y1,'b',alpha=0.5)plt.fill(x,y2,'r',a...
原创
16176阅读
0评论
0点赞
发布博客于 3 年前

matplotlib画散点图

import matplotlib.pyplot as pltimport numpy as npheight = [161,170, 182, 175, 173, 165]weight = [50, 58, 80, 70, 69, 65]plt.scatter(height, weight)plt.show()#散点图 随机的,无相关性N = 1000x=np.rand...
原创
1436阅读
0评论
0点赞
发布博客于 3 年前

matplotlib 学习

画正弦余弦曲线%matplotlib inlinefrom matplotlib import pyplot as pltimport numpy as npX = np.linspace(-np.pi, np.pi, 200, endpoint=True)C, S = np.cos(X), np.sin(X)plt.figure(figsize=(20, 6), dpi=80...
原创
216阅读
0评论
0点赞
发布博客于 3 年前

scikit-learn 逻辑回归实现信用卡欺诈检测

读书笔记import numpy as npimport pandas as pdimport matplotlib.pyplot as pltdata = pd.read_csv('creditcard.csv')#data.head(10)print (data.shape)count_class = pd.value_counts(data['Class'],s...
原创
956阅读
2评论
0点赞
发布博客于 3 年前

scikit-learn 支持向量机实现手写体识别

随时代码,阅读笔记%matplotlib inlineimport matplotlib.pyplot as pltimport numpy as npfrom sklearn import datasetsdigits = datasets.load_digits() # 加载数据# 把数据所代表的图片显示出来images_and_labels = list(zip...
原创
958阅读
0评论
0点赞
发布博客于 3 年前

scikit-learn kmeans实现文本聚类

kmeans 无监督的学习方法。需要根据实际业务需要确定K值。加载数据集%matplotlib inlineimport matplotlib.pyplot as pltimport numpy as npfrom time import timefrom sklearn.datasets import load_filesprint("loading documents ....
原创
1410阅读
0评论
1点赞
发布博客于 3 年前

scikit-learn 结合PCA和SVM实现人脸识别

准备数据集%matplotlib inlineimport matplotlib.pyplot as pltimport numpy as npimport timeimport loggingfrom sklearn.datasets import fetch_olivetti_faceslogging.basicConfig(level=logging.INFO, for...
原创
2157阅读
0评论
1点赞
发布博客于 3 年前

scikit-learn 线性回归拟合正弦函数,预测房价

随书代码,阅读笔记。 线性回归拟合正弦函数%matplotlib inlineimport matplotlib.pyplot as pltimport numpy as npn_dots = 200X = np.linspace(-2 * np.pi, 2 * np.pi, n_dots)Y = np.sin(X) + 0.2 * np.random.rand(n_d...
原创
1013阅读
0评论
0点赞
发布博客于 3 年前

scikit-learn 决策树预测泰坦尼克号幸存者

决策树的使用手册http://sklearn.apachecn.org/cn/0.19.0/modules/tree.html决策树预测结果容易理解,易于解释,预测速度快。基于Entropy的分类:ID3, C4.5,C5.0,运算效率更高,使用内存更小,创建出来的决策树更小,准确性高,适合大数据集的决策树创建;基于gini不纯度:CART,分类回归树。sklear...
原创
1736阅读
0评论
0点赞
发布博客于 3 年前

scikit-learn KNN实现糖尿病预测

随书代码,阅读笔记。KNN是一种有监督的机器学习算法,可以解决分类问题,也可以解决回归问题。算法优点:准确性高,对异常值和噪声有较高的容忍度;算法缺点:计算量大,内存消耗也比较大。针对算法计算量大,有一些改进的数据结构,避免重复计算K-D Tree, Ball Tree。算法变种:根据邻居的距离,分配不同权重。另外一个变种是指定半径。KNN进行分类%matplotlib...
原创
2752阅读
0评论
1点赞
发布博客于 3 年前

scikit-learn 逻辑回归实现乳腺癌检测

随书代码,阅读笔记载入数据%matplotlib inlineimport matplotlib.pyplot as pltimport numpy as np# 载入数据from sklearn.datasets import load_breast_cancercancer = load_breast_cancer()X = cancer.datay = cancer...
原创
1470阅读
0评论
2点赞
发布博客于 3 年前

scikit-learn 支持向量机实现乳腺癌检测

随书代码,阅读笔记。载入数据并准备测试机和训练集# 载入数据from sklearn.datasets import load_breast_cancercancer = load_breast_cancer()X = cancer.datay = cancer.targetprint('data shape: {0}; no. positive: {1}; no. negat...
原创
1449阅读
2评论
0点赞
发布博客于 3 年前

scikit-learn 朴素贝叶斯实现文档分类

随书代码,做些笔记。加载数据集http://mlcomp.org/datasets/379 下载%matplotlib inlineimport matplotlib.pyplot as pltimport numpy as npfrom time import timefrom sklearn.datasets import load_filesprint("loadin...
原创
681阅读
0评论
0点赞
发布博客于 3 年前

sklearn study

手册:http://sklearn.apachecn.org/一些视频教程:http://i.youku.com/apachecn 
原创
75阅读
0评论
0点赞
发布博客于 3 年前

从零开始学Apollo自动驾驶:跑起来第一个Demo

围绕着百度开源的Apollo自动驾驶项目展开,重点分析整个项目的框架,核心的计算机视觉感知模块。下载项目代码项目主页:https://github.com/ApolloAuto/apollogit clone https://github.com/ApolloAuto/apollo.git或者直接Download Zip 然后再解压,这样会快一点。Demo我们没有实际的硬件,...
原创
3274阅读
5评论
1点赞
发布博客于 3 年前

常用经典深度神经网络结构可视化

常用经典网络结构可视化:https://cwlacewe.github.io/netscope/quickstart.html
原创
1130阅读
0评论
1点赞
发布博客于 3 年前

python实现图像外边界跟踪

share一些python实现的code#!/usr/bin/env python#coding=utf-8import cv2img = cv2.imread("trace_border2.bmp")[img_h, img_w, img_channel] = img.shapetrace = []start_x = 0start_y = 0gray = img[:,...
原创
4187阅读
2评论
1点赞
发布博客于 3 年前

numpy newaxis与expand_dims

numpy.newaxis 为数组增加一个新维度,机器学习的常用框架中处理的数据大多是矩阵,经常需要将一个向量转换成列矩阵或者行矩阵;同样numpy.expand_dims也可以实现对应的功能,效果如下: ...
原创
349阅读
0评论
0点赞
发布博客于 3 年前

docker 学习笔记

安装 添加镜像源首先安装apt-transport-https 支持https协议的源,并添加源的密钥:sudo apt-get install -y apt-transport-httpssudo apt-key adv --keyserver hkp://p80.pool.sks-keyservers.net:80 --recv-keys 58118E89F3A91289...
原创
577阅读
0评论
0点赞
发布博客于 3 年前

ipynb转换为python文件

使用jupyter-notebook打开ipynb,如下图所示,可以转换为其他格式的文件。 命令行的方式:ipynb转换为pythonjupyter nbconvert --to python my_file.ipynbipynb转换为mdjupyter nbconvert --to md my_file.ipynbipynb转为htmljupyter nbco...
原创
12883阅读
0评论
5点赞
发布博客于 3 年前

配置Jupyter notebook可以跨机器使用

创建key的步骤如下:step1 生成一个 notebook 配置文件: jupyter notebook --generate-configstep2 生成密码:jupyter notebook passwordjupyter notebook passwordEnter password: ****Verify password: ****[NotebookPasswordApp] Wrot...
原创
1946阅读
0评论
0点赞
发布博客于 3 年前

H264 指数哥伦布编码

引言最近在看H.264/AVC的一些编码信息,印象最深的就是sps,pps 中的指数哥伦布(Golomb)熵编码算法,从网上搜了一些内容,发现讲解的不是很详细,所以自己总结一下便于自己查看sps,pps中常用的指数哥伦布编码算法有 1、无符号指数哥伦布熵编码 ue(v) 2、有符号指数哥伦布熵编码 se(v) 3、映射指数哥伦布熵编码 me(v) 4、截断指数哥伦布熵编码 te(v) 后两者不是很...
转载
741阅读
0评论
0点赞
发布博客于 3 年前

SRCNN-study

Super-Resolution:
原创
3243阅读
1评论
0点赞
发布博客于 3 年前

从SRCNN到EDSR,总结深度学习端到端超分辨率方法发展历程

原文地址:https://blog.csdn.net/abluemouse/article/details/78710553一篇综述性质的文章,写的很好。超分辨率技术(Super-Resolution, SR)是指从观测到的低分辨率图像重建出相应的高分辨率图像,在监控设备、卫星图像和医学影像等领域都有重要的应用价值。本文针对端到端的基于深度学习的单张图像超分辨率方法(Single Image Su...
转载
4372阅读
0评论
1点赞
发布博客于 3 年前

hdrnet cvpr2017

cvpr2017获奖文章,hdrnet,使用深度学习基础进行高动态范围图像处理,效果比较好,国内不好下载,共享在此,资源分数只能选择1-5,不能选零了。 希望能帮助到对图像处理感兴趣的亲
pdf
发布资源于 3 年前

HDRNet study

深度学习最近在图像处理领域经常有革命性的成果出来,继SRCNN之后,在图像处理领域应该当属HDRNet了,CVPR2017比较优秀的文章。源码https://github.com/google/hdrnethttps://github.com/mgharbi/hdrnet_legacy论文deep_bilateral_learning_f...
原创
11573阅读
24评论
3点赞
发布博客于 3 年前

numpy scipy opencv 操作图像数据

python numpy是一个核心的数据结构,numpy的结构如何转换为opencv的图像数据结构呢,numpy如何快速的操作图像数据呢?如下sample code所示:import cv2import numpy as npimg = np.zeros((300,300,3))img[:,10,0] = 255img[:,10,2] = 255img[10,:,1] = 255i...
原创
3283阅读
0评论
0点赞
发布博客于 3 年前

mp4文档及解码程序源码

从官网上下载的标准SPEC,以及一个标准C写的MP4 Box parse程序,配合着SPEC看,会比较好。程序在Windows下使用VS2013可以直接跑,需要的话,可以看看main函数,如何传入mp4文档。
rar
发布资源于 3 年前

MP4文件分析

图形化分析工具MP4Reader:https://en.freedownloadmanager.org/Windows-PC/MP4-Reader-FREE.html这个工具相比于mp4info会强大很多,图形化显示信息之外,还会将MP4文件的二进制信息同步显示,方便对比分析。效果如下:文档spechttps://developer.apple.com/library/content/docume...
原创
6074阅读
0评论
0点赞
发布博客于 3 年前

mp4 文件中的h264 avc1格式介绍

MP4的视频H264封装有2种格式:h264和avc1,对于这个细节,很容易被忽略。笔者也是在改编LIVE555流媒体时,增加mp4文件类型支持时遇到了该问题。(一)首先,从原理上了解一下这2种格式的区别:AVC1 描述:H.264 bitstream without start codes.一般通过ffmpeg转码生成的视频,是不带起始码0×00000001的。H264 描述:H.264 bit...
转载
2335阅读
0评论
0点赞
发布博客于 3 年前

MP4文件格式简要解析

准备安装mediaInfo、QTAtomViewer.exe、MP4info.exe等软件视频一些参数封装格式:我也不太清楚编码格式:我也不太清楚分辨率:图像的长和宽。帧率:一秒播放的图片数,如15fps、30fps,体现在画面的流畅度。码率:压缩后每秒显示的图片数据量,通俗地说,就是流量。如298kbps,体现在视频文件的大小和画质。压缩比:分辨率*帧率/码率,简单来说就是压缩前每秒的数据量比上...
转载
1371阅读
0评论
1点赞
发布博客于 3 年前

MP4文件格式详解——结构概述

MP4文件格式详解(ISO-14496-12/14)一、基本概念1、 文件,由许多Box和FullBox组成。2、 Box,每个Box由Header和Data组成。3、 FullBox,是Box的扩展,Box结构的基础上在Header中增加8bits version和24bits flags。4、 Header,包含了整个Box的长度size和类型type。当siz...
转载
1246阅读
0评论
0点赞
发布博客于 3 年前

scikit-learn使用KNN进行回归

k近邻算法的核心思想是未标记样本的类别,由距离其最近的k个邻居投票决定。该算法具有准确性高,对异常值和噪声有较高的容忍度等优点。缺点是计算量比较大,内存消耗量也大。Text:code:import numpy as npimport matplotlib.pyplot as pltfrom sklearn.neighbors import KNeighborsRegressorn_dot...
原创
6355阅读
0评论
1点赞
发布博客于 3 年前

scikit-learn使用KNN进行分类

k近邻算法的核心思想是未标记样本的类别,由距离其最近的k个邻居投票决定。该算法具有准确性高,对异常值和噪声有较高的容忍度等优点。缺点是计算量比较大,内存消耗量也大。demo code如下:from sklearn.datasets.samples_generator import make_blobsimport matplotlib.pyplot as pltimport numpy as ...
原创
6037阅读
0评论
0点赞
发布博客于 3 年前

YoloV3 study

确保本机器已经成功安装了tensorflow, keras, opencv, python3.x下载python codehttps://github.com/xiaochus/YOLOv3下载darknet modelhttps://github.com/xiaochus/YOLOv3  从quick start中下载已经训练好的model,230+M将darknet model转换为h5进入y...
原创
3171阅读
0评论
0点赞
发布博客于 3 年前

如何查看ppm格式的图像

ppm格式图像的详细介绍https://blog.csdn.net/gengshenghong/article/details/8648577如何查看呢?用ffplay直接播放,ffplay -i a.ppm用ffmpeg直接转码, ffmpeg -i a.ppm a.bmp使用python image包,直接转码输出from PIL import Imageimg = Image.open('...
原创
12030阅读
0评论
1点赞
发布博客于 3 年前

H264呼吸效应及其调节方法

呼吸效应的概念H26x编码序列中,I帧P帧交替排列,I帧使用帧内预测编码,跟jpeg类似,压缩比相对P帧来说,没有那么大,因此I帧的数据量很大,但是I帧也相对比较清楚,P帧以I帧为基准进行预测编码,I帧清楚了,P帧才有可能清楚;一般情况下,我们都会将I帧调的比较大,一个GOP内,离I帧越远的P帧,编码误差越大,图像降质也越严重,当下一个I帧出现时,图像又立即变得清楚起来,纵观整个视频流,就会周期性...
原创
7739阅读
0评论
2点赞
发布博客于 3 年前

python 制作自定义包并安装到系统目录

    python 中的包的概念跟c++中的namespace很相似,在大型的工程开发中,多个开发人员很容使用相同的函数名,为了避免相同函数名带来的问题,就引入了包的概念。在看别人写的程序中经常看到形如“from xx import yy”xx就是包制作一个本地使用的包    建立一个文件夹并命名为dl,文件夹名"dl"就是我们的包名,在文件夹内部新建一个“__init__.py”(注意init...
原创
12133阅读
0评论
0点赞
发布博客于 3 年前

python class的特殊方法

__init__ 构造方法__str__ __def__ 析构方法__mro__ python3特有@classmethod 类方法
原创
6364阅读
0评论
0点赞
发布博客于 3 年前

python 实现类似下载进度的效果

主要借助于回显的思想来实现print函数就可以实现,默认情况下print会自动换行,我们可以在print函数中添加 end='',使其不自动换行,结合回显\r就可以实现了。上一段code#coding=utf8import timeimport sysimport sys,time"""#方法一for i in range(100): sys.stdout.write("#...
原创
6346阅读
0评论
0点赞
发布博客于 3 年前

python解析命令行参数

使用一个先进的模块名为argparse,跟unix程序的命令行参数很像。直接对code做个笔记:import sysimport argparsedef main(args): print('first name directory: %s' % args.first_name) print('first para : %s' % args.first_para) ...
原创
6259阅读
0评论
0点赞
发布博客于 3 年前

如何快速查看tensorflow 的model文件结构

从github经常下载别人训练好的model,一个pb文件,里面都存储了什么东西呢?不像caffe,网络结果直接是一个文本文件,可以快速查看。当然我们可以去找对应的文章,去查询网络结构等信息。但是tensorflow有更好的方法。Tensorboard去解析这些model文件,很强大。安装,pip install tensorboard推荐使用whL的方式安装,当你机器上有多个tensorflow...
原创
12136阅读
3评论
3点赞
发布博客于 3 年前

Tensorflow GPU训练过程中遇到的问题总结

错误类型:CUDA_ERROE_OUT_OF_MEMORYGPU的全部memory资源不能全部都申请,可以通过修改参数来解决:在session定义前增加config = tf.ConfigProto(allow_soft_placement=True)#最多占gpu资源的70%gpu_options = tf.GPUOptions(per_process_gpu_memory_fraction=0...
原创
3509阅读
0评论
0点赞
发布博客于 3 年前

caffe model如何转tensorflow model

在生产环境中,使用api调用caffe训练生成的模型,依赖的第三方库太多,环境安装是个麻烦问题,同时在平台间移植也是个很麻烦的事情。比如说,在ubuntu16下训练好的caffe模型,需要移植到ios、android手机端等平台,caffe需要做大量的开发工作。 如果使用tensorflow的话,依赖就要少很多,可以很灵活的支持ios、android等移动端平台,可以很方便地使用api调用训练好的
转载
8606阅读
1评论
2点赞
发布博客于 3 年前

win10 tensorflow MTCNN Demo

doc mark hereMTCNN 入口代码#coding = gbkimport tensorflow as tfimport numpy as npimport cv2import detect_faceimport time#face detection parametersminsize = 20 # minimum size of facethresh
原创
7207阅读
5评论
0点赞
发布博客于 4 年前

win10+anaconda2+cuda8.0+cudnn6.0安装tensorflow-gpu

使用MNIST数据集进行测试,最好可以将MNIST数据集先下载下来,不要让code自己去下载,代码中下载比较慢,将数据集下载下来直接放入code中指定的文件夹下面,文件名不要修改,直接将code run起来。差不多2分钟吧,精度99.8%code如下:# -*- coding: utf-8 -*- import tensorflow as tf#导入input_data用于自动下载
原创
6400阅读
0评论
0点赞
发布博客于 4 年前

win10 anacoda2 cuda theano安装笔记

找不到cudnn –lcudnn在[dnn]中配置library_path之后就好了。
原创
6238阅读
0评论
0点赞
发布博客于 4 年前

决策树算法实现

1、python本课程的机器学习的算法都是基于python语言实现的,所以你需要有一定的python语言基础,可以参考彭亮在麦子学院讲授的“Python语言编程基础”。2、python机器学习的库:scikit-learn特性: 1)简单高效的数据挖掘和机器学习分析 2)对所有用户开放,根据不同需求高度可重用性 3)基于Numpy, SciPy和matplotl
转载
8617阅读
0评论
0点赞
发布博客于 4 年前

机器学习&深度学习视频资料大汇总

第一部分 基础语言pandax视频教程链接: https://pan.baidu.com/s/1pLqavVX 密码: fathpython入门到精通链接: https://pan.baidu.com/s/1mhVNIkC 密码: cvp3第二部分 数据篇链接: https://pan.baidu.com/s/1pLK25zP 密码: qtuu第三部分 机器学习部分吴恩
转载
405阅读
0评论
0点赞
发布博客于 4 年前

集成开发环境pycharm开发opencv项目

习惯了集成开发环境,而且python也有一个好用的集成开发环境名为pycharm,记录一下:pycharm官网:http://www.jetbrains.com/pycharm/安装完这个之后,接着安装anaconda2,这算是一个python的发行版吧,将常用的python 包都集成在了一起,更新非常方便,图示如下:看图示:将pycharm中的python解释器定位到anac
原创
10309阅读
0评论
1点赞
发布博客于 4 年前

SDL窗体嵌入到MFC/QT窗口控件上的方法总结

MFC嵌入方法:SDL_Window* SDL_CreateWindowFrom(const void* data);API详细介绍:Use this function to create an SDL window from an existing native window.http://wiki.libsdl.org/SDL_CreateWindowFrom
原创
8760阅读
0评论
0点赞
发布博客于 4 年前

ffplay常用命令

直接播放设备Linux :   ffplay –f v4l2 –s 320x240 –i /dev/video0Windows: 使用direct show  ffplay –f dshow –s 320x240 -i video="Integrated Camera"                    使用vfw                 ffplay -f vfwcap
原创
11230阅读
0评论
0点赞
发布博客于 4 年前

x265 学习--初识--压一段H265视频

记录学习过程,如果能给其他人带来帮助那就更好了。废话少说。https://github.com/videolan/x265从上述地址上直接download 源码。创建VS工程x265相比于x264,对喜欢用VS调试代码的用户来说更加友好(x264早期的版本还可以直接使用VS,之后就比较麻烦了),CMakelist直接写好了,x265连生成VS工程的bat文件都写
原创
14403阅读
2评论
0点赞
发布博客于 4 年前