机器学习
herr_kun
喜欢有趣的新方向,涉猎广泛,方向专一
展开
-
一目了然之 PCA SVD 协方差 相关系数及区分
一、数据降维技术 主要有三种:PCA(主成分分析法)、FA(因子分析法)、ICA(独立成分分析法),应用最广范、最广为人知的就是PCA方法,这里主要分析PCA方法。二、PCA 首先要知道的是PCA降维的原理和目的是什么? 原理:最大化投影后数据的方差,表示为在某一维度的投影方差最大,如下图中当前位置不是投影方差最大的位置,因为好多点重合到了一起,因此在该维度我们就很难区分重叠的数...原创 2018-05-17 02:12:34 · 2864 阅读 · 1 评论 -
jupyter notebook隐藏但很实用的小技巧
很实用的jupyter notebook使用技巧-隐藏但很实用的小技巧转载自:https://blog.csdn.net/simple_the_best/article/details/52821136(图片无法加载)原版为:https://www.dataquest.io/blog/jupyter-notebook-tips-tricks-shortcuts/ 里面有对应的动图和图片讲解...转载 2019-03-01 11:10:01 · 8266 阅读 · 0 评论 -
Jetson Xavier、Jetson TX2、 1080(Ti)、2080显卡运行深度学习模型性能对比(英伟达开发平台VS常用显卡)
前言: 英伟达的Jetson TX2使得很多人认为深度学习模型终于可以像嵌入式开发平台那样做到小型化了,不用再跑在高配计算机或者服务器上面了,但是实际上Jetson TX2开发板的性能和深度学习常用到的1080(Ti)以及2080 还有一定的差距,接下来英伟达又出了一个Jetson Xavier,可以说是Jetson TX2的升级版,性能自然是强了很多,并且个人很喜欢的是英伟达把...原创 2019-02-25 17:38:56 · 40136 阅读 · 2 评论 -
最新win10+2080Ti下安装TensorFlow-GPU(带各个版本的cuda cudnn)
最新实测好用环境: Windows10 2080Ti 显卡 安装网上说的教程进行安装,需要的配置环境: cuda10 + cudnn 7.3.1版本这里谨记一点:不要进去下最新的版本,到目前发布为止,官网的cuda版本为10.1 地址:https://developer.nvidia.com/cuda-downloads但是这里的 cuda 10.0 和 10.1 不一样,...原创 2019-03-16 14:47:09 · 8661 阅读 · 5 评论 -
找不到指定的DLL+ “import tensorflow” generates No module named “_pywrap_tensorflow” error
安装TensorFlow-GPU时的error:找不到指定的DLL+ “import tensorflow” generates No module named “_pywrap_tensorflow” error+Failed to load the native TensorFlow runtime.搜集的集中解决方法:1、cuda 和 cudnn的版本错误-较常见2、nump...原创 2019-03-16 15:01:29 · 372 阅读 · 0 评论 -
使用模型预测的时候GPU使用率的问题
这里是在使用LSTM进行预测的时候的gpu使用情况将C:\Program Files\NVIDIA Corporation\NVSMI中的nvidia-smi文件拖入到cmd窗口查看GPU 的使用情况下图是未进行模型预测时的使用情况:可以看到当没有模型运行时,GPU的使用率是很低的下图是进行预测时的使用情况(batchsize=10000):可见GPU的使用率已经很高了...原创 2019-03-30 11:12:18 · 3801 阅读 · 0 评论 -
CV计算机视觉(computer vision)概述--个人理解
CV即计算机视觉,简单的来说:计算机模拟人来理解图像所表达的意思,或对图像进行一些理智的操作,比如分割,分类等等。目前接触到的计算机视觉主要有: 图像分类(包括细粒度特征分类):将图像进行分类,该图像是飞机 ?汽车?狗?或者什么 目标定位和识别(如yolo ssd等神经网络):图像中的目标物体的位置(用框就行标注),框中物体的种类,是什么 图像分割:比如一张CT照...原创 2019-04-04 17:31:30 · 20270 阅读 · 0 评论 -
加快pip包安装速度(使用镜像)
使用豆瓣的镜像,下载速度会快很多:pip install xxxx --user -i https://pypi.douban.com/simplepip install xxxx==sss --user -i https://pypi.douban.com/simple 安装指定版本的包...原创 2019-04-24 14:57:47 · 1897 阅读 · 0 评论 -
神经网络结构可视化及网络结构绘制工具
介绍几个好用的神经网络画图以及可视化的工具(1)神经网络可视化工具:Netron(2)画神经网络结构图工具: NN-SVG 、ConvNetDraw1、神经网络可视化工具:Netron地址:下载地址 netron参考:参考2、画神经网络结构图工具: NN-SVG 、ConvNetDraw地址:下载地址 参考:参考...转载 2019-04-19 21:35:07 · 5779 阅读 · 0 评论 -
神经网络中Dropout和Padding
1、PaddingPadding有两种方式,same和valid,其中same比较常见,因为是进行了填充,对图像的每一个像素点都进行了卷积操作,而valid有可能扔到一些边缘信息。两种的计算方式不同:2、DropoutDropout有意思的是每次训练都会随机扔到一些节点不进行训练,已达到防止过拟合的效果。当然在预测的时候是所有的节点都参加进行的预测,但是在预测的时候所有节点的权重要乘以一个...原创 2019-05-06 10:45:55 · 1450 阅读 · 0 评论 -
增量学习的理解(迁移学习,fit_genrtor区别)
近日看到了有关增量学习的理解,一开始以为增量学习就是Keras中的fit_genetor,相当于分批次进行学习,防止数据量太大造成内存崩溃而无法学习,并且增量学习可以结合pandas中每次读取一定数目的数据的功能来进行传统机器学习(SVM,lightgbm等)和神经网络的学习。后来了解到增量学习分为三种:增量学习可以分为3类:样本增量学习(SIL),类别增量学习(CIL),特征增量学习(F...原创 2019-05-14 23:36:47 · 6103 阅读 · 2 评论 -
python-seaborn画图-(matploytlib)更高级的数据绘图工具
@TOCpython seaborn画图以前觉得用markdown写图文混排的文字应该很麻烦,后来发现CSDN的markdown真是好用的。在做分析时候,有时需要画几个图看看数据分布情况,但总记不住python的绘图函数。今天有空顺便整理下python的seaborn绘图函数库。 Seaborn其实是在matplotlib的基础上进行了更高级的API封装,从而使得作图更加容易,在大多...转载 2019-02-19 11:50:27 · 8352 阅读 · 0 评论 -
Opencv的视频捕捉功能+多线程
import cv2import numpy as npfrom matplotlib import pyplot as pltimport threading#其中0表示调用笔记本的内置摄像头cam = cv2.VideoCapture(0)(ret, img) = cam.read()img2 = imgimg3 = imgimg4 = imgdef sift_thre...原创 2019-02-21 18:46:18 · 1587 阅读 · 0 评论 -
labelme把绘制的区域抠出来
1、标注图:2、效果图:3、代码# -*- coding: utf-8 -*-"""Created on Fri Jan 18 20:28:58 2019@author: Herr-kun"""import jsonimport matplotlib.pyplot as pltimport numpy as npfrom labelme import u...原创 2019-01-18 21:55:20 · 4401 阅读 · 17 评论 -
SIFT+词袋+SVM的深入理解
为什么这么做,而不是直接像是HOG那样输入到svm中直接进行分类?首先了解一下返回的参数是什么样子和形式的:import cv2img = cv2.imread(r'C:\Users\Pictures\Camera Roll/xxy.jpg')gray= cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)# one SIFT#sift = cv2.xfeature...原创 2018-05-07 01:52:10 · 8654 阅读 · 4 评论 -
Opencv SIFT SURF ORB FAST 代码以及效果对比
开发环境:win10 anaconda python3.6 opencv3 1、四种特征提取算法简介(需要深入的同学可以参考其他博主的博客) SIFT特征主要提取图像的局部特征,对平移、旋转、尺度缩放、亮度变化、遮挡和噪声等具有很好的不变性,对视觉变化、仿射变换也保持一定程度的稳定性。SURF可以说是从SIFT发展而来的,速度上优于SIFT,快了一个数量级(10倍),并且稳定性要高于S...原创 2018-05-06 22:04:06 · 4137 阅读 · 2 评论 -
word embedding and word2vec 理解
该篇博文纯属个人观点,本着共同交流学习的想法,其中有错误和不足还请大佬们指正。在NLP处理中,词向量是网络的基本输入,那么该如何获得词向量呢? 两种方法,一种是one-hot representation(中文:独热表示,不建议记中文名,以后均是英文),另一种是distribute representation。一、One-hot representation 问什么称之为one-ho...原创 2018-03-04 23:24:32 · 1372 阅读 · 1 评论 -
conda install failed
使用pip install package 时会出现:parse() got an unexpected keyword argument 'transport_encoding'的错误此时是因为pip 的版本太低了,因此需要升级pip,但是当博主进行conda install pip 时出现了anaconda prompt死机的现象,因此直接更新,使用conda update pip 进行更新更...原创 2018-05-11 03:19:15 · 2235 阅读 · 0 评论 -
导入Keras、TensorFlow 时出现:Failed to load the native TensorFlow runtime.
背景及环境介绍:重装了系统,发现使用TensorFlow时出现了Failed to load the native TensorFlow runtime. 目前环境:win10 、anaconda 、python3.6 、TensorFlow—CPU罗列一下博客以及Stack Overflow上的解答:部分参考来自这里,但是上述均没有解决我的问题。经过一系列的摸索得出解决方案:1、先使用conda...原创 2018-05-25 11:10:28 · 13726 阅读 · 0 评论 -
Adaboost、GBDT、XGBoost的对比理解
本篇文章重点不在于对三者的解析,主要是作者的一些理解,希望其中的某一点能帮助你更好的理解算法。1.Adaboost 模型 首先是Adaboost,它的基本思想是提高前一轮弱分类错误分类样本的权重,降低正确分类样本的权重,因此,在后面的训练中,接下来的分类器就更加“关注”那些分错的样本点,这样,多个弱分类器组合起来就是Adaboost,这是简单的Adaboost的理解,当然也可以从一个...原创 2018-07-20 23:55:26 · 18861 阅读 · 2 评论 -
隐马尔科夫模型-EM模型-混合理解
本文主线:首先从隐马尔科夫模型开始说起,接着由马尔科夫模型的计算引出EM模型,并进行讲解。 (内容会尽量以交流白话的形式,便于大家理解,文章中对模型的介绍会先提出一些专业名词,然后结合实例对公式和名词进行解释。)1、什么是隐马尔科夫: 隐马尔科夫主要在于“隐”字,因为其中有一个状态是看不到的,比如我们有三个不同的骰子,你怎么根据你看到最终得到的点数序列推算出各个点数是哪...原创 2018-10-31 21:14:42 · 2917 阅读 · 0 评论 -
Tensorflow 疑难杂解及使用tricks(做记录)
1、name_scope and variable_scope 其实主要区别我认为:name_scope不会给get_variable()加名字前缀(但是会正常给其他常量以及变量加),但是variable_scope可以,因此在程序中很多定义variable的时候用variable_scope这个域名。可以参考这个博客:https://blog.csdn.net/u012436149...转载 2018-11-22 11:28:06 · 225 阅读 · 0 评论 -
CrossValidation 交叉验证和Stacking的深入理解
1、CrossValidation 交叉验证训练集,测试集,和验证集三者之间的关系: 首先要了解到我们的数据集一般分为训练集,测试集,和验证集,训练集主要是训练,验证集主要是为了验证模型的性能,从而选择不同的模型参数,测试集就是进行最终模型的测试,比如准确率是多少,这里的最终模型一般指的是经过验证集从而选择合适的参数从而得到的模型,因此三者之间的关系大概就是这样的。什么是交叉验...原创 2018-12-06 14:31:12 · 3654 阅读 · 4 评论 -
关于anaconda conda安装时需要升级很多包的问题
最近搭建的坏境不知道被谁给破坏掉了,只好全部删除,重新搭建anaconda坏境。但是遇到了很多安装的问题,之前使用anaconda时没有发现这么多大问题,下面一一讲解下:1、pip 不能用,安装TensorFlow是提示解析出错,找了很多,提示说是升级pip就行了,原因是由于 安装TensorFlow可能会破坏pip,所以才导致不好用,但是使用conda 命令升级pip时,会提示安装一大堆第三...原创 2019-01-01 20:40:42 · 11862 阅读 · 0 评论 -
TensorFlow训练模型的重载(不需要重定义原有的计算图)
前言: 当我们已经训练好一个网络之后,并且将模型保存了,那么当我们想在另一个电脑上使用怎么办,对于Keras来说非常简单,只需要直接load model,然后直接调用predict方法就可以了,但是TensorFlow毕竟封装性不如Keras好,那么当需要加载时我们还需要重新建立一遍计算图么?不用的,直接取我们想要的变量即可。看下面 其实我们只是不需要手动建立计算图,而是从...原创 2019-01-23 20:35:58 · 2122 阅读 · 0 评论