machine learning
文章平均质量分 78
Z_shsf
学思合一,知行合一
展开
-
【CV】ORB算法
会根据关键点周围的梯度信息计算出关键点的主方向,并将图像旋转到关键点的主方向,然后再提取BRIEF描述符。如果一个像素周围存在连续的像素强度值超过或低于该像素强度值的阈值,那么该像素就被认为是一个角点。BRIEF描述符具有较好的计算效率和匹配鲁棒性,但对图像的旋转、尺度和光照变化不具备不变性。ORB算法在一定程度上具备旋转不变性和尺度不变性,对图像的光照变化也具有一定的鲁棒性。FAST算法对图像的亮度变化和旋转变化具有一定的不变性,但对于尺度变化不具备不变性。,周围16个像素点的亮度值为。原创 2024-04-10 23:05:31 · 1269 阅读 · 0 评论 -
opencv支持的一些计算光流的算法
总的来说,Farneback光流算法是一种基于密集光流的方法,适用于需要精细的像素级别运动信息的任务,如视频稳定、光流场估计等。构建雅可比矩阵:根据当前帧和下一帧图像的灰度梯度信息,构建一个关于运动参数的雅可比矩阵,这个矩阵描述了像素灰度值对运动参数的响应。图像金字塔构建:首先,对输入的图像序列构建高斯金字塔,这样可以处理不同尺度的运动,并使得算法对于不同尺度的运动都有较好的适应性。建立窗口:对于每个选定的特征点,定义一个小的局部窗口,通常是一个矩形区域,用来捕获周围像素的灰度信息。原创 2024-04-09 22:47:37 · 1560 阅读 · 0 评论 -
【ML】windows 安装使用pytorch
使用pytorch需要python环境,建议是直接装anaconda ,IDE用visual studio。原创 2023-04-26 19:27:36 · 535 阅读 · 0 评论 -
自然语言模型发展历程 及 Transformer GPT Bert简介
简要介绍NLP发展历程和Transformer GPT Bert模型原创 2023-04-05 23:07:07 · 1222 阅读 · 0 评论 -
feature scaling 特征缩放
训练模型流程以SVM为例: 1. 求特征,并存为可识别的数据文件(训练集样本,训练集标签,测试集样本,测试集标签) 2. 特征缩放 3. 首选RBF核 4. 使用交叉验证+网格法选最优参数 5. 使用最优参数建模 6. 测试里面最值得注意的有两步:特征缩放特征缩放的优点在运用一些机器学习算法的时候不可避免地要对数据进行特征缩放(feature scaling),特征缩放可以使机器学习算法原创 2017-09-21 12:20:14 · 3172 阅读 · 0 评论 -
机器学习笔记
开发环境为pythonpicklepython的pickle模块实现了基本的数据序列和反序列化。通过pickle模块的序列化操作我们能够将程序中运行的对象信息保存到文件中去,永久存储;通过pickle模块的反序列化操作,我们能够从文件中创建上一次程序保存的对象。 pickle.dump(obj, file, [,protocol]) 注解:将对象obj保存到文件file中去。 protocol原创 2017-10-07 22:55:38 · 462 阅读 · 0 评论 -
MARK!andrew ng的ml课程学习笔记,后续整理
最近因为一些事情打乱了学习计划,先mark下学习进程,后续再进行…… 先记录一些关键公式理论的推导,后续再整理 等解决完手头事情,从交叉验证开始,期待,善良终将被世界温柔以待,我们都有美好明天~原创 2017-09-12 12:22:03 · 610 阅读 · 0 评论 -
(Stochastic gradient descent)和 (Batch gradient descent )的对比
BATCH: 但是每迭代一步,都要用到训练集所有的数据 Stochastic: 随机梯度下降是通过每个样本来迭代更新一次,如果样本量很大的情况(例如几十万),那么可能只用其中几万条或者几千条的样本,就已经将theta迭代到最优解了,对比上面的批量梯度下降,迭代一次需要用到十几万训练样本,一次迭代不可能最优,如果迭代10次的话就需要遍历训练样本10次。但是,SGD伴随的一个问题是噪音较BGD要多原创 2017-08-31 11:12:34 · 544 阅读 · 0 评论 -
git 工具——学习使用(1)
想跳过概念直接下载安装的点这里 安装说明在zip文件内,安装后到工作目录单击右键你会发现多了菜单~三种重要状态记住下面这些关于 Git 的概念。 Git 有三种状态,你的文件可能处于其中之一:已提交(committed)、已修改(modified)和已暂存(staged)。 已提交表示数据已经安全的保存在本地数据库中。 已修改表示修改了文件,但还没保存到数据库中。 已暂存表示对一个已修改文件的当前原创 2017-08-17 15:48:12 · 453 阅读 · 0 评论 -
机器学习—课程学习(机器学习+机器视觉CS231n)
Andrew NG的机器学习课程: http://open.163.com/special/opencourse/machinelearning.html 课件资料可以直接在该页面打包下载李菲菲cs231n深度学习计算机视觉课程 听课网址:http://study.163.com/course/courseMain.htm?courseId=1003223001 平台:网易公开课 课件资料原创 2017-08-15 21:24:36 · 1448 阅读 · 0 评论 -
机器学习-The CIFAR-10 dataset下载
介绍CIFAR-10 数据集The CIFAR-10 dataset由 32x32 的10类彩图组成,每类6000张,一共60000张 . 其中训练集中有50000张,测试集中有10000张. 数据集分为五个训练分支和一个测试分支,每个分支中都包含10000张图片。原创 2017-08-17 11:27:15 · 1596 阅读 · 0 评论 -
python k-means聚类
K-Means聚类思想随机选K个点作为中心根据剩下点与选出的K个中心点的距离,归入最近的类重新计算所有点的均值作为中心重复2,3直至聚类中心不再发生改变python实现:import numpy as npfrom sklearn.cluster import KMeansdef loadData(filePath): fr = open(filePath,'r+')原创 2017-05-17 16:24:43 · 1423 阅读 · 0 评论 -
python 机器学习-sklearn基本功能
sklearn 库共分六大部分:分类,回归,聚类,降维,模型选择,数据的预处理 分别展示如下:分类任务最近邻算法(neighbors.NearestNeighbors)支持向量机(svm.SVC)朴素贝叶斯(naive_bayes.GaussianNB)决策树(tree.DecisionTreeClassifier)集成方法(ensemble.BaggingClassifier)神经网原创 2017-05-16 21:06:29 · 1480 阅读 · 0 评论 -
Python中 sys.argv[]的用法
sys.argv[]说白了就是一个从程序外部获取参数的桥梁,这个“外部”很关键,所以那些试图从代码来说明它作用的解释一直没看明白。因为我们从外部取得的参数可以是多个,所以获得的是一个元组,也就是说sys.argv其实可以看作是一个元组,所以才能用[]提取其中的元素。其第一个元素是程序本身,随后才依次是外部给予的参数。下面我们通过一个极简单的test.py程序的运行结果来说明它的用法。import s原创 2017-05-23 11:50:53 · 600 阅读 · 0 评论 -
range np.vstack
列出一些函数rangeclass range(stop) class range(start, stop[, step])>>> list(range(10))[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]>>> list(range(1, 11))[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]one-hot encoding三类特征:[‘fwjoei’,’ef原创 2017-10-04 16:17:05 · 554 阅读 · 0 评论 -
MFCC原理及代码
MFCC是Mel-Frequency Cepstral Coefficients的缩写,包含两个关键步骤:转化到梅尔频率,然后进行倒谱分析。梅尔刻度的滤波器组在低频部分的分辨率高,跟人耳的听觉特性是相符的。 做法是:首先对时域信号进行傅里叶变换转换到频域,然后再利用梅尔频率刻度的滤波器组对应频域信号进行切分,最后每个频率段对应一个数值。倒谱分析倒谱的含义是:对时域信号做傅里叶变换,然后取log,原创 2017-10-04 22:23:11 · 2455 阅读 · 0 评论 -
python环境安装tensorflow
pycharm安装pip下载pip安装包,地址:http://download.csdn.net/my注意选择tar.gz包,目前最新版本为:pip-9.0.1.tar.gz (md5, pgp) 解压安装包(如解压至系统D盘),打开Windows CMD,运行如下命令进入解压后的pip目录 cd D:\pip-8.1.2使用如下命令进行安装python setup.py install原创 2017-10-04 23:15:31 · 9028 阅读 · 0 评论 -
udacity deeplearning实战(六)
来到课程最后一次小作业,训练完word2vec模型后,作业六基于Text8.zip语料训练一个LSTM模型,用perplexity评价训练得到语言模型的质量,越低越好。LSTMProblem 1num_nodes = 64graph = tf.Graph()with graph.as_default(): # Parameters: # Input gate: input, prev转载 2017-12-29 23:27:13 · 553 阅读 · 0 评论 -
Udacity Deep Learning实战(五)
作业五是根据Text8的语料库训练一个语言模型word2vec,得到语料库中每个词的嵌入式表达(向量)。Mikolov提出的word2vec包括skip-gram和CBOW两种模型,前者是根据给定词预测其周围的词,后者是根据周围的词预测中间的词。Mikolov最大的贡献是采用negative sampling的方法极大提升神经网络模型的计算效率。官方的作业ipynb给出了skip-gram的实现,要转载 2017-12-29 23:23:51 · 363 阅读 · 0 评论 -
Udacity Deep Learning实战(四)
这部分作业未完 第四章作业主要是关于卷积神经网络的练习,涉及到tf.nn.conv2d、tf.nn.max_pooling等的使用。相关API的用法tf.nn.conv2dtf.nn.conv2d(input, filter, strides, padding, use_cudnn_on_gpu=None, name=None):input和filter都是4D的tensor类型,计算两者的2D卷转载 2017-12-29 23:18:29 · 338 阅读 · 0 评论 -
Udacity Deep Learning实战(三)
第三次作业主要学习如何使用tf的函数处理模型过拟合。 源码https://github.com/Zerof007/uda_deeplearning_z Problem 1Linear Regression with Regularizationbatch_size = 128graph = tf.Graph()with graph.as_default(): # Input data.转载 2017-12-29 23:12:57 · 366 阅读 · 0 评论 -
Udacity Deep Learning实战(二)
第二次作业比较简单,实现一个隐含层1024个节点的三层神经网络,选用ReLU作为激活函数,实现作业一中的字母图片分类。实现代码如下,主要是实现computation(dataset, weights, biases)函数,返回logits取代原来的线性回归模型。hidden_nodes = 1024batch_size = 128def computation(dataset, weights,转载 2017-12-29 23:06:36 · 341 阅读 · 0 评论 -
Udacity Deep Learning实战(一)
Udacity的深度学习是Google开设的一门基于TensorFlow完成任务的在线课程,课程短小精悍,包括4章(入门ML/DL,DNN,CNN,RNN)、6个小作业(以ipynb的形式,十分方便友好)和1个大作业(开发实时摄像头应用)。有ML/DL基础的同学,视频很快可以过完,因此课程精华在于其实战项目,很有意思。作为G家的课程,算是TensorFlow比较权威的学习tutorial了。Prob转载 2017-12-29 23:02:01 · 523 阅读 · 0 评论 -
机器学习(4)
udacity 1、两层神经网络 第一层由一组 X 的权重和偏差组成并通过 ReLU 函数激活。 这一层的输出会提供给下一层,但是在神经网络的外部不可见,因此被称为隐藏层。 第二层由隐藏层的权重和偏差组成,隐藏层的输入即为第一层的输出,然后由 softmax 函数来生成概率。 2、反向传播比正向传播所需要的存储空间多一倍实例分析batch_size = 128#添加隐藏层 注意隐藏层的权值原创 2017-12-29 22:56:22 · 277 阅读 · 0 评论 -
机器学习(3)
1、零概率问题,分子加1分母加上相应的偏置(根据样本取值范围)。 2、朴素贝叶斯–生成学习算法,核心是贝叶斯公式 3、离散化,先分段,统计区域内点数 4、特征选择,使用特征计算不同特征和信号的相关度,相互信息、KL距离 5、正则化防止过拟合 6、k-means得到的是局部最优,所以多次随机初始化观察聚类结果 7、EM算法,对数似然性最大化,构建下界,使用不等式凸函数fE[x]<=Ef[x原创 2017-12-29 09:51:19 · 277 阅读 · 0 评论 -
机器学习笔记(2)
picklepickle.dump(obj, file, [,protocol]) 注解:将对象obj保存到文件file中去。 protocol为序列化使用的协议版本,0:ASCII协议,所序列化的对象使用可打印的ASCII码表示;1:老式的二进制协议;2:2.3版本引入的新二进制协议,较以前的更高效。其中协议0和1兼容老版本的python。protocol默认值为0。 file:对象保存到的原创 2017-11-04 11:09:08 · 344 阅读 · 0 评论 -
安装docker
docker win10专业版和企业版可以直接安装:http://get.daocloud.io/#install-docker-for-mac-windows 其他只能安装docker toolbox 安装包在这里:去官方网站下载toolbox–>https://www.docker.com/toolbox 速度慢可以去这里下载https://get.daocloud.io/toolbox/wi原创 2017-10-06 10:40:03 · 457 阅读 · 0 评论 -
CMD运行PYTHON文件
首先测试PYTHON路径是否已添加在环境变量中 打开CMD,输入python如果显示了安装版本号即说明环境变量设置正常 否则配置环境变量,配置过程 参考:http://blog.csdn.net/field_yang/article/details/50905587环境变量没有问题那么就按下面的步骤:在D盘或者其他盘创建一个新的文件夹,我创建的是D:\pyx 然后在CMD里逐步输入:原创 2017-04-20 11:50:46 · 1276 阅读 · 0 评论 -
python之str.join operator.itemgetter
str.join(iterable)返回一个字符串,它是可迭代迭代中字符串的连接。 如果iterable中有非字符串值,包括字节对象,则会引发TypeError。 元素之间的分隔符是提供此方法的字符串。 实例Temp = " ".join(ipt[i:i+n])operator.itemgetter(item) operator.itemgetter(*items) 使用操作数的__getit原创 2017-04-19 21:56:34 · 576 阅读 · 0 评论 -
python之路13调试点滴
冰冻三尺非一日之寒读EXCEL-XLRDPython语言中,读取Excel的扩展工具。 (意为:xls文件read库,只能读。 若写入,要用xlwt,意为:xls文件write写入库。) 可以实现指定表单、指定单元格的读取。 一、安装xlrd模块到python官网下载http://pypi.python.org/pypi/xlrd模块安装,前提是已经安装了python 环境。二、使用介绍1、原创 2016-10-14 22:47:01 · 521 阅读 · 0 评论 -
wxpython窗口布局神器sizer
wxpython sizer 使用方法原创 2016-10-23 21:54:54 · 2913 阅读 · 0 评论 -
Python+PyQt,GUI操作
python pyqt gui原创 2016-10-23 21:19:09 · 1535 阅读 · 0 评论 -
python+gurobi
下面隆重介绍一下gurobi以及在python环境中调用gurobi原创 2016-10-23 20:47:27 · 16163 阅读 · 6 评论 -
matlab和Python线性规划
先说matlab,数据用csv文件,打开数据用csvread函数注意:csvread函数只试用与用逗号分隔的纯数字文件第一种:M = CSVREAD(‘FILENAME’) ,直接读取csv文件的数据,并返回给M第二种:M = CSVREAD(‘FILENAME’,R,C) ,读取csv文件中从第R-1行,第C-1列的数据开始的数据,这对带有头文件说明的csv文件(如示波器等采集的文件)的读取是很重原创 2016-10-11 15:00:14 · 3386 阅读 · 0 评论 -
python自学笔记12之anaconda
Anaconda提供了Python2.7和Python3.4两个版本,同时如果需要其他版本,还可以通过conda来创建。安装完成后可以看到,Anaconda提供了Spyder,IPython和一个命令行。下面来看一下conda。输入 conda list 来看一下所有安装时自带的Python扩展。粗略看了一下,其中包括了常用的 Numpy , Scipy , matplotlib 和 network原创 2016-10-10 19:33:32 · 1391 阅读 · 0 评论 -
python自学笔记11之文件(文本、CSV)
打开文件: with open(“x.txt”) as f1, open(‘xxx.txt’) as f2: do something with f1,f2 with-as表达式极大的简化了每次写finally的工作,这对保持代码的优雅性是有极大帮助的。python读取csv文件:自带csv模块:在线手册 csv:逗号分隔符格式 (可用excel另存为csv,不能直接更改后缀名)i原创 2016-10-10 13:36:02 · 638 阅读 · 0 评论 -
凸优化工具箱cvx
神器CVX原创 2016-06-14 20:29:56 · 10114 阅读 · 5 评论 -
machine learning2
牛顿方法,GLM,指数分布簇原创 2015-09-26 22:42:00 · 621 阅读 · 0 评论 -
人物识别(2)
人物识别,NER翻译 2015-08-20 16:34:49 · 1626 阅读 · 0 评论 -
machine learning
机器学习原创 2015-09-26 17:45:00 · 441 阅读 · 0 评论