- 博客(34)
- 资源 (5)
- 收藏
- 关注
原创 本博免责声明
本博所处理数据均是通过各种计算机程序自动收集或手动收集所得,仅供机器学习、智能计算爱好者研究智能计算所用,其中具体信息(例如网页、图片、数据等)的版权归作者和发布者所有,本书对信息内容的合法性、准确性、可靠性、完整性概不负责,也不因网页等信息内容引起的纠纷承担任何法律责任。
2013-09-15 15:38:55 3141
原创 数学之路(3)-机器学习(4)-专家系统(2)
一、修改用(modify 1 (age 26)),复制用(duplicate 4(name"zhoudahua")),这两个操作产生的事实产能用于有序事实,有关系名没有相应自定义模板的事实为有序事实。修改通过撤销原事实生成新的事实而成。二、实例 CLIPS> (facts)f-0(initial-fact)f-1(person (name "zhangsan") (
2013-09-27 14:48:44 2263
原创 数学之路(3)-机器学习(4)-专家系统(1)
CLIPS(C Language Integrated Production System)是由美国国家航天局约翰逊空间中心人工智能部在1985年推出的专家系统开发工具。其设计目标和特点包括:可用于管理、工业、商业、文教等各个领域的专家系统开发,具有广泛的通用性;适用于各种型号的计算机,从IBM PC及其兼容机,到VAX,HP,SUN,MACINTOSH,直到CRAY,都可以运
2013-09-27 14:47:57 2544
原创 数学之路(3)-机器学习(3)-机器学习算法-PCA
PCA主成分分析(Principal components analysis,PCA),维基百科给出一个较容易理解的定义:“PCA是一个正交化线性变换,把数据变换到一个新的坐标系统中,使得这一数据的任何投影的第一大方差在第一个坐标(称为第一主成分)上,第二大方差在第二个坐标(第二主成分)上,依次类推,具体来说,在欧几里得空间给定一组点数,第一主成分对应于通过多维空间平均点的一条线,同时保证各个
2013-09-26 09:51:44 2876 2
转载 协方差与自相关
协方差矩阵是一个矩阵,其每个元素是各个向量元素之间的协方差。这是从标量随机变量到高维度随机向量的自然推广。假设是以个标量随机变量组成的列向量,并且是其第i个元素的期望值,即, 。协方差矩阵被定义的第i,j项是如下:即:期望值分别为与的两个实数随机变量X 与Y 之间的协方差定义为:,其
2013-09-18 22:39:39 9191 1
原创 数学之路(3)-机器学习(3)-机器学习算法-贝叶斯定理(6)
我们可以读取文本的标题,将标题也加入正文做为分词计算先验概率的对象,因为标题往往是全文的主题 if len(page_content.strip())>0: ybtxt[ci].append(page_content) try: print my_soup.title.string.encode
2013-09-18 17:41:12 2123
原创 概率与统计(1)
生成投掷骰子的随机结果>> unidrnd(6,1,100)ans = Columns 1 through 13 5 6 1 6 4 1 2 4 6 6 1 6 6 Columns 14 through 26 3
2013-09-18 17:24:47 1607
原创 数学之路(3)-机器学习(3)-机器学习算法-贝叶斯定理(5)
##读取待分类文本printftestfn=[]ftestfn.append('car.txt')ftestfn.append('war3.txt')#待测试数据for testfn in ftestfn:ftest = open(testfn)try:ftest_text = ftest.read( )ftest_text=unicode(ftest_text,'gbk')
2013-09-18 11:33:40 1869
原创 数学之路(3)-机器学习(3)-机器学习算法-贝叶斯定理(3)
分类别自动提取网页链接>>> runfile(r'K:\book_prog\text_bayes.py', wdir=r'K:\book_prog'). . . . . 爬取汽车类网页:http://finance.chinanews.com/auto/gd.shtmlhttp://www.chinanews.com/auto/2013/09-17/5295068.shtmlh
2013-09-17 15:28:10 1790
原创 数学之路(3)-机器学习(3)-机器学习算法-贝叶斯定理(4)
然后,我们接着计算词条的先验概率部分#计算词条先验概率print u"\n计算词条概率"ybgl={}for my_word in wordybcount.keys(): ybgl.setdefault(my_word,np.repeat(0.,len(yb_txt)).tolist()) for ybii in xrange(0,len(yb_txt)):
2013-09-16 16:19:53 1756
原创 matlab手记(3)
产生随机数矩阵>> rand(2,6)ans = 0.7094 0.2760 0.6551 0.1190 0.9597 0.5853 0.7547 0.6797 0.1626 0.4984 0.3404 0.2238>> rand(1,6)ans = 0
2013-09-16 10:18:58 1460
原创 数学之路(3)-机器学习(3)-机器学习算法-贝叶斯定理(2)
我们运用朴素贝叶斯技术对文本完成分类,我们可以编写网络爬虫代码或手工搜索在相关新闻网中下面几类新闻,并下载形成文本文档库,文档资料目录如下:将若干样本文档分为以下几类:C000001 汽车C000002 财经C000003 ITC000004 体育C000005 军事我们下载网页解析库Beautiful SoupBeaut
2013-09-15 16:06:53 2226
原创 数学之路(3)-机器学习(3)-机器学习算法-SVM[9]
我们应用SVM的非线性分类功能对手写数字进行识别,我们在这应用poly做为非线性核svm = mlpy.LibSvm(svm_type='c_svc', kernel_type='poly',gamma=10)svm.learn(x, y)我们按像素分块读取数字特征后,形成训练样本,送入SVM训练对样本本身测试print svm.pred(x)
2013-09-14 18:04:55 2348
原创 数学之路(3)-机器学习(3)-机器学习算法-SVM[8]
我们用非线性核尝试将分别属于下面2个函数的座标点分开y=x^2+by=x^3+b训练代码如下:#!/usr/bin/env python#-*- coding: utf-8 -*-#email:myhaspl@qq.com#author:麦好#2013-07-25import numpy as npimport matplotlib.pyplot as pltim
2013-09-13 19:59:53 2181
原创 数学之路(3)-机器学习(3)-机器学习算法-SVM[7]
我们先安装python的机器学习库然后调用 其中的SVM模块对下面的数据进行训练x = [[1,8],[3,20],[1,15],[3,35],[5,35],[4,40],[7,80],[6,49]]y=[1,1,0,0,1,0,0,1]然后生成随机的未知样本测试数据验证生成的SVM模型 #未知样本分类tlp_x1=np.random.rand(50)*(xma
2013-09-13 15:16:15 2433 1
原创 数学之路(3)-机器学习(3)-机器学习算法-贝叶斯定理(1)
贝叶斯定理是关于随机事件A和B的条件概率(或边缘概率)的一則定理。其中P(A|B)是在B发生的情况下A发生的可能性。先验概率与后验概率:假定B1,B2,……是某个过程的若干可能的前提,则P(Bi)是人们事先对各前提条件出现可能性大小的估计,称之为先验概率。如果这个过程得到了一个结果A,那么贝叶斯公式提供了我们根据A的出现而对前提条件做出新评价的方法。P(Bi∣A)既
2013-09-12 17:00:50 2519 3
原创 数学之路(3)-机器学习(3)-机器学习算法-欧氏距离(5)
一个随机变量的方差描述的是它的离散程度,也就是该变量离其期望值的距离。一个实随机变量的方差也称为它的二阶矩或二阶中心动差,恰巧也是它的二阶累积量。方差的算术平方根称为该随机变量的标准差。方差和标准差是测度数据变异程度的最重要、最常用的指标。设总体方差为σ2,对于未经分组整理的原始数据,方差的计算公式为: 方差反映了变量与均值之间的偏离程度,当方差较大时,说明变量之间差
2013-09-12 15:24:07 1967
原创 数学之路(3)-机器学习(3)-机器学习算法-欧氏距离(4)
我们用opencv定位人脸后,可以用欧氏距离做简单的人脸识别:求2个人脸之间的欧氏距离def get_EuclideanDistance(x,y): myx=np.array(x) myy=np.array(y) return np.sqrt(np.sum((myx-myy)*(myx-myy))) def get_dista
2013-09-12 11:04:55 2693
原创 数学之路(3)-机器学习(3)-机器学习算法-人脸识别
#!/usr/bin/env python#-*- coding: utf-8 -*-#code:myhaspl@qq.com#http://blog.csdn.net/myhaspl#人脸定位 import cv2import cv2.cv as cv print 'http://blog.csdn.net/myhaspl' print 'myhaspl@qq.com' print print 'loading ...' def findface(image
2013-09-12 08:33:26 4131 5
原创 数学之路(3)-机器学习(3)-机器学习算法-欧氏距离(3)
欧氏距离可用于含有大量噪声的图像匹配,我们对下面的2个图像切片在一个图片上进行匹配。'前面我们运用了统计上的均值计算完成了少量噪声情况下的图像匹配但如果加大噪声量比如下面这种情况的匹配,用简单的均值计算就无法完成这种情况,我们使用余弦算法完成匹配下面计算了余弦距离def get_Eucl
2013-09-11 16:07:13 2997 1
原创 数学之路(3)-机器学习(3)-机器学习算法-差异均值
我们首先来看下面2个图片切片,我们要在图片在找到这2个切片 的位置 ,通过像素之间的直接对比,我们可以轻易求出这2个图片切片在图片的位置def showpiclocation(img,findimg): #定位图片 w=img.shape[1] h=img.shape[0] fw=findimg.shape[1] fh=findi
2013-09-11 11:55:46 2156
原创 matlab手记(2)
二维数组及数组生成相关指令>> x=[1 2;3 6]x = 1 2 3 6>> ones(3,2)ans = 1 1 1 1 1 1>> zeros(3,2)ans = 0 0
2013-09-09 18:06:54 1248
原创 matlab手记(1)
本博客所有内容是原创,如果转载请注明来源http://blog.csdn.net/myhaspl/一维数组产生3个元素的数组>> x=linspace(1,6,3)x = 1.0000 3.5000 6.0000以0.5为间隔产生一维数组>> x=[1:0.5:10]x = Columns 1
2013-09-09 17:03:48 1521
原创 数学之路(3)-机器学习(3)-机器学习算法-神经网络[21]
针对上节的风景图片分类,我们也可以使用多层感知器的神经网络我们将样本图片分块提取特征,然后这些特征做为样本所属类的输入,训练的输出目标我们使用下面的矩阵来表示[0,0,1][0,1,0][1,0,0]第一行表示第一类,以此类推,最后一行表示最后一类整理输入样本与输出目标的代码如下:#x和d样本初始化train_x =[]d=[]sp_d=[]sp_d.app
2013-09-08 20:31:44 3395
原创 数学之路(3)-机器学习(3)-机器学习算法-余弦相似度(4)
我们用下面三个待分类图片进行测试ptest3.jpgptest1.jpgptest2.jpg测试分类http://blog.csdn.net/myhasplmyhaspl@qq.com正在处理中ptest3.jpg属于第3类ptest1.jpg属于第1类ptest2.jpg属于第2类>>> 分类效果不错,测试分类的py
2013-09-08 11:26:07 2155
原创 数学之路(3)-机器学习(3)-机器学习算法-余弦相似度(3)
我们将余弦相似度应用于风景图片类型自动分类,我们为每个类型准备了2个样本图片,如果样本图片数量适当,分类精度将更高。蓝天白云风景我们设为第一类森林设为第二类瀑布设为第三类对图片提取特征,提取的方式是将图片从上到下,从右到右分割成若干块,对每块的图片像素特征进行提取后,形成图片的特征#读取图片,提取每类图片的特征for ii in xrange(1,pi
2013-09-08 11:18:48 1799
原创 大数据时代的数学思维(3)-初等代数-python计算
代数运算先导入python符号计算库>>> from sympy import *>>> var("a,b,c")(a, b,c)基本运算>>> a+b==b+aTrue>>> a*b==b*aTrue>>> >>> a+(b+c)==(a+b)+cTrue>>> (a*b)*c==a*(b*c)True>>> expan
2013-09-07 17:36:21 2060
原创 数学之路(3)-机器学习(3)-机器学习算法-神经网络[20]
我们也可以用第三方python的神经网络包来对上节的数据模型进行训练首先读取数据#!/usr/bin/env python#-*- coding: utf-8 -*-#code:myhaspl@qq.com#http://blog.csdn.net/myhasplimport numpy as npimport pylab as plimport neurolab as nl
2013-09-05 08:36:20 2487 1
原创 数学之路(3)-机器学习(3)-机器学习算法-神经网络[19]
本博客所有内容是原创,如果转载请注明来源http://blog.csdn.net/u010255642我们也可以尝试用多层感知器网络对一组数据建立模型,在输入与输出数据之间建立非线性关系,用神经网络拟合输出数据,训练好后,输入其它值,能得到一个较精确的仿真输出数据下面是钢包使用次数与容积实测数据钢包使用次数与容积实测数据使用次数x
2013-09-03 21:59:01 2310
原创 数学之路(3)-机器学习(3)-机器学习算法-神经网络[18]
编写线性神经网络 的python代码,目标是通过输入背景音乐,输出能与混合后形成声音中的背景音乐尽可能一致的噪声,部分python代码如下:#线性逼近前段噪声b=1a0=5e-1a=0.0r=1.5x=[]d=[]ii=0for audio_i in xrange(0,framerate/2): if fi_wave_data[audio_i]!=0.:
2013-09-03 20:54:14 2139
原创 数学之路(3)-机器学习(3)-机器学习算法-神经网络[17]
神经网络既然可以进行函数拟合,也可以进行数据拟合,将输入x做为函数的自变量,将要输出的数据y做为函数f(x)的输出。y=f(x),我们将x送入神经网络做为输入,然后将y做为目标训练值,我们下面进行一个简单的线性滤波,从含有背景音乐中的语音中去除背景音乐。全部完成后,最终效果图如下:第一行是原语音声音,第二行是混杂了背景音乐的语音声音,第三行是去除背景音乐的噪声。声音
2013-09-03 20:32:47 2091
原创 数学之路(3)-机器学习(3)-机器学习算法-神经网络[16]
我们调用第三方的神经网络python组件继续进行更复杂的函数拟合,这次拟合一个比sin函数更复杂的函数f(x)=sin(x)*0.5+cos(x)*0.5python代码如下#!/usr/bin/env python#-*- coding: utf-8 -*-#bp ann 函数拟合sin*0.5+cos*0.5import neurolab as nlimport numpy a
2013-09-01 18:29:37 2080
原创 数学之路(3)-机器学习(3)-机器学习算法-余弦相似度(2)
从上一节可以看到,分词效果虽然不错,但是结果中仍有很多标点符号,也有一些词,比如说:应该、如果、所有等词这些词并不能代表文章的主题,我们不应把它们做为文本的特征项之一,而文本所有特征项组织一个向量,通过余弦相似度对文本类似性进行检测,所以要保证每个特征项有它的作用,这些无用的词称为停用词,我们建立一个停用词表文件,将里面所有的停用词读取后做为下一步对文本分词结果进行清理的依据 f_sto
2013-09-01 12:46:34 1759
原创 数学之路(3)-机器学习(3)-机器学习算法-余弦相似度(1)
余弦相似性是指通过测量两个向量内积空间的夹角的余弦值来度量它们之间的相似性。0度角的余弦值是1,而其他任何角度的余弦值都不大于1;并且其最小值是-1。从而两个向量之间的角度的余弦值确定两个向量是否大致指向相同的方向。两个向量有相同的指向时,余弦相似度的值为1;两个向量夹角为90°时,余弦相似度的值为0;两个向量指向完全相反的方向时,余弦相似度的值为-1。在比较过程中,向量的规模大小不予考虑,仅仅考
2013-09-01 09:48:29 3717
python线性神经网络库mplannliner
2013-07-25
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人