机器学习
JKhere
程序猿
展开
-
matplotlib画图(3)
import matplotlib.pyplot as pltimport matplotlib.patches as patches# build a rectangle in axes coordsleft, width = .25, .5bottom, height = .25, .5right = left + widthtop = bottom + heightfig =原创 2013-07-14 16:16:39 · 1933 阅读 · 0 评论 -
数据挖掘笔记
什么是数据挖掘?数据挖掘是在大型数据存储库中,自动地发现有用信息的过程。数据挖掘技术用来探查大型数据库,发现前所未知的有用模式。数据挖掘还可以预测未来的观测结果。并非所有的信息发现任务都被视为数据挖掘,与信息检索的区别。数据挖掘任务预测建模,有两类预测建模任务:分类(classification)和回归(regression)。分类用于预测离散的目标变量;回归用于预测连续的目标变量。如原创 2013-12-09 19:19:42 · 1056 阅读 · 0 评论 -
关于机器学习的一些资料
我整理的一些机器学习简明资料,适合刚接触机器学习领域的人(我就是): 机器学习十大算法的每个算法的核心思想、工作原理、适用情况及优缺点原创 2013-10-22 21:28:37 · 918 阅读 · 0 评论 -
决策树算法的实现
我拜读了yangliuy的博客,他用c++实现了决策树算法。我用一天时间仔细阅读了他的代码,确实很好。并且在他代码的基础之上添加了一些注释,便于自己理解。转载自:http://blog.csdn.net/yangliuy/article/details/7322015#include #include #include #include #include #include转载 2013-10-24 15:32:18 · 1340 阅读 · 0 评论 -
下溢出
经常遇到的问题是下溢出,这是由于太多很小的数相乘造成的。当计算乘积时,由于大部分因子都非常小,所以程序会下溢出或者得到不正确的答案。(读者可以用Python尝试相乘许多很小的数,最后四舍五入后会得到0。)一种解决办法是对乘积取自然对数。在代数中有ln(a*b)=ln(a)+ln(b),于是通过求对数可以避免下溢出或者浮点数舍入导致的错误。同时,采用自然对数进行处理不会有任何损失。图给出函数f(x)原创 2013-07-17 16:00:15 · 2634 阅读 · 0 评论 -
matplotlib画直方图(1)
import numpy as npimport matplotlib.pyplot as pltmu,sigma=100,15x=mu+sigma*np.random.randn(10000)n,bins,patches=plt.hist(x,50,normed=1,facecolor='g',alpha=0.75)plt.xlabel('Smarts')plt.ylabel('原创 2013-07-14 15:36:42 · 16181 阅读 · 1 评论 -
matplotlib画图(5)
import numpy as npimport matplotlib.pyplot as pltarr=np.arange(100).reshape((10,10))plt.close('all')fig=plt.figure(figsize=(5,4))ax=plt.subplot(111)im=ax.imshow(arr,interpolation="none")plt.t原创 2013-07-14 17:43:48 · 1248 阅读 · 0 评论 -
kNN:k-nearest neighbor classification(K最近邻分类算法,KNN)
K最近邻分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。该算法的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某个类别,则该样本也属于这个类别。原创 2013-07-15 16:06:00 · 1824 阅读 · 0 评论 -
matplotlib画图(4)
import numpy as npimport matplotlib.pyplot as pltt = np.arange(0.0, 2.0, 0.01)s = np.sin(2*np.pi*t)plt.plot(t,s)plt.title(r'$\alpha_i > \beta_i$', fontsize=20)plt.text(1, -0.6, r'$\sum_{i=0}^\in原创 2013-07-14 16:40:04 · 1346 阅读 · 0 评论 -
matplotlib,numpy自己动手安装
最近想用python做些机器学习方面的事情,就买了本《机器学习实战》研究,Peter Harrington编写的,人民邮电出版社出版,2013年6月上市的。是本很新的书。首先第一件事情是配置学习环境,我个人的笔记本上安装了pythonxy,什么工具都安装好了,很省心。我也想在实验室的电脑上安装配置好环境。不过,这台PC上只安装了标准的python,不想用pythonxy了(这个工具集成有500原创 2013-07-15 17:16:59 · 1654 阅读 · 0 评论 -
matplotlib画直方图(2)
import numpy as npimport matplotlib.pyplot as pltax=plt.subplot(111)t=np.arange(0,5,0.01)s=np.cos(2*np.pi*t)line=plt.plot(t,s,lw=2)plt.annotate('local max',xy=(2,1),xytext=(3,1.5),原创 2013-07-14 15:45:06 · 5817 阅读 · 0 评论 -
各种距离(Distance)
距离(Distance)用于衡量个体在空间上存在的远近,距离越远说明个体间的差异越大。欧几里德距离(Euclidean Distance)欧式距离是最常见的距离度量,衡量的是多维空间中各个点之间的绝对距离。公式如下:原创 2013-12-09 16:41:48 · 7227 阅读 · 0 评论