机器学习
城东小路
人是一根会思考的苇草
展开
-
如何使用Google Colab运行TensorFlow项目
一、简介Colab 是 Google Colaboratory 的简称,它是一个免费的 Jupyter 笔记本环境,无需任何配置就可以在浏览器中编写和执行 Python 代码,完全在云端运行。当然重要的是它提供了免费使用的 GPU,可以让我们更轻松地完成实验,目前 Google 提供的 GPU 普遍还是 Tesla K80,虽然之前说是全面将 K80 替换为 Tesla T4、16GB 显存,但现在使用的时候还是随机分配的,二者的算力具体差距有多少,请参考 NVIDIA官网 的数据。二、如何使用访原创 2020-10-17 20:19:32 · 5413 阅读 · 7 评论 -
粒子群算法
由Kennedy 和Eberhart于1995年提出.群体迭代,粒子在解空间追随最优的粒子进行搜索。粒子群算法:简单易行,收敛速度,快设置参数少。粒子群算法的思想源于对鸟群捕食行为的研究。模拟鸟集群飞行觅食的行为,鸟之间通过集体的协作使群体达到最优目的,是一种基于Swarm Intelligence的优化方法。...原创 2020-09-19 16:38:52 · 3218 阅读 · 0 评论 -
机器学习入门学习笔记(八)特征选择与稀疏学习
一、 特征我们将属性称为 “特征” (feature)。相关特征(relevant feature):对当前学习任务有用的属性。无关特征(irrelevant feature):与当前学习任务无关、没什么用的属性。从给定的特征集合中选择出相关特征子集的过程,称为“特征选择”(feature selection)。特征选择是一个重要的 “数据预处理”(data preprocessing)过程,在现实机器学习任务中,获得数据之后通常先进行特征选择,此后再训练学习器。那么,为什么要进行特征选择呢?1原创 2020-08-14 18:58:50 · 1397 阅读 · 0 评论 -
机器学习入门学习笔记(七)集成学习
集成学习 (ensemble learning) 通过构建并结合多个学习器来完成学习任务,有时也被称为多分类器系统 (multi-classifer system) 、基于委员会的学习 (committee-based learning) 等。一、集成学习的结构图 8.1 显示出集成学习的一般结构:先产生一组“个体学习器” (individual learner),再用某种策略将它们结合起来。个体学习器:通常由一个现有的学习算法从训练数据产生。例如 C4.5决策树算法、BP神经网络算法等。同质集成原创 2020-08-07 16:39:07 · 3401 阅读 · 0 评论 -
机器学习入门学习笔记(六)聚类
1、聚类任务在“无监督学习”(unsupervised learning)中,训练样本的标记信息是未知的,目标是通过对无标记训练样本的学习来揭示数据的内在性质及规律,其中研究最多、应用最广的是“聚类”(clustering)。聚类的目标:是将样本集 D 划分为若干互不相交的子集,即样本“簇”(cluster)。每个簇可能对应于一些潜在的概念(类别),这些概念对聚类算法而言事先是未知的,聚类过程仅能自动形成簇结构,簇所对应的概念语义需由使用者来把握和命名。聚类既能作为一个单独过程,用于找寻数据内在的分原创 2020-07-30 00:01:58 · 2216 阅读 · 0 评论 -
机器学习入门学习笔记(五)支持向量机
分类学习最基本的想法就是基于训练集D在样本空间中找到一个划分超平面,将不同类别的样本分开。1、超平面在样本空间中,划分超平面可通过如下线性方程来描述:wTx+b=0其中 w= (w1; w2; ……; wd) 为法向量,决定了超平面的方向;b为位移项,决定了超平面与原点之间的距离。问题:能将训练样本分开的划分超平面可能有很多,如何选择?直观上看,应该去找位于两类训练样本 “正中间” 的划分超平面,即图6.1中最粗的那个,因为该划分超平面对训练样本局部扰动的“容忍”性最好,即鲁棒性最好,对未见示例原创 2020-07-22 23:36:43 · 1310 阅读 · 0 评论 -
机器学习入门学习笔记(四)神经网络
一、神经元模型神经网络目前使用得最广泛的一种定义:神经网络是由具有适应性的简单单元组成的广泛并行互连的网络,它的组织能够模拟生物神经系统对真实世界物体所作出的交互反应。神经网络中最基本的成分是神经元(neuron)模型。在生物神经网络中,每个神经元与其他神经元相连,当它“兴奋”时,就会向相连的神经元发送化学物质,从而改变这些神经元内的电位;如果某神经元的电位超过了一个“阙值”(threshold),那么它就会被激活,即“兴奋”起来,向其他神经元发送化学物质。1943年, [McCulloch and原创 2020-07-16 08:25:16 · 7543 阅读 · 0 评论 -
机器学习入门学习笔记(三)决策树
一、基本流程决策树(decision tree)是一类常见的机器学习方法。它是基于树结构来进行决策的,这恰是人类在面临决策问题时一种很自然的处理机制。决策树学习的目的是为了产生一棵泛化能力强,即处理未见示例能力强的决策树,其基本流程道循简单且直观的“分而治之”(divide-and-conquer)策略。1.1 决策树的结构一般的,一棵决策树包含一个根结点、若干个内部结点和若干个叶结点。根结点:包含样本全集;内部结点:对应一个“子决策”,其包含的样本集合 根据属性测试的结果被划分到子结点中;叶原创 2020-07-08 23:48:59 · 1880 阅读 · 0 评论 -
机器学习入门学习笔记(二)线性模型
一、基本形式给定由d个属性描述的示例x=(x1;x2;…;xd),其中xi是x在第i个属性上的取值。线性模型(linear model) 是由学习得到的一个通过 属性的线性组合 来进行预测的函数,其基本形式如下:用向量形式表示为:其中 w = (w1;w2;…;wd) 是各个属性的权值系数。一旦 w 和 b 学得之后,模型就得以确定。由于w直观表达了各属性在预测中的重要性,因此线性模型有很好的 可解释性(comprehensibility)。例如:在挑选好西瓜的问题中,最终学得一下的线性函数:原创 2020-07-01 00:16:23 · 2634 阅读 · 0 评论 -
机器学习入门学习笔记(一)模型的评估和选择
一、一些基本概念错误率(errorrate):分类错误的样本数占样本总数的比例。在m个样本中有a个样本分类错误,则错误率E=a/m。精度(accuracy) = 1-错误率= 1-a/m。训练误差(training error)或经验误差(empirical error):学习器的实际预测输出与样本的真实输出之间的差异。泛化误差(generalizationerror):在新样本上的误差。我们希望得到的是在新样本上能表现得很好的学习器,或者说是得到泛化误差小的学习器。然而,我们...原创 2020-06-17 23:09:32 · 3397 阅读 · 0 评论