自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(25)
  • 收藏
  • 关注

原创 机器学习——第五章:树模型

本文为阅读总结个人认为书里概念性的、对本人有帮助的内容,仅供参考。树模型是机器学习中最为常见的模型之一。树模型具有较强的表示能力,易于理解,且因其递归的“分治”本质而尤其受到计算机科学研究人员的关注。任何一条穿越假设空间的路径都可被转化为一棵等价的决策树。对于取值超过两个状态的特征,决策树并不会运用内部析取来处理,而是允许各分支指向不同的取值。决策树具有比合取概念(严格)更强的表示...

2019-04-21 15:27:51 647

原创 机器学习——第四章:概念学习

本文为阅读总结个人认为书里概念性的、对本人有帮助的内容,仅供参考。逻辑模型的特点是它们均通过逻辑表达式将实例空间划分为一组区隔,因此所构建的都是分组模型。而其目标可概括如下:针对所要解决的任务,找到可使每个区隔中的数据更为一致的实例空间划分方案。在分类任务中我们希望找到这样一种划分:位于每个区隔中的绝大部分实例均来自同一类。在回归任务中,所谓好的划分是指目标变量为少数预测变量的一个简单...

2019-04-19 16:09:25 370

原创 机器学习——第三章:超越两类分类

本文为阅读总结个人认为书里概念性的、对本人有帮助的内容,仅供参考。一对多或一对其余(需训练k-1个模型)、一对一(需训练k(k-1)个模型)方案是将两类分类器转化为多类分类器最常用的两种手段。在采用一对多方案时,为了强制作出决策,我们必须在学习前或学习后设定各类别的顺序;如果采用的是一对一方案,则可通过投票的方式作出决策。如果希望依据多个两类分类器来计算多类得分和概率,有许多不同的选择...

2019-04-18 10:49:45 400

原创 计算机网络自顶向下方法——第4章:网络层

本文为阅读总结个人认为书里概念性的、对本人有帮助的内容,仅供参考。与运输层和应用层不同的是,在网络中的每一台主机和路由器中都有一个网络层部分。正因如此,网络层协议是协议栈中最具挑战性的部分。网络层协议也是协议栈中最复杂的层次之一。网络层的作用从表面上看极为简单,即将分组从一台发送主机移动到一台接收主机。为此,需要两种重要的网络层功能:转发、路由选择。转发是指将分组从一个输入链路接口...

2019-04-09 20:32:13 576

原创 计算机网络自顶向下方法——第3章:运输层

本文为阅读总结个人认为书里概念性的、对本人有帮助的内容,仅供参考。运输层位于应用层和网络层之间,是分层的网络体系结构的重要组成部分。该层为运行在不同主机上的应用程序提供直接的通信服务起着至关重要的作用。运输层协议为运行在不同主机上的应用进程之间提供了逻辑通信功能。应用进程使用运输层提供的逻辑通信功能彼此发送报文,而无需考虑承载这些报文的物理基础设施的细节。运输层协议是在端系统中而不...

2019-03-29 14:45:31 763

原创 计算机网络自顶向下方法——第2章:应用层

本文为阅读总结个人认为书里概念性的、对本人有帮助的内容,仅供参考。网络应用是计算机网络存在的理由,如果我们不能构想出任何有用的应用,也就没有任何必要去设计支持它们的网络协议了。研发网络应用程序的核心是写出能够运行在不同的端系统和通过网络彼此通信的程序。当进行软件编码之前,应当对应用程序有一个宽泛的体系结构计划。从应用程序研发者的角度看,网络体系结构是固定,并为应用程序提供了特定的服...

2019-03-22 21:56:07 286

原创 计算机网络自顶向下方法——第1章:计算机网络和因特网

本文为阅读总结个人认为书里概念性的、对本人有帮助的内容,仅供参考。该书的目的是向读者介绍计算机网络这个动态领域的最新知识,使读者深入地理解网络的原则和实践。使读者不仅能理解今天的网络,而且能理解明天的网络。因特网是一个世界范围的计算机网络,即它是一个互联了遍及全世界的数以亿计的计算设备的网络。端系统通过通信链路和分组交换机连接到一起。分组交换机从它的一条入通信链路接受到达的分组,并从...

2019-03-12 16:20:41 408

原创 机器学习——第二章:两类分类及相关任务

本文为阅读总结个人认为书里概念性的、对本人有帮助的内容,仅供参考。机器学习中的对象通常被称为实例。多有可能的实例构成的集合被称为实例空间。当数据中存在噪声时,情形则会变得错综复杂。噪声既包括标签噪声,也包括实例噪声。数据中带有噪声时,通常不建议将模型精确地与训练数据拟合,以免因噪声的存在产生过拟合问题。准确率所度量的是测试实例中被正确分类的比例。错误率:被错误分类的实例在整个测...

2019-03-05 20:35:44 1000

原创 终极算法——第二章:终极算法

本文为阅读总结个人认为书里概念性的、对本人有帮助的内容,仅供参考。本书的中心假设:所有知识,无论使过去的、现在的,还是未来的,都有可能通过单个通用学习算法来从数据中获得。来自神经科学的论证:发明终极算法的一种途径(可以说是最流行的一种)就是对人脑进行逆向解析。来自进化论的论证:生物多样性源于单一机制:自然选择。进化论是一种算法。进化论是另外一个有希望通往终极算法的途径。...

2019-03-05 10:03:20 762

原创 终极算法——第三章:符号学派:休谟的归纳问题

本文为阅读总结个人认为书里概念性的、对本人有帮助的内容,仅供参考。你是理性主义者还是经验主义者?理性主义者认为,感官会欺骗人,而逻辑推理是通往知识的唯一可靠的道路。经验主义者认为所有推理都不可靠,知识必须来源于观察及实验。为了得出符合逻辑的论断,休谟借用了洛克开创的经验主义思想,并提出一个问题,这个问题在所有领域的知识中就像一把达摩克利斯之剑,从最琐碎的领域到最先进的领域,都是一个时刻...

2019-03-05 10:02:47 927

原创 终极算法——第四章:联结学派:大脑如何学习

本文为阅读总结个人认为书里概念性的、对本人有帮助的内容,仅供参考。赫布律,就如它为人们所知的那样,是联结主义的奠基石。赫布律是心理学和神经科学思想的融合,其中掺杂了合理的猜想。联结主义相信知识储存在神经元之间的联结关系中。在符号学派中,符号和它们代表的概念之间有一一对应的关系。相反,联结学派的代表方式却是分散的:每个概念由许多神经元来表示,而每个神经元又会和其他神经元一起代表许多不同的...

2019-03-05 10:02:12 724

原创 终极算法——第五章:进化学派:自然的学习算法

本文为阅读总结个人认为书里概念性的、对本人有帮助的内容,仅供参考。罗纳德·费雪在他的经典著作《自然选择的遗传理论》中提出了关于进化的第一套数学理论。虽然这个理论很妙,但是霍兰德认为它遗漏了进化论的精华。费雪孤立地看待每个基因,但是有机体的适应度就是它所有函数的复值函数。如果基因都是独立的,它们变量的相对频率会快速收敛至最大适应点,然后从此保持平衡。但如果基因相互作用,进化(追求最大适应度)...

2019-03-05 10:01:19 392

原创 终极算法——第一章:机器学习的革命

本文为阅读总结个人认为书里概念性的、对本人有帮助的内容,仅供参考。我们生活在算法的时代。算法就是一系列指令,告诉计算机该做什么,即如何操作计算机中的几十亿晶体管。所有算法,无论多复杂,都能分解为三种逻辑运算:与、或、非。人们往往认为计算机只与数字有关,其实并非如此,它完全关乎逻辑。米开朗基罗说过,他所做的一切,就是从大理石石块中看出雕像,然后将多余的石头刻掉,直到雕像的形状显现出来...

2019-03-05 10:00:30 276

原创 终极算法——序

本文为阅读总结个人认为书里概念性的、对本人有帮助的内容,仅供参考。该书的一个目标是揭示机器学习的秘密。心理学家丹·诺曼创造了概念模型,代指为了有效利用某项技术而需要粗略掌握的知识,《终极算法》就将介绍机器学习的概念模型。该书以寻找终极算法为引,引导读者带着好奇阅读。机器学习主要有5个学派:符号学派:将学习看作逆向演绎,并从哲学、心理学、逻辑学中寻求洞见; 联结学派:对大脑进行逆向分析...

2019-03-05 10:00:01 272

原创 终极算法——第六章:贝叶斯学派:在贝叶斯教堂里

本文为阅读总结个人认为书里概念性的、对本人有帮助的内容,仅供参考。通往最优学习的路径始于一个公式,这一点许多人都听说过:贝叶斯定理。对于贝叶斯学派来说,学习“仅仅是”贝叶斯定理的另外一个应运用,将所有模型当作假设,将数据作为论据:随着你看到的数据越来越多,有些模型会变得越来越有可能性,而有些则相反,直到理想的模型渐渐突出,称为最终的胜利者。贝叶斯是第一个描述用新方法来考虑概率的牧师,但...

2019-03-05 09:59:08 247

原创 终极算法——第七章:类推学派:像什么就是什么

本文为阅读总结个人认为书里概念性的、对本人有帮助的内容,仅供参考。类比式推动许多历史上最伟大科学进步的动力。类比推理有着突出的知识谱系。亚里士多德在他的相似律中就表达了这一点:如果两个事物相似,其中的一个想法会出动另外一个想法。最近邻算法,正如其名,是我i们类比学习算法之旅的第一站。第二站是支持向量机,这是世纪之交风靡机器学习领域的原理,但最近风头被深度学习掩盖。第三站也是最后一站,是...

2019-03-05 09:58:36 567

原创 终极算法——第八章:无师自通

本文为阅读总结个人认为书里概念性的、对本人有帮助的内容,仅供参考。如果我们能重新回忆婴儿和蹒跚学步时期的自己,然后从新生儿的角度看待这个世界,那么许多关于学习的疑问,甚至关于存在本身,都会突然变得清晰明朗。虽然孩子理所当然从父母那里获得了许多帮助,但很多时候他们在没人监督的情况下进行学习,这才是最不可思议的地方。对事物进行聚类,这是人类的天性,也是获取知识的第一步。大数据和机器学习...

2019-03-05 09:58:03 198

原创 终极算法——第九章:解开迷惑

本文为阅读总结个人认为书里概念性的、对本人有帮助的内容,仅供参考。机器学习既是科学,也是技术,两者的特点提示我们如何将其统一起来。在科学方面,理论的统一往往从看似简单的观察开始。世界上许多最重要的技术都是创造统一物的结果,该统一物是单一机制,能完成之前需要很多机制完成的事情。终极算法是机器学习的统一物:它让任意应用利用任意学习算法,方法是将学习算法概括成通用形式——所有应用都需要知...

2019-03-05 09:51:21 264

原创 深度学习——第一章:引言

本文为阅读总结个人认为书里概念性的、对本人有帮助的内容,仅供参考。我们期望通过智能软件自动地处理常规劳动、理解语音或图像、帮助医学诊断、支持基础科学研究。人工智能的真正挑战在于解决那些对人来说很容易执行、但很难形式化描述的任务。对于这些问题,我们人类往往可以凭借直觉轻易地解决。层次化的概念让计算机构建较简单的概念来学习复杂概念。人工智能的一个关键挑战就是如何让将这些非形式化的知识传...

2019-03-05 09:51:12 583

原创 深度学习——第五章:机器学习基础

本文为阅读总结个人认为书里概念性的、对本人有帮助的内容,仅供参考。深度学习是机器学习的一个特定分支。大部分机器学习算法都有超参数(必须在学习算法外设定)。及其学习本质上属于应用统计学,更多地关注于如何用计算机统计地估计复杂函数,不太关注为这些函数提供置信区间。大部分深度学习算法都是基于被称为随机梯度下降的算法求解的。机器学习算法是一种能够从数据中学习的算法。学习的定义是:对...

2019-03-05 09:51:04 310

原创 机器学习——绪论:机器学习概述

本文为阅读总结个人认为书里概念性的、对本人有帮助的内容,仅供参考。依据经验提升性能几乎是各种形式的机器学习方法的核心。机器学习的一般定义:机器学习是对依据经验提升自身性能或丰富自身知识的各种算法和系统的系统性研究。在不同的及其学习任务中,“经验”往往具有不同的形式,如对错误的纠正、实现某个目标后的奖励等。此外还需注意,与人类的学习类似,在某些任务中,机器学习的目的可能不是针对特定任...

2019-03-05 09:50:56 191

原创 机器学习——第一章:机器学习的构成要素

本文为阅读总结个人认为书里概念性的、对本人有帮助的内容,仅供参考。机器学习可以概括为:使用正确的特征来构建正确的模型,已完成既定的任务。特征定义了一种用于描述问题域中相关对象的“语言”。一旦获得对问题域中对象的某种恰当的特征表示,我们往往便不必再去关注这些对象本身。这也正是也正对机器学习如此重要的原因。任务是对我们所期望解决的、与问题域对象有关的问题的一种抽象表示。许多任务都可抽象...

2019-03-05 09:50:24 1448

原创 卡特兰数——Catalan Number

卡特兰数:数学组合中一个常出现在各种计数问题中的数列,以比利时的数学家欧仁·查理·卡特兰的名字命名。从第0项开始依次为:1,1,2,5,14,42,132,429,1430,4862, 16796, 58786, 208012, 742900, 2674440, 9694845, 35357670, 129644790, 477638700, 1767263190, 6564120420, ...

2018-08-06 14:12:12 177

原创 分治法——大整数相乘

大整数相乘:A、B两个整数,A有n位(123456……n),B有m位(123456……m),一般的思路是像最初学习乘法时一样逐位相乘后相加,但是这样做算法的复杂度过高,但这仍然是解题的基本思想。既然提到分治,那么如何分,怎么治?分:能够找到一个大问题划分为小问题方法的重要技巧是能够看到大问题的规模和所谓规模的单位。在大整数相乘中大问题的规模就是一个n位的整数要乘以一个m位的整数,所谓规...

2018-07-22 11:22:37 31162 7

原创 Linux——shuf sed

txt文件按行随机乱序:shuf 源.txt; (显示但不改变源文件)shuf 源.txt -o 目标.txt ;(改变后的文件输出在目标.txt里)删除txt文件每行最后一个字符、替换txt文件中的指定字符或字符串:sed 's/$//' 源.txt; (显示但不改变源文件)sed -i 's/$//' 源.txt 目标.txt;(改变后的文件输出在目标.txt里,如果想直接...

2018-07-20 11:06:35 231

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除