算法时代
文章平均质量分 76
尚优未来
一点一滴,一花一叶,喜欢文学的程序员
展开
-
机器学习002_k-近邻算法
1.1 概述采用测量不同特征值之间的距离方法进行分类。优点:精度高、对异常值不敏感、无数据输入假定缺点:计算复杂度高、空间复杂度高适用数据范围:数值型和标称型 1.2 kNN分类算法伪代码:对位置类别属性的数据集中的每个点依次执行以下操作:(1)计算已知类别数据集中的点与当前点之间的距离;(2)按照距离递增次序进行排序;(3)选取与当前点距离最小的k个点...原创 2018-08-29 19:50:51 · 281 阅读 · 0 评论 -
算法笔记001_我读《高等人工智能原理》
读钟义信老先生的《高等人工智能原理》一书:这里面提到了一些观念、方法、模型、理论上的知识,有一定程度上的启发,特此记录。1、机器本身不能自主地发现和定义问题及预设求解目标因为面对具体环境,根据永恒目的和先验知识发现和定义问题,并预设求解目标的能力是人类创造力的首要前提。解读:从大的角度去理解,似乎是无懈可击的;但是如果用分而治之的思维去一点点逐个击破每一个词语,感觉还是有点意思...原创 2018-08-29 20:56:22 · 331 阅读 · 0 评论 -
机器学习003_决策树
决策树优点:计算复杂度不高,输出结果易于理解,对中间值的缺失不敏感,可以处理不相关特征数据。缺点:可能会产生过度匹配问题。适用数据类型:数值型和标称型。1.1 决策树的构造创建分支的伪代码函数CreateBranch():检测数据集中的每个子项是否属于同一分类:If so return 类标签Else 寻找划分数据集的最好特征 划分数据集 ...原创 2018-08-31 17:03:28 · 285 阅读 · 0 评论 -
机器学习005_Logistic回归
用一条直线对假设的数据点进行拟合(该线称为最佳拟合直线)这个拟合过程称为回归。表示要找到最佳拟合参数集。Logistic回归进行分类的主要思想是:根据现有数据对分类边界线建立回归公式,以此进行分类。(1)收集数据(2)准备数据:由于需要进行距离计算,因此要求数据类型为数值型。另外,结构化数据格式则最佳。(3)分析数据:采用任意方法对数据进行分析。(4)训练算法:大部分时间将用于...原创 2018-09-12 09:45:41 · 231 阅读 · 0 评论 -
强化学习002_隐马尔科夫模型HMM
HMM是一个关于时序的概率模型,描述了一个由隐藏的马尔科夫链随机生成的不可观测的状态随机序列,再由各个状态生成一个观测而产生观测随机序列的过程。主要由五部分组成:状态序列、状态转移矩阵、观测序列、观测概率分布、初始的状态分布通过现象看本质的学习模型:隐马尔科夫模型我们输入的拼音字母就是观测序列,而这个观测到的表象的实质应该是我们想要的拼音字母或者是句子。隐马尔科夫模型就是通过输...原创 2018-09-17 11:10:38 · 1270 阅读 · 0 评论 -
算法笔记002_我读《The Emperor’s New Mind》
第一章 电脑能有精神吗?是什么东西赋予个别人其单独的认同性呢?第一个理由:任何活人身体的物质都处于联系代换的状态中。实际上我们身体的整个物质从诞生以来被代换了许多回 。第二个理由:量子物理,按照量子力学,任意两个电子必须是完全等同的,这同样适用于任意两个质子以及任一特殊种类的两个粒子。第二章 算法和图灵机顺延第一章的观点——所有相关的物理总能由数字计算来仿照。那么(除了时间...原创 2018-09-07 10:04:52 · 526 阅读 · 1 评论