人工智能相关书籍阅读笔记
文章平均质量分 76
人工智能相关书籍阅读笔记
海伦•
求知若渴,大智若愚
展开
-
自然语言处理入门——新手上路
自然语言处理(NLP)是一门融合了计算机科学、人工智能以及语言学的交叉学科。一、自然与语言与编程语言1.词向量自然语言中的词汇量比编程语言中的关键词丰富。再自然语言中,我们可以使用的词汇量是无穷无尽的,几乎没有意义完全相同的词语。我们国家语言文字工作委员会发布的《现代汉语常用词表(草案)》一共收录56 008个词条。除此之外,我们还可以随时创造各种类型的新词,而不仅限于名词。2.结构化自然语言是非结构化的,而编程语言是结构化的。所谓的结构化,是指信息具有明确的结构关系,比如编程.原创 2021-11-10 20:37:52 · 7525 阅读 · 0 评论 -
统计学习方法-支持向量机
支出向量机(support vector machines,SVM)是一种二类分类模型。他的基本模型是定义在特征向量空间上的间隔最大的线性分类器,间隔最低啊使他有别于感知机;支持向量机好包括核技巧,这使它称为实质上的非线性分类器。支持向量机的学习策略就是间隔最大化,可形式化为一个求解凸二次规划(convex quadratic programing)的问题,也等价于正则化的合页损失函数的最小化问题。支持向量机的学习算法是求解凸二次规划的最优化算法。支持向量机学习方法包含构建由简至繁的模型:线性可分支持向原创 2021-11-02 09:43:55 · 658 阅读 · 0 评论 -
统计学习方法-逻辑斯谛回归与最大熵模型
目录一、逻辑斯谛回归模型二、最大熵模型三、模型学习的最优化算法总结逻辑斯谛回归(logistic regression)是统计学习方法中的经典分类方法。最大熵是概率模型学习的一个准则,将其推广到分类问题得到最大熵模型(maximum entropy model)。逻辑斯谛回归模型与最大熵模型都属于对数线性模型。一、逻辑斯谛回归模型1.逻辑斯谛分布2.二项逻辑斯谛回归模型二项逻辑斯谛回归模型是一种分类模型,由条件概率分布P(Y|X)表示,形式为参数化的逻辑斯...原创 2021-10-27 10:09:04 · 381 阅读 · 0 评论 -
统计学习方法-决策树
决策树(decision tree)是一种基本的分类与回归方法,本章主要讨论用于分类的决策树。决策树模型呈树形结构,在分类问题中,表示基于特征对实例进行分类的过程。它可以认为是if-then规则的集合,也可以是认为是定义在特征空间与类空间上的条件概率分布。其主要优点是模型具有可读性,分类速度快。学习时,利用训练数据,根据损失函数最小化的原则建立决策树模型。预测时,对新的数据,利用决策树模型进行分类。决策树学习通常包括3个步骤:特征选择、决策树的生成和决策树的修剪。决策树模型与学习1.决策树模型.原创 2021-10-22 10:20:46 · 348 阅读 · 0 评论 -
统计学习方法-朴素贝叶斯法
朴素贝叶斯(naive Byes)法是基于贝叶斯定理与特征条件独立假设的分类方法。对于给定的训练数据集,首先基于特征条件独立于假设学习输入/输出的联合概率分布;然后基于此模型,对给定的输入x,利用贝叶斯定理求出后验概率最大输出y。朴素贝叶斯方法实现很很简单,学习与预测效率都很高,是一种常用的方法。朴素贝叶斯法的学习与分类基本方法:后验证概率最大化含义朴素贝叶斯法将实例分到后验概率最大的类中,这等价于期望风险最小化。为了使得风险最小化对X = x逐个及小化,根据期望风险最小化准则就..原创 2021-10-19 10:24:28 · 481 阅读 · 0 评论 -
统计学习方法-k近邻法
k邻近法(k-NN)是一种基本分类与回归方法。k近邻法的输入实例为特征向量,其中实例类别已定。k-近邻算法简单直观,输入:训练数据集输出:实例x所属的类yk近邻模型k近邻法使用的模型实际上对于特征空间的划分。模型由三个基本要素----距离向量、k值的选择和分类决策规则决定模型:k近邻法中,当训练集、距离度量(如欧式距离)、k值及分类决策规则(如多数表决)确定后,对于任一一个新的输入实例,他所属的类唯一确定。单元(cell):特征空间中,对每个训练实例点xi,距离该点比其他点近的所原创 2021-10-13 14:10:24 · 101 阅读 · 0 评论 -
统计学习方法- 感知机
感知机是二分类的线性分类模型,其输入为实例的特征向量,输出为实例的类别,取+1和-1二值。1 感知模型定义:2 感知机学习策略数据集的线性可分性感知机学习策略,原创 2021-09-29 21:01:33 · 159 阅读 · 0 评论 -
统计学习方法- 统计学习方法概论
1 统计学习方法概论 统计学习是关于计算机数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科,统计学习又称为统计机器学习。 它的主要特点包括:统计学习是以计算机和网络为平台,是建立在计算机和网络之上的。 统计学习以数据为研究对象,是数据驱动的学科。 目的是对数据进行预测和分析。 统计学习以方法为中心,统计学习方法构建模型并应用模型进行预测与分析。 统计学习是概率论、统计学、信息论、计算理论、最优化理论及计算机科学等多个理论交叉的学科,...原创 2021-09-23 09:18:55 · 564 阅读 · 0 评论