机器学习
文章平均质量分 80
弱鸡萌新
这个作者很懒,什么都没留下…
展开
-
机器学习常见术语
文章目录泛化能力泛化能力概括地说,泛化能力(generalization ability)是指机器学习算法对新鲜样本的适应能力,简而言之是在原有的数据集上添加新的数据集,通过训练输出一个合理的结果。学习的目的是学到隐含在数据背后的规律,对具有同一规律的学习集以外的数据,经过训练的网络也能给出合适的输出,该能力称为泛化能力...原创 2021-04-14 11:46:34 · 379 阅读 · 0 评论 -
KNN(K-Nearest Neighbor)简介
KNNKNN是一种有监督的学习,是一种常用于分类的算法,是有成熟理论支撑的、较为简单的经典机器学习算法之一。该方法的基本思路是:如果一个待分类样本在特征空间中的K个最相似(即特征空间中K近邻)的样本中的大多数属于某一个类别,则该样本也属于这个类别,即近朱者赤近墨者黑。对当前待分类样本的分类,需要大量已知分类的样本的支持,因此KNN是一种有监督学习算法。举个例子:蓝色方格 和 红色三角 是已知分类结果的样本,求 绿色圆圈属于哪一类?当K=3时,我们发现近邻中有两个红色三角,一个蓝色三角,所以,原创 2021-04-13 21:19:27 · 2410 阅读 · 0 评论 -
自然语言处理出门 第二章 词典分词
本章节主要讲述单词的切分算法、如何构建并不断优化字典树以及分词的准确率评测。中文分词指的是将一段文本拆分成一系列单词的过程文章目录什么是词什么是词原创 2021-04-12 21:23:38 · 561 阅读 · 0 评论 -
自然语言处理入门 第一章 新手上路
开始学习自然语言处理方面的知识了,仅以此记录下学习历程。1.1自然语言与编程语言自然语言是非结构化的,具有歧义性、容错性、易变性、简略性的特点。非结构化编程语言是结构化比较强的,比如创建类,调用方法,都是遵循一定的格式的,而自然语言中不存在这样的显式结构。举个例子“苹果的创始人是乔布斯,它的logo是苹果”。计算机需要分析出下面的结论:首先,需要对这句话进行序列化:“苹果 的 创始人 是 乔布斯 , 它 的 logo 是 苹果”;其中,第一个“苹果”指的是苹果公司,第二个“苹果”是水果原创 2021-03-30 15:39:21 · 326 阅读 · 0 评论