![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
liche717
这个作者很懒,什么都没留下…
展开
-
数学之美学习笔记(1)
第1章 文字和语言vs数字和信息文字按照意思来聚类,最终回带来一些歧义。上下文建立的概率模型也会出现错误。罗塞塔石碑对自然语言处理的两点指导意义:1. 信息的冗余是信息安全的保障。2. 语言的数据,我们称之为语料,尤其是双语或者是多语的对照语料对翻译至关重要,是我们从事机器翻译研究的基础。最早的计数工具—斯威士兰的乐邦博古十进制—编码—象形文字原创 2016-01-14 10:03:39 · 402 阅读 · 0 评论 -
数学之美笔记(2)
第3章 统计语言模型统计语言模型产生的初衷是为了解决语音识别问题。句子S发生的概率:利用古德-图灵估计求解概率的方法是卡茨退避法,用来进行平滑另一种平滑的方法是利用低阶语言模型和高阶语言模型进行线性插值,该方法不如卡茨规避法。语料的选取:训练数据通常越多愈好;训练数据跟应用数据一致性噪声,进行预处理第4章原创 2016-01-14 10:09:21 · 846 阅读 · 0 评论 -
数学之美(3)
第5章 隐含马尔可夫模型原创 2016-01-14 10:17:45 · 223 阅读 · 0 评论 -
机器学习实战笔记1
第一章 机器学习基础机器学习就是把无序的东西转换成有用的信息。1.机器学习的术语:专家系统、特征(属性)、实例、训练集(特征、目标变量)、测试数据、知识表示目标变量是机器学习算法的预测结果:分类算法中目标变量的类型一般为标称型;在回归算法中,目标变量的类型一般为连续型。2.机器学习的主要任务:监督学习:分类、回归(预测数据)无监督学习:聚类,密度估计3.NumPy函数原创 2016-03-09 16:37:00 · 492 阅读 · 0 评论