面筋·七月ML300TI

最新推荐文章于 2024-08-23 17:48:13 发布

u010823625

最新推荐文章于 2024-08-23 17:48:13 发布

阅读量142

点赞数 1

分类专栏： 2020·推荐系统&大数据文章标签：机器学习

本文链接：https://blog.csdn.net/u010823625/article/details/106141676

版权

2020·推荐系统&大数据专栏收录该内容

8 篇文章 4 订阅 ¥79.90 ¥99.00

订阅专栏

超级会员免费看

本文探讨了生成型与判别型模型的区别，重点介绍了中文分词的基本方法，包括基于语法规则、词典的最大匹配法、最大概率法和最短路径法，并提及了基于统计的分词如HMM和CRF。此外，还涉及了CRF、HMM、MEMM的对比分析，以及机器学习中的关键概念如欧式距离、马氏距离、L1和L2正则化、偏差与方差、过拟合和欠拟合。

摘要由CSDN通过智能技术生成

1、生成型&判别型

判别模型(discriminative model)通过求解条件概率分布P(y|x)或者直接计算y的值来预测y
生成模型（generative model）通过对观测值和标注数据计算联合概率分布P(x,y)来达到判定估算y的目的

判别型	生成型
线性回归（Linear Regression）	朴素贝叶斯（Naive Bayes）
逻辑回归（Logistic Regression）	隐马尔科夫模型（HMM）
支持向量机（SVM）	隐含狄利克雷分布（LDA主题模型）
线性判别分析（LDA）	高斯混合模型
条件随机场（CRF）

2、最大概率分词 => 南京市长江大桥

一个待切分的汉字串可能包含多种分词结果，将其中概率最大的作为该字串的分词结果。
若某候选词在训练语料中未出现，其概率为0。

以P(w)表示词条w的概率，假设已知P（南京）

了解本专栏

超级会员免费看

u010823625

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
面筋·七月ML300TI

NLP&ML&优化1、生成型&判别型2、最大概率分词 => 南京市长江大桥3、中文分词的基本方法3.1 基于语法规则的分词3.2 基于词典的分词3.2.1 最大匹配法3.2.2 最大概率法3.2.3 最短路径法3.3 基于统计的分词4、CRF、HMM、MEMM对比分析5、欧式距离&马式距离6、L1&L27、1、生成型&判别型判别模型(discriminative model)通过求解条件概率分布P(y|x)或者直接计算y的值来预测y生成模型（
复制链接

扫一扫