自然语言处理(NLP)
文章平均质量分 78
2023FALL
yushan.ji
此木以不材得终其天年
展开
-
ECNU自然语言处理作业4:朴素贝叶斯分类
利用nltk语料库中的影评来进行朴素贝叶斯情感分类训练原创 2024-01-19 23:35:07 · 571 阅读 · 0 评论 -
ECNU自然语言处理作业3:N-grams
作业要求 : 读入中文语料库(了不起的盖茨比)gaicibi.txt,对文本进行预处理操作,包括分词,换行,删除空格,符号等。统计语料库中的每个词的unigram,bigram,trigram的概率,以及测试句子在unigram,bigramm,trigram下的概率。原创 2024-01-19 23:20:49 · 479 阅读 · 0 评论 -
NLP笔记:文本分类(基于MLE和朴素贝叶斯实现情感分类,并利用混淆矩阵、F度量、宏平均/微平均进行评估)
1. 文本预处理2. 利用词袋模型实现文本表示3. 基于MLE和朴素贝叶斯实现情感分类4. 利用混淆矩阵、F度量、宏平均/微平均对情感分类效果进行评估原创 2023-10-25 00:04:20 · 203 阅读 · 1 评论 -
NLP笔记:n-grams语言模型
n-gram语言模型是自然语言处理中一种简单而常用的统计语言模型。它用于估计文本中的语言概率和生成文本。n-gram模型基于一个假设:一个词的出现只依赖于前面的n-1个词。因此,n-gram模型将文本中的词序列表示为连续的n个词的序列。原创 2023-10-19 19:47:07 · 1417 阅读 · 1 评论 -
NLP笔记:文本处理
中文分词三种匹配方法及最短编辑距离的计算原创 2023-10-22 11:53:40 · 86 阅读 · 1 评论 -
ECNU自然语言处理作业2:文本处理
1. 利用nltk库进行文本切分、标准化(去除标点、大小写转换、去除停用词)、词干提取、词形还原、词频统计2. 基于中文词典实现正向最大匹配算法、逆向最大匹配算法、双向最大匹配算法3. 结巴分词原创 2023-10-23 12:34:52 · 783 阅读 · 0 评论 -
ECNU自然语言处理作业1:正则表达式
以下4道题目为正则表达式相关练习,包括简单的字符匹配、提取文本信息并整合、提取文本信息并替换,以及对常用正则表达式的详细解释。原创 2023-10-08 21:48:00 · 189 阅读 · 2 评论