自然语言处理
文章平均质量分 52
自然语言处理
编程初学者01
愿代码干净整洁,合理注释,不断进步。
展开
-
SMS垃圾短信集F1指标分析
SMS垃圾短信集是一组为研究SMS垃圾短信而收集数据集合,每条短信有两个信息,分别是标签信息label,其中spam为垃圾短信,ham为正常短信。以及message信息为短信内容。现在有训练集,训练集保存在E:\自然语言处理\train.csv和测试集,测试集保存在E:\自然语言处理\test.csv。现在综合利用所学的文本预处理、特征提取、文本向量化等技术对其进行分析。建立机器学习模型,计算测试集上的F1指标,希望F1指标达到非常好的效果。使用SVC机器学习模型,Tfidf特征处理。原创 2024-05-29 16:02:34 · 356 阅读 · 0 评论 -
循环神经网络RNNLM续写“The meaning of life“
使用泰戈尔飞鸟集,作为一本英文诗集,用于续写The meaning of life比较好。总而言之感觉续写出来还是不错的,当然还可以用2-gram模型来做。当然每次运行结果可能都是不同的,看大家选择吧。原创 2024-05-29 15:55:53 · 623 阅读 · 0 评论