m0_74487158-CSDN博客

原创 datawhale AI夏令营 nlp语言处理

首先要先下载所需要的库，通过下列语句下载，：是一个用于自然语言处理任务的库，它可以做数据预处理、词汇构建、序列化和批处理等jieba是一个中文分词库，用于将中文文本切分成有意义的词语：用于评估机器翻译质量的工具，主要通过计算BLEU得分来衡量生成文本与参考译文之间的相似度。但是其实可能会报错，如果使用下面的语句好像也可以顺利执行。其次是spacy库，：是一个强大的自然语言处理库，支持70+语言的分词与训练，但是在下载上有点不同。

2024-07-20 22:41:12 348

原创 Datawhale Al夏令营机器学习

其实整个代码是python语言的，对于没有学过python可能还是有难度的(like me)，但是task2部分也懂了很多，包括问题也解答的很好，分数也好了很多，还是很有帮助的。GBDTCART回归树。

2024-07-17 23:17:34 726

原创 Datawhale AI 夏令营 nlp语言

三者的区别就在于统计机器翻译从数据驱动建模机器翻译任务，神经网络机器翻译利用映射关系学习，而规则机器翻译则是利用语法规则和词典进行翻译。nlp自然语言处理的分数和机器学习的分数好坏的比较好像是不一样的，nlp是越高越好，机器学习是越低越好，可能是运用的模型不一样的原因。看了一下里面的文件大概是5个，应该是训练集、开发集、测试集、和术语词典，其中开发集是分开的中英文两份。最开始给的测试结果很低，只有0.3197，第二次给出的改进的代码分数有所提高，有0.7811。测试集是反映模型的泛化能力。

2024-07-14 22:55:31 258

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 datawhale AI夏令营 nlp语言处理

原创 Datawhale Al夏令营 机器学习

原创 Datawhale AI 夏令营 nlp语言

空空如也

空空如也

原创 Datawhale Al夏令营机器学习