百度飞桨NLP课后作业1

潮宝宝

于 2020-02-29 16:48:19 发布

阅读量1k

点赞数 1

文章标签：算法机器学习 nlp 自然语言处理深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/SHANG__HC/article/details/104566259

版权

本次作业中，完成了飞桨NLP的安装验证，选择了jieba分词模型对人民日报语料进行切词。虽然在计算信息熵上遇到困难，但通过参考他人作业得以解决。此外，探讨了最大前向匹配算法的计算复杂度，以及提出了CRF分词算法的简要介绍。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

作业1-1
（1）下载飞桨本地并安装成功,将截图发给班主任
已发

（2）学习使用PaddleNLP下面的LAC模型或Jieba分词 LAC模型地址：https://github.com/PaddlePaddle/models/tree/release/1.6/PaddleNLP/lexical_analysis Jieba模型：https://github.com/fxsjy/jieba
这里我用了jieba分词，做了几个测试
在这里插入图片描述
（3）对人民日报语料完成切词，并通过统计每个词出现的概率，计算信息熵语料地址：https://github.com/fangj/rmrb/tree/master/example/1946%E5%B9%B405%E6%9C%88
这里不太会，参考了别的学员的作业

作业1-2
（1）思考一下，假设输入一个词表里面含有N个词，输入一个长度为M的句子，那么最大前向匹配的计算复杂度是多少？
最坏情况下每个词都要切分，计算复杂度是O&#

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。