- 博客(5)
- 收藏
- 关注
原创 NLP夏令营最后一次打卡
nlp是个大概念,基于语言不同分为中文和非中文(一般是英文),具体应用或者工程落地的技术基础分三个方向,基础nlp、自然语言理解、自然语言生成,可能上游任务是后两者吧。*对容器类型list、tuple、dict、set解包,直接返回它里面的内容,后两个是返回所有key。上游任务指对数据做预处理,如:分词、过滤、生成词向量等,上游任务的结果作为下游任务的输入。axis=0:在第一维操作 axis=1:在第二维操作 axis=-1:在最后一维操作。*收集元组,可以传入任意数量的位置实参,放入元组中。
2023-08-25 19:22:45 42
原创 NLP夏令营学习--8.17
针对文本分类任务,可以提供两种实践思路,一种是使用传统的特征提取方法(如TF-IDF/BOW)结合机器学习模型,另一种是使用预训练的BERT模型进行建模。教程里面提到可以考虑修改默认的batch_size与epoch来取得更好的效果,去哪里改呢?数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。在datawhale的其他开源学习笔记中学到了很多知识,这几天得认真跟上进度。阅读资料文档,理清整个夏令营的流程。如何提高baseline的成绩?
2023-08-18 10:09:46 45 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人