手动标记数据→BIO格式
2021/3/11:调整Albert+BiLSTM+CRF模型代码(见上篇),使其得到更高的精度 + 整理多源数据。
确定训练样本数量:“10倍规则法”,即所需训练样本数量应是模型参数数量的10倍。参考:根据模型中的参数数量判断需要的训练数据的数量_wtq1993的博客-CSDN博客。
![](https://i-blog.csdnimg.cn/blog_migrate/56a391260dd905676255f61e3436943c.png)
2021/3/11:调整Albert+BiLSTM+CRF模型代码(见上篇),使其得到更高的精度 + 整理多源数据。
确定训练样本数量:“10倍规则法”,即所需训练样本数量应是模型参数数量的10倍。参考:根据模型中的参数数量判断需要的训练数据的数量_wtq1993的博客-CSDN博客。