NLP实战记录

非结构化商业文本分类

比赛是CCF里面的一个比赛 感觉很难打 也是第一次接触 就感觉自己还是少下了功夫 无论是从搭建环境到训练完成 到之后的优化都没有投入很多 导致小队没能按时提交上CSV 很遗憾

收获

1、学会了用DBC购买算力 用Xshell(大数据课程刚学会的)去连接Linux服务器 然后使用相应的GPU 这次租用的是GTX1080Ti 确实很快 但可惜代码跑的不是很顺利

2、学会使用jupyter lab以及其中环境的调试 使用linux的命令行进行操作 也算是巩固了linux知识吧 还用了XFTP导入的文件代码

3、虽然基础很薄弱 但是了解了一些NLP知识以后对于自己以后的AI学习有了很明确的目标 对bert模型 CRF HMM等模型都有了最基本的概念 也会使用了正则表达式的基本操作

反思

1、比赛需要很长的时间进行配置和训练 这次没有留足时间很遗憾 下次肯定要做好准备

2、基础知识还没过关 先看懂基本原理和基础代码再去做模型会有更明显的正反馈。

训练截图

用自己的电脑迭代速度很慢 也很心疼

正则样例

正则提高准确率

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值