【自然语言处理】NLP学习及实践记录 | part 实践试水 edu-base-infor词库构建

云胡实验室

于 2019-09-26 21:13:17 发布

阅读量186

点赞数

分类专栏：学东西不问原因【杂学汇总】文章标签：词库构建四处挖坑

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_28930251/article/details/101476183

版权

学东西不问原因【杂学汇总】专栏收录该内容

36 篇文章 0 订阅

订阅专栏

继对话系统后，接着给自己挖坑。专利里写了自己暂时还不太确定能实现的部分，于是先填一个小坑，这里发现主要研究方向的领域词典不够完善，或者说根本就没有基础词库，在查资料时候发现：其他方向都开源一部分基础词库。于是有一个小思路，可以在每日工作下，完成一部分标注，为了组内工作，也为了毕业的数据基础吧。

海量词库构建（1）：概览 - 简书 https://www.jianshu.com/p/12b007fb3f7e

这是一个构建词库的思路，其中基础词库来自清华中文和搜狗，顺藤摸过去，下了搜狗基础教育信息化词库，才九条信息。这里嗯，革命之路漫漫。顺便发现实现技术是爬虫+结巴分词+Grafana+KNN，说好了不给自己设限，就不能被挡住。除了完成专利毕业要求外，可以做一部分这样子基础工作，组内后面开项目也好有工具。再贴一个Grafana的教程，第二个是针对爬虫一起的。

Grafana使用教程 - 菲宇运维 - CSDN博客 https://blog.csdn.net/bbwangj/article/details/81109615

Mysql + Grafana 监控爬虫程序 - 简书 https://www.jianshu.com/p/d547372bb89e

云胡实验室

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
【自然语言处理】NLP学习及实践记录 | part 实践试水 edu-base-infor词库构建

继对话系统后，接着给自己挖坑。专利里写了自己暂时还不太确定能实现的部分，于是先填一个小坑，这里发现主要研究方向的领域词典不够完善，或者说根本就没有基础词库，在查资料时候发现：其他方向都开源一部分基础词库。于是有一个小思路，可以在每日工作下，完成一部分标注，为了组内工作，也为了毕业的数据基础吧。海量词库构建（1）：概览 - 简书 https://www.jianshu.com/p/12b007...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。