前言
这次的内容很短,仅仅是记录下一些资料向的内容而已。(反正看到好的就慢慢新增内容呗~)
搜索
- 搜索相关人工智能任务:https://paperswithcode.com/sota
(包含论文、可能有的代码和衡量指标,真的好用,大力推荐!!!!!)
数据集
-
中文文本数据集来源:http://tcci.ccf.org.cn/conference/2018/taskdata.php#td
(如果是做NLP相关内容,想要数据集都可以先看看这里。) -
语音数据集:https://voice.mozilla.org/zh-CN/datasets
(中文部分还不是很完善,似乎还在积极收集中…) -
百度知道问答数据集:https://github.com/liuhuanyong/MiningZhiDaoQACorpus
(新星吧~~)
模型
-
tensorflow部分模型实现:https://github.com/tensorflow/models/tree/master/research
(这部分,感觉还好,因为是基于之前版本tensorflow写的,所以有些API不够新,但是作参考还是足够的。) -
腾讯开源词向量模型:https://ai.tencent.com/ailab/nlp/embedding.html
(怎么说呢,毕竟只能使用不能够进行微调,还是有些遗憾的…) -
bert模型:https://github.com/ymcui/Chinese-BERT-wwm
(作为上游embedding层,中文相关NLP任务我个人使用的多些。)
教程
- Keras入门:https://www.coursera.org/specializations/tensorflow-in-practice
(虽然我用torch多点,但是这个教程介绍的真的挺细致的,demo又多,感觉对学习Keras很有帮助。别问为什么不搞原生tensorflow,实在是看的头晕。)