【学习周报】
总结自己的学习和遇到的好材料。
往期回顾:
上周提到的两本书,这周肯定是也持续推进的。
深度学习
DL,持续看了3章,感觉基本都是会的东西,推进起来很快。
概率与信息论。
数值计算。
机器学习基础。
知识本身没什么问题。但是看这些基本都懂的知识下,让我感觉这本书在我的心目中有所下降,主要是有一些知识,让我感觉到是为了炫技而写的,但是炫技完了还是没把事情说明白,或者讲一部分就不说了,这个出现其实并不低频,挺常见的,举几个例子:
第二章,主成分分析,有些浅入深出,有关主成分分析的类似累计贡献率反而没谈到。
第三章,连续型随机变量的技术细节,强行在这里引入测度,其实给讲概率论的人讲测度并不合适,要谈应该在测度论里面把概率论引入做对比比较合适,现在这段讲完,我感觉很多人连测度论是啥都不知道,为什么用测度论理论来解释就更无从谈起了。
第四章,病态条件。感觉是强行插入,只谈病态条件,不谈什么是病态,怎么解病态方程都没谈,相当于是一块孤立的内容。
所以大家辩证着看吧。
信息检索导论
看的不是很多,就看了第九章。
相关反馈和查询拓展。这章对算法非常有用,一方面讨论了用户搜索结果反馈的使用,另一方面是查询拓展的使用。
几篇文章
然后是几篇自己看的论文,没看完,先列出来:
几篇综述:
A Survey on Deep Learning for Named Entity Recognition
Deep Learning Based Text Classification: A Comprehensive Review
Pre-trained Models for Natural Language Processing: A Survey
A Survey on Contextual Embeddings
然后是几篇有关嵌套NER问题的文章。
浅谈嵌套命名实体识别(Nested NER):https://zhuanlan.zhihu.com/p/126347862
下面是几篇上面知乎文章提到的文献,这几篇我后续会一一看了。
Nested Named Entity Recognition Revisited
Straková, Jana, Milan Straka, and Jan Hajič. "Neural architectures for nested NER through linearization." arXiv preprint arXiv:1908.06926 (2019).
Shibuya, Takashi, and Eduard Hovy. "Nested Named Entity Recognition via Second-best Sequence Learning and Decoding." arXiv preprint arXiv:1909.02250 (2019).
Xia, Congying, et al. "Multi-Grained Named Entity Recognition." arXiv preprint arXiv:1906.08449 (2019).
Fisher, Joseph, and Andreas Vlachos. "Merge and Label: A novel neural network architecture for nested NER." arXiv preprint arXiv:1907.00464 (2019).
Lin, Hongyu, et al. "Sequence-to-nuggets: Nested entity mention detection via anchor-region networks." arXiv preprint arXiv:1906.03783 (2019).
Li, Xiaoya, et al. "A Unified MRC Framework for Named Entity Recognition." arXiv preprint arXiv:1910.11476 (2019).
Wang, Bailin, et al. "A neural transition-based model for nested mention recognition." arXiv preprint arXiv:1810.01808 (2018).