CNN:卷积神经网络
DNN:深度神经网络
RNN:循环神经网络
LSTM:长短期记忆神经网络(LSTM)是一种特殊的循环神经网络(RNN)
Transformer:Transformer模型,用全attention的结构代替了lstm,在翻译任务上取得了更好的成绩
BERT:BERT模型是一个多层的Transformer
PyTorch:PyTorch的前身是Torch,其底层和Torch框架一样,但是使用Python重新写了很多内容,不仅更加灵活,支持动态图,而且提供了Python接口。是一个以Python优先的深度学习框架,不仅能够实现强大的GPU加速,同时还支持动态神经网络。
PyTorch既可以看作加入了GPU支持的numpy,同时也可以看成一个拥有自动求导功能的强大的深度神经网络。除了Facebook外,它已经被Twitter、CMU和Salesforce等机构采用
TF-IDF:TF-IDF(Term Frequency-Inverse Document Frequency, 词频-逆文件频率)TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降
CRF:条件随机场,件随机场(Conditional Random Fields, 以下简称CRF)是给定一组输入序列条件下另一组输出序列的条件概率分布模型,在自然语言处理中得到了广泛应用
sklearn-crfsuite:是基于CRFsuite库的一款轻量级的CRF库。该库兼容sklearn的算法,因此可以结合sklearn库的算法设计实体识别系统。
BPR算法:基于贝叶斯后验优化的个性化排序算法”:Bayesian Personalized Ranking。
HMM:一个基于统计的中文分词方法——HMM模型
最常用的 Ensemble 估计器排列如下:
AdaBoostClassifier: 逐步提升分类器
AdaBoostRegressor: 逐步提升回归器
BaggingClassifier: 装袋分类器
BaggingRegressor: 装袋回归器
GradientBoostingClassifier: 梯度提升分类器
GradientBoostingRegressor: 梯度提升回归器
RandomForestClassifier: 随机森林分类器
RandomForestRegressor: 随机森林回归器
VotingClassifier: 投票分类器
VotingRegressor: 投票回归器