面试题总结
其它面试题(springboot、mybatis、并发、java中高级面试总结等)
- 简单特征
只涉及当前状态特征;
- 转移特征
涉及两种状态间的特征;、
基于深度学习的分词
基本步骤:
-
首先,训练字向量,使用word2vec对语料的字训练50维的向量;
-
然后,接入一个bi-LSTM,用于建模整个句子本身的语义信息;
-
最后,接入一个CFR完成序列标注;
one-hot编码
每个词只在对应的index置1,其他位置均为0,难点在于做相似度计算;
LSA(矩阵分解方法)
LSA使用词-文档矩阵,矩阵常为系数矩阵,行代表词语,列代表文档;词-文档矩阵表示中的值表示词在文章中出现的次数;难点在于当语料库过大时,计算很耗费资源,且对未登录词或新文档不友好;
Word2Vec
结构
包括CBOW和Skip-gram模型;CBOW的输入为上下文的表示,然后对目标词进行预测;Skip-gram每次从目标词w的上下文c中选择一个词,将其词向量作为模型输入;
Skip-gram主要结构:
-
输入one-hot编码;
-
隐藏层大小为次维度大小;
-
对常见词或词组,常将其作为当个word处理;
-
对高频词进行抽样减少训练样本数目;
-
对优化目标采用negative sampling,每个样本训练时只更新部分网络权重;
总结
这份面试题几乎包含了他在一年内遇到的所有面试题以及答案,甚至包括面试中的细节对话以及语录,可谓是细节到极致,甚至简历优化和怎么投简历更容易得到面试机会也包括在内!也包括教你怎么去获得一些大厂,比如阿里,腾讯的内推名额!
某位名人说过成功是靠99%的汗水和1%的机遇得到的,而你想获得那1%的机遇你首先就得付出99%的汗水!你只有朝着你的目标一步一步坚持不懈的走下去你才能有机会获得成功!
成功只会留给那些有准备的人!
ab5e56a57acb)收录**