- 博客(3)
- 资源 (3)
- 收藏
- 关注
原创 刁钻数据的处理(处理不平衡数据)
不平衡数据分类学习一、 不平衡数据的出现场景搜索引擎的点击预测点击的网页往往占据很小的比例电子商务领域的商品推荐推荐的商品被购买的比例很低信用卡欺诈检测网络攻击识别…二、 解决方案2.1 从数据的角度:抽样,从而使得数据相对均衡随机欠采样:从多数类中随机选择少量样本再合并原有少数类样本作为新的训练数据集有放回采样无放回采样会造成一些信息缺失,...
2019-04-23 11:23:55 233
原创 Transformer
Transformer先放一个jalammar博客transformer总体结构为什么有多个encoder呢?:从下往上可以提取表层的词法信息 -> 抽象的语义信息encoder到decoder的部分就是attention部分,进行信息传递和交互encoder和decoder的数量是一样的encoder结构什么是attention?:语言学角度:描述词与词的...
2019-04-05 21:49:36 305
原创 ELMO
ELMOJay Alammar大佬的博客迁移学习NLP:BERT、ELMo等直观图解嵌入(Embedding)的新时代词嵌入一直是影响NLP模型处理语言的主要力量。Word2Vec和Glove等方法已被广泛用于此类任务。Word2Vec让我们可以使用一个向量(一个数字列表)以一种捕获语义相关关系的方式正确表示单词(例如,判断单词是相似的,判断还是在它们之间具有的关系,如“开罗”和“埃及”...
2019-04-05 14:11:38 226
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人