自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 资源 (3)
  • 收藏
  • 关注

原创 刁钻数据的处理(处理不平衡数据)

不平衡数据分类学习一、 不平衡数据的出现场景搜索引擎的点击预测点击的网页往往占据很小的比例电子商务领域的商品推荐推荐的商品被购买的比例很低信用卡欺诈检测网络攻击识别…二、 解决方案2.1 从数据的角度:抽样,从而使得数据相对均衡随机欠采样:从多数类中随机选择少量样本再合并原有少数类样本作为新的训练数据集有放回采样无放回采样会造成一些信息缺失,...

2019-04-23 11:23:55 233

原创 Transformer

Transformer先放一个jalammar博客transformer总体结构为什么有多个encoder呢?:从下往上可以提取表层的词法信息 -> 抽象的语义信息encoder到decoder的部分就是attention部分,进行信息传递和交互encoder和decoder的数量是一样的encoder结构什么是attention?:语言学角度:描述词与词的...

2019-04-05 21:49:36 305

原创 ELMO

ELMOJay Alammar大佬的博客迁移学习NLP:BERT、ELMo等直观图解嵌入(Embedding)的新时代词嵌入一直是影响NLP模型处理语言的主要力量。Word2Vec和Glove等方法已被广泛用于此类任务。Word2Vec让我们可以使用一个向量(一个数字列表)以一种捕获语义相关关系的方式正确表示单词(例如,判断单词是相似的,判断还是在它们之间具有的关系,如“开罗”和“埃及”...

2019-04-05 14:11:38 226

模型参数详解及对比

模型参数详解及对比

2018-11-16

数据科学家应当了解的五个统计基本概念

数据科学家应当了解的五个统计基本概念

2018-11-16

斯坦福CS224n_自然语言处理与深度学习_笔记_hankcs

斯坦福CS224n_自然语言处理与深度学习_笔记_hankcs

2018-11-16

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除