自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 nlp--task:NLG

1,NLG(natural language generation)• Machine Translation • (Abstractive) Summarization• Dialogue (chit-chat and task-based)• Creative writing: storytelling, poetry-generation • Freeform Question Ans...

2019-07-19 05:59:45 676

原创 nlp中mask(掩码)操作总结--解决语句输入长短不一问题

注:看了许多种任务,机器翻译,实体命名识别,对话系统。有趣的是虽然网络结构都大同小异基本上都是seq2seq,但是里面的语句处理部分每位作者真是—八仙过海各显神通【其实算法思想都差不多,只不过调用的函数五花八门】对流程熟悉的人应该都了解在整个训练过程中为了提高速度,都会采用mini_batch。随之而来的问题便是一个batch中的句子不可能长度都相等,这样就给数据的规范化带来了不便,这是便需要...

2019-07-27 22:40:19 4211

原创 torch.cat和torch.max[笔记]

注: 这是个人笔记,想了解的还是去torch官网吧,这一类numpy接口,用的时候还是单独测试一下,防止出错torch.maxtorch.max(input, dim, keepdim=False, out=None) -> (Tensor, LongTensor)用的较多的是不同于传统的max,此函数返回相应维度的最大值及其索引(values, indices),如果keepdim ...

2019-07-26 21:17:41 482

转载 python---unicodedata

https://blog.csdn.net/xc_zhou/article/details/82079753

2019-07-23 10:28:23 947 1

转载 python 字符编码转换

https://blog.csdn.net/ran337287/article/details/56298949

2019-07-23 09:58:15 168

转载 EDA----scipy进行正态分布检验

https://m.baidu.com/ala/c/www.360doc.cn/mip/772967525.html

2019-07-05 18:17:04 851

原创 matplotlib-决策界面可视化

引子:tensorflow游乐场图决策界面图直观的展示了模型分类效果,如下1,原始样本分布图2,模型决策界面可视化结果a-线性模型b-3层神经网络可见模型效果非常直观实现流程1,首先应该得到图中每个点(夸张的说法,但必须覆盖样本点,且点数 >> 样本点数)2,根据所得模型,计算所有点的分类情况思路很简单,主要是matplotlib,numpy相应函数的组合...

2019-07-01 16:49:59 679 2

原创 二分类评估器-----ROC以及AUC【含python实现】

2019.06.30晚下周四面试nlp,顺便复习一下机器学习A引:以正负标签为例,在正负样本均衡情况下,单纯的使用准确率即可。但如果样本正负分布极端不平衡,这将导致准确率很高但实际模型效果很差的情况。比如预测地震,1000个地质状态里面可能只有一个将发生地震,模型直接全部预测为不发生那么准确率为100%,但效果很差。因此单纯准确率有时是不可信的!!!Bsample:{P, N} 样本集...

2019-07-01 01:09:33 1959

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除