王椗
码龄15年
关注
提问 私信
  • 博客:36,662
    36,662
    总访问量
  • 5
    原创
  • 1,316,572
    排名
  • 3
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:广东省
  • 加入CSDN时间: 2010-03-16
博客简介:

season77us的博客

查看详细资料
个人成就
  • 获得26次点赞
  • 内容获得21次评论
  • 获得91次收藏
创作历程
  • 2篇
    2020年
  • 3篇
    2019年
成就勋章
TA的专栏
  • NLP
    2篇
创作活动更多

仓颉编程语言体验有奖征文

仓颉编程语言官网已上线,提供版本下载、在线运行、文档体验等功能。为鼓励更多开发者探索仓颉编程语言,现诚邀各位开发者通过官网在线体验/下载使用,参与仓颉体验有奖征文活动。

368人参与 去创作
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

如何下载Hugging Face 模型(pytorch_model.bin, config.json, vocab.txt)以及如何在local使用

首先找到这些文件的网址。以bert-base-uncase模型为例。进入到你的.../lib/python3.6/site-packages/transformers/里,可以看到三个文件configuration_bert.py,modeling_bert.py,tokenization_bert.py。这三个文件里分别包含 BERT_PRETRAINED_MODEL_ARCHIVE_MAP ...
原创
发布博客 2020.02.14 ·
30285 阅读 ·
20 点赞 ·
15 评论 ·
68 收藏

在测试或者预测时,Transformer里decoder为什么还需要seq mask?

这个sublayer里会用一个三角矩阵来做mask。在training的时候,这个mask是为了保证causality,即把将来的数据mask掉,这都比较好理解。但是在做testing的时候,为什么还要继续使用这个mask了?如在http://nlp.seas.harvard.edu/2018/04/03/attention.html#batches-and-masking 里...
原创
发布博客 2020.02.02 ·
4123 阅读 ·
5 点赞 ·
6 评论 ·
10 收藏

最大熵原理与最大熵模型

最大熵原理非常简单,是一个关于最合理的概率分布的准则:最合理的概率分布是包含已知信息,但不做任何未知假设,把未知事件当成等概率事件处理的概率分布.利用最大熵原理求解最合理概率分布:把约束条件列出来(即把我们从sample中观察到一些现象用等式表达出来) 把Entropy表达式写出来 利用Lagrange Multiplier进行求解最大熵模型:我利用Adwait Ratnap...
原创
发布博客 2019.11.25 ·
1294 阅读 ·
1 点赞 ·
0 评论 ·
11 收藏

在Apache2中设置locale遇到的坑, UnicodeEncodeError ‘ascii’ codec can’t encode...

有一个用python写的web应用程序,运行在Ubuntu 16.04 LST + Apache2 + cgi上。本来一切都OK,今天突然发现当路径或文件名是中文时,python会报错UnicodeEncodeError ‘ascii’ codec can’t encode characters in position ordinal not in range(128)baidu, goog...
原创
发布博客 2019.11.20 ·
316 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

在Ubuntu14.04,virtualenv中安装openCV 2.4.13

简单总结一下我是如何在ubuntu 14.04 LTS里,python virtualenv中安装openCV 2.4.13 (不带CUDA)的。为了安装一个特定版本的openCV首先安装一些依赖: 有些包在安装的时候可能出错,先不管那么多,把以前没有安装的都安装一遍。 $ sudo apt-get install build-essential $ sudo apt-get in...
原创
发布博客 2019.02.28 ·
322 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Question Answer / Semantic Parsing

发布资源 2018.10.15 ·
pdf

HMM隐马尔可夫模型用于中文分词

发布资源 2018.05.11 ·
pdf

hidden markov model intro

发布资源 2014.11.04 ·
pdf

Discriminative_Training_for_HMM

发布资源 2014.07.09 ·
pdf

java io tutorial overview

发布资源 2013.01.06 ·
pdf