自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 cbow的torch 简单实现

本文在python3.7,pytorch1.5.1环境下编译,可直接执行。#coding:utf8# @Time : 2020/10/21 下午3:27 # @Author : xxx# @File : cbow.py # @Software: PyCharm,python3.7,pytorch1.5.1import torchfrom torch import nn# from torch.autograd import Variablefrom torch.nn import .

2020-10-22 11:31:11 430

原创 subword-nmt bpe 分词的使用

为了减小词表的大小,减少未知词(unk)的量,使用bpe分词:安装:1.sudo pip install subword-nmt##设置词表大小3W,输入英文单语数据 train.en2.subword-nmt learn-bpe -s 30000 < train.en > en.model##应用BPE分词 -c 输入的词表,test.txt测试数据,并得到分词结果ou...

2019-03-18 18:15:53 5500

翻译 基于BiLSTM+CRF 实体识别

环境:python2.7,tensorflow1.12.01.数据预处理部分。 数据样例如下:包 B-PER公 I-PER毕 O竟 O是 O包 B-PER公 I-PER, O若 O是 O标注数据采用BIO形式标注,标注类型有PER,ORG,LOC。tag2label = {"O": 0, "B-...

2019-03-12 10:37:22 537

转载 基于HMM的词性标注

环境:python2.7 , 数据:人民日报1998年一月标注数据原文地址:https://blog.csdn.net/say_c_box/article/details/78550659 ,原文的代码在求发射概率的时候可能有些许错误,现更改代码如下:举个例子来说:小明和小芳是两个城市的学生,现在小明知道小芳在下雨天时待在家看电视的概率为60%、出去逛街的概率为10%,洗衣服的概率为30%...

2019-03-04 10:57:42 3242 5

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除