- 博客(4)
- 收藏
- 关注
原创 cbow的torch 简单实现
本文在python3.7,pytorch1.5.1环境下编译,可直接执行。#coding:utf8# @Time : 2020/10/21 下午3:27 # @Author : xxx# @File : cbow.py # @Software: PyCharm,python3.7,pytorch1.5.1import torchfrom torch import nn# from torch.autograd import Variablefrom torch.nn import .
2020-10-22 11:31:11
430
原创 subword-nmt bpe 分词的使用
为了减小词表的大小,减少未知词(unk)的量,使用bpe分词:安装:1.sudo pip install subword-nmt##设置词表大小3W,输入英文单语数据 train.en2.subword-nmt learn-bpe -s 30000 < train.en > en.model##应用BPE分词 -c 输入的词表,test.txt测试数据,并得到分词结果ou...
2019-03-18 18:15:53
5500
翻译 基于BiLSTM+CRF 实体识别
环境:python2.7,tensorflow1.12.01.数据预处理部分。 数据样例如下:包 B-PER公 I-PER毕 O竟 O是 O包 B-PER公 I-PER, O若 O是 O标注数据采用BIO形式标注,标注类型有PER,ORG,LOC。tag2label = {"O": 0, "B-...
2019-03-12 10:37:22
537
转载 基于HMM的词性标注
环境:python2.7 , 数据:人民日报1998年一月标注数据原文地址:https://blog.csdn.net/say_c_box/article/details/78550659 ,原文的代码在求发射概率的时候可能有些许错误,现更改代码如下:举个例子来说:小明和小芳是两个城市的学生,现在小明知道小芳在下雨天时待在家看电视的概率为60%、出去逛街的概率为10%,洗衣服的概率为30%...
2019-03-04 10:57:42
3242
5
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人