aws 未完成sagemaker ner

命名实体识别,是指识别文本中具有特定意义的实体,主要包括人名、地名、机构名、专有名词等。命名实体识别是信息提取、问答系统、句法分析、机器翻译、知识图谱等应用领域的重要基础工具。

英语中的命名实体具有比较明显的形式标志(即实体中的每个词的第一个字母要大写),所以实体边界识别相对容易,任务的重点是确定实体的类别。和英语相比,中文命名实体识别任务更加复杂,而且相对于实体类别标注子任务,实体边界的识别更加困难。
在这里插入图片描述

https://aws.amazon.com/cn/blogs/china/use-amazon-sagemaker-to-run-chinese-named-entity-recognition-based-on-tensorflow/?nc1=b_rp

https://www.bilibili.com/video/BV1f5411s7Yz?from=search&seid=16029321477206824532
在这里插入图片描述

可以直接用他的notebook

右上角创建实例

环境和notebook 一样 存储空间什么的配置自己选

1.2 下载代码和数据

笔记本启动后,打开页面上的终端,执行以下命令下载代码:

cd ~/SageMaker
git clone https://github.com/whn09/albert-chinese-ner.git

在这里插入图片描述

这个是放大的,不知道怎么点开terminal的

在这里插入图片描述
默认会保存在根目录下 但是你关掉notebook会消失掉
只有你放在sagemaker下才好

配置,训练好的参数,词典等等
在这里插入图片描述

果然是老了,就这你都能给忘了。。。

在这里插入图片描述
进入到这个环境了

在这里插入图片描述

你可以去github看它怎么运行起来,这个稍微改动了

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
没写完 nabidia-smi

albert只是对bert做了一个改进

比如他做了一个简历的标注,就对ner进行改造 就是要标注成什么

需要分布式 或者批量训练 就ok

在这里插入图片描述

在这里插入图片描述

多机并行有config
放验证数据集和测试数据集

model是放你训练的目录

output 是输出

aws有 DeepLearning container 你可以下载相应的包 会比 海外的官网快

代码数据放到一个地方 你也可以设置到底上传什么

设置 sagemaker运行什么代码

名字就是train的脚本在这里插入图片描述

没看完有时间再说吧

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值