自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 资源 (10)
  • 收藏
  • 关注

原创 从零配置大模型环境并部署xuanyuan2.0

新来了A100*8的服务器,需要部署一个轩辕2.0大模型,途中踩了很多坑,现回忆并记录一下。

2023-06-25 12:31:24 1389 2

原创 记录一下cuda和tensorflow版本对应不上踩到的坑:对齐cuda和tensorflow版本

新入职一家公司,在做一个NER任务,有之前的albert NER代码,是在tensorflow-gpu1.12版本上写的,需要cuda9.0,新公司的cuda版本是10.0,对应不上最简便的做法:其实本来用tensorflow-gpu1.15就可以了,只要在vim ~/.bashrc后加入三行export PATH=/usr/local/cuda/bin${PATH:+:${PATH}}export LD_LIBRARY_PATH=/usr/local/cuda/lib64${LD

2020-10-15 18:06:00 2149

原创 机器学习基石 作业1 程序题(15-20)

import numpy as npimport randomdef read_data(path): f1=open(path) x_matrix=[] y_matrix=[] for i in f1: x=[1] for j in i.split('\t')[0].split(): x.append(f

2017-12-01 15:38:53 293

原创 第一篇博文--TensorFlow学习1

整理一下思路:我的研究课题是词义消歧,读了谷歌大神的论文,用神经网络作词义消歧。然后用Keras还原,后来发现Keras的效果怎么都不好,经过和师兄的交流,师兄严肃地建议我用TensorFlow还原作者的实验。于是开始学习TF,假期在家看了莫凡的教学视频,但是都是一些很基础的东西,读github上的代码还是很吃力,因为不像Keras的汉化做的那么好,TF的各种方法都没有中文的使用说明。那怎么办

2017-02-16 10:17:37 254

人民日报2014语料.zip

2014年的人民日报数据,总共有28万行,可直接做词性标注训练使用,处理后也可以做实体识别模型训练用。

2020-03-16

按crf格式处理好的波森数据库

按crf格式处理好的波森数据库,可以直接用于训练crf分类器

2018-06-08

处理好的人民日报语料,可以直接用CRF训练命名实体

处理好的人民日报语料,用于命名实体识别,两个文件分别为字符集和词语级

2018-06-05

金融专业术语词典

非常全面的金融领域术语词典,可以直接使用python进行处理

2018-06-04

问答系统训练语料

保险领域的问答系统训练语料,可以用来训练chatbot,希望有帮助

2018-06-04

基于python的word2vec

自己写的Word2vec工具包,参数可以在文件内部自行修改

2018-06-04

双向LSTM+CRF中文命名实体识别工具

双向LSTM+CRF中文命名实体识别工具,可以使用自己的语料进行训练,欢迎大家交流学习。训练数据需要自己进行获取

2018-06-04

波森命名实体识别语料

波森命名实体识别语料,具体标签及意义见压缩包内文档

2018-06-04

基于双向LSTM的句子向量模型

此模型既可以用于训练词向量,也可以将句子表示成句子向量,质量都比较高

2018-06-04

msra公开命名实体训练语料

msra公开命名实体训练语料,具体文档见压缩包,可以用于训练命名识别识别

2018-06-04

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除