![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
NLP
文章平均质量分 70
自然语言处理
阿拉辉
进击的小白
展开
-
知识蒸馏(一)
知识蒸馏学习转载 2023-02-17 22:51:58 · 215 阅读 · 1 评论 -
Bert 得到中文词向量
通过bert模型得到中文词向量原创 2022-12-29 15:48:43 · 4491 阅读 · 9 评论 -
知识融合中几种计算文本相似度的方法(代码)
1.余弦相似度import numpy as npimport jieba#读取停用词def stopwordslist(filepath): stopwords = [line.strip() for line in open(filepath, 'r', encoding='utf-8').readlines()] return stopwords# 加载停用词stopwords = stopwordslist("cn_stopwords.txt")def cosi原创 2021-04-13 10:59:59 · 1303 阅读 · 0 评论 -
docker 通过dockerfile设置动态参数
dockerfile设置动态参数一般的dockerfile样例FROM python:3.6WORKDIR /appADD . /appRUN pip install -i https://mirrors.aliyun.com/pypi/simple/ -r requirements.txtCMD ["python","start.py"] #start.py是启动文件,文件中输入为/app/input,输出为/app/result...原创 2021-03-17 11:42:39 · 5773 阅读 · 0 评论 -
做文本属性抽取中keras 的抽象后端(from keras import backend as K,from bert4keras.backend import K)
keras后端简介:Keras 是一个模型级库,为开发深度学习模型提供了高层次的构建模块。它不处理诸如张量乘积和卷积等底层操作,目的也就是尽量不重复造轮子。keras 有三个后端实现可用 、 即: TensorFlow 后端,Theano 后端,CNTK 后端。如果你需要修改你的后端, 只要将字段 backend 更改为 theano 或 cntk,Keras 将在下次运行 Keras 代码时使用新的配置。你也可以定义环境变量 KERAS_BACKEND,这会覆盖配置文件中定义的内容:定义的方式如原创 2021-03-15 10:36:43 · 921 阅读 · 0 评论 -
关于linux系统下有时候无法运行程序,常出现Python报错:pandas.errors.ParserError: Error tokenizing data. C error: Expected
关于linux系统有时候无法运行,常出现Python报错:pandas.errors.ParserError: Error tokenizing data. C error: Expected 3……相关问题的解决办法产生原因如下:解决方法为:最近在做知识图谱中属性抽取的项目,之前一直能运行成功,最近经常出现这种情况困扰了我几个小时,有时候写入文件无法进行保存退出等错误,后来发现使用ls -a命令,发现在数据文件夹中出现. .. a.csv b.csv c.csv .k.csv.swm原创 2021-03-11 15:06:10 · 664 阅读 · 0 评论