算法
文章平均质量分 91
风吹半夏灬
这个作者很懒,什么都没留下…
展开
-
NER数据增强篇-DAGA
NER数据增强方法DAGA,不同于传统的EDA方法,而是首先将标注数据线性化,将带标签的句子转换成线性序列,通过语言模型学习标注数据中单词和标签的分布情况;然后对线性化后的数据训练语言模型,用于生成合成标记数据。本文简单介绍了DAGA论文,并展现完整复现步骤,以及期间遇到的各种问题。...原创 2022-06-22 14:47:54 · 1123 阅读 · 4 评论 -
python 关键词抽取工具
前言依任务需要,对多种关键词抽取工具进行比较,测试、调研。特此记录相关调用方法及最终评测结果。1、jiebaGithub地址:https://github.com/fxsjy/jieba/安装:pip install jieba -i https://pypi.douban.com/simple/基于 TextRank 算法的关键词抽取import jiebadef keyword_extraction(content): """TextRank关键词抽取""" keywor原创 2020-11-05 15:49:58 · 1738 阅读 · 0 评论 -
hnswlib相似最近邻
HNSW相似最近邻1.安装通过镜像安装速度快pip install hnswlib -i https://pypi.douban.com/simple/Windows报错处理解决方法(安装Microsoft Visual C++)链接:https://pan.baidu.com/s/1QHaJkQ_U45cFyPOozbJxnA提取码:bdsq2.HNSW使用及说明def annsearch(data, data_labels): """利用HNSW进行近似最近邻搜索原创 2020-08-21 10:52:15 · 1123 阅读 · 0 评论