自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 资源 (1)
  • 收藏
  • 关注

原创 milvus高性能向量数据库学习笔记

文章目录一.milvus是什么二.安装milvus三.使用milvus四.总结一.milvus是什么milvus 是一款开源的向量相似度搜索引擎,支持针对 TB 级向量的增删改操作和近实时查询,具有高度灵活、稳定可靠以及高速查询等特点。milvus 还可以对标量数据进行过滤,进一步提高了召回率,增强了搜索的灵活性。在服务端,milvus 由 Milvus Core 和 Meta Store 两部分组成:Milvus Core 存储与管理向量和标量数据。Meta Store 存储与管理 SQLit

2020-10-26 19:55:17 6144 2

原创 敏感词或关键词过滤,DFA算法详解及python代码实现

一.前言近期项目有了一个过滤敏感词的功能需求,在网上找了一些方法及解说,发现DFA算法比较好用,容易实现,但很多文章解释得不太清楚,这里将其详细描述,并用python代码实现.二.DFA算法详解DFA,网上常译为确定有限自动机,俗话就是新数据在已有的数据基础上去有限次查找,比如:新数据为苹果公司年会,旧数据为苹果公司,这样就可以直接旧数据后面添加"年会"两个字.DFA算法思想是将敏感词组通过建立嵌套字典的方式去构建敏感词链表(以一个特定字符’\x00’作为结束),然后遍历新词的每个字是否出现在敏感词

2020-10-20 15:59:08 5164 1

原创 centos没有安装sudo命令,报错/var/tmp/sclylAHWC:行8:-s:未找到命令

首先检查sudo是否安装,可输入命令:sudo -a,sudo -help,sudo -s若都报错找不到命令,即可认为是sudo命令没有安装,那就安装吧~安装命令:yum install sudo

2020-10-20 10:09:22 2149

原创 生成拼音语料及拼音识别转换成中文

一.前言前两篇文章分别介绍了利用中文拼音库生成基于Trie树的音节模型和将输入的字符串进行音节拆分,本篇文章主要介绍如何利用中文语料构建拼音语料模型及拼音转换中文.二.构建拼音语料模型先来看看拼音转中文效果,输入字符串"zhuanye",打印print(Pinyin2Chinese().covert(‘zhuanye’))思路:获取中文语料(来源可以从数据库或者静态文件,包括excel表和.txt表),然后将语料结巴进行分词,然后利用pypinyin工具将分词转换成拼音,用列表存储,最后写出二进

2020-10-17 11:42:55 838 2

原创 基于Trie树进行拆分字符串变成拼音音节(二):字符串拼音拆分

一.前言上一篇文章已经介绍了如何将所有中文拼音音节都基于Trie树生成模型,文章地址基于Trie树进行拆分字符串变成拼音音节(一):构建拼音音节模型,本篇文章主要介绍如何基于拼音模型将字符串进行拆分音节,下一篇文章将要介绍拼音识别拼音转功能.二.代码流程首先看一下拆分效果:输入zhuanye,打印print(PinyinCut().cut(‘zhuanye’))然后直接上代码:初始化拼音分割类,导入拼音模型文件class PinyinCut: def __init__(self):

2020-10-16 16:48:12 458 1

原创 基于Trie树进行拆分字符串变成拼音音节(一):构建拼音音节模型

一.前言在智能客服领域,需要具备识别用户输入拼音并将其转为中文,进而来搜索与之相关问题,但用户输入的拼音内容是一个长字符串,此时需要把字符串进行中文拼音音节拆分,用逗号’,'将每个音节分开,因此本篇文章主要介绍构建基于Trie的拼音音节模型,在下篇文章介绍拆分音节,再下下篇文章介绍拼音识别成中文二.构建模型2.1 Trie树简要介绍Trie树形结构属于字典树,整个树的根节点是空的, 根节点的子节点可以有多个,每个子节点智能存放单个元素,用于我们拼音模型就是根节点的子结点有26个,分别由a-z组成,每

2020-10-15 22:10:47 918 1

原创 gunicorn后台运行程序报错:gevent.exceptions.BlockingSwitchOutError:Impossible to call blocking function***

1. 前言&问题叙述使用gunicorn和supervsior搭配来管理后台运行程序,启动主程序后,使用postman来测试接口,发现接口请求时间太久,很容易造成响应时间过长而接口报错的接口,报错:gevent.exceptions.BlockingSwitchOutError: Impossible to call blocking function in the event loop callback2. 问题解决方法:更换gunicorn异步worker类型,将gevent换成even

2020-10-09 15:17:32 971

mitie.tar.gz 资源包

mitie资源包,免费下载,mitie是在dlib机器学习库之上开发的NLP工具包,支持分布式词嵌入和结构化SVM,提供英语,西班牙语,德语的预训练语言模型。

2020-06-13

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除