![](https://img-blog.csdnimg.cn/5bd90e1de9714042b3187ec13b4bb75b.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
科亿知识库产品研发
文章平均质量分 50
本专栏记录科亿知识库产品研发过程,从技术方案,到产品设计、营销、运营等方面,全面记录学习摘记和和经验总结。
科亿知识库:https://gitee.com/kyxxjs/km_community
可以应用在需要对文件进行管理、分类、归集、检索、分享交流的地方,以及需要对大数据进行管理和检索的场景
科的亿
科亿知识库创始人,持续研发并运营开源产品。博客用来记录学习、研发、运营经历。
展开
-
向量技术与语义相似搜索,你真的理解了吗?
AI时代,我们听到很多新名词,技术领域,应该不陌生:向量技术,语义搜索。我们稍稍了解深入一点,就知道语义相似搜索,是基于向量技术的。但是,普通的文本,是怎么转成向量的呢?为什么转成向量,就能进行相似计算呢?这些问题,就算是有相当经验的IT从业人员,也会存疑,知其然不知其所以然。最近深入研究,把这个问题科普了,在此总结一下。原创 2023-11-29 18:23:32 · 448 阅读 · 0 评论 -
NLP专题之二:零样本文本分类(打标签)
而全任务零样本学习-mT5分类增强版-中文-base通过一种数据增强的方式大幅提升了在文本分类场景下的稳定性,在零样本分类稳定性评测中表现出的准确率可达98.51%,远大于其他模型,但在稳定性方面依然不如基于nli的模型。传统的文本分类方法需要大量预先标记的训练样本来训练模型,但在实际应用中,很难收集到足够的预先标记的样本。从模型原理的解析中可以发现基于自然语言推理的零样本文本分类模型在进行分类时,需要将候选标签逐一与文本进行结合生成对应的NLI的样本,这意味着有N个候选标签,就需要生成N个待推理样本。原创 2023-11-23 00:46:19 · 578 阅读 · 0 评论 -
NLP专题之一:初探ES与NLP
7与8都支持NLP,区别是:8.0集成度高,支持度更好。原创 2023-11-23 00:43:07 · 101 阅读 · 0 评论 -
NLP专题
本专题探讨的是,如何结合NLP技术,给科亿知识库增加知识的自动分类(打标签)和其他智能化知识处理功能:摘要,起标题,相关知识推荐。首先了解NLP,下面一图可理解。原创 2023-11-23 00:41:13 · 34 阅读 · 0 评论