自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 基于Joint BERT模型的意图识别技术实践

意图识别在诸多领域已经有了非常广泛的应用,例如各个品牌的智能语音助手,如今多模态模型能力迅猛增长,与LLM交流方式变得多样化,为了给LLM提供高质量有价值的上下文嵌入信息,引入意图识别变得尤为重要,其不仅能够过滤掉大部分无用但又不得不加入pipline的工具,还可以极大优化整个pipline的响应时间以获得更好的用户体验。对于有含义的槽位标签,又分为以'B_'开头的槽位开始的标签, 以及以'I_'开头的其余槽位标记两种。SEP标记的主要作用是分隔不同的输入序列,使BERT模型能够同时处理多个输入序列。

2024-07-11 14:22:17 489

原创 实践干货!实现tiup与prometheus迁移

(2)admin用户登录grafana ---> Confguration ---> Data Sources ---> 查看数据源prometheus地址是否是当前的,如果不是则将其地址更改为新的prometheus,查看监控数据是否完整。(1)使用root用户登录dashboard ---> 点击root ---> Prometheus 数据源 ---> 使用自定义地址(新的prometheus)--->查看监控数据是否完整。本文分两部分:tiup迁移和prometheus迁移。

2024-07-11 14:10:59 250

原创 Open Interpreter利用Code Interpreter实现本地化

去年7月,OpenAI推出了Code Interpreter插件,它能够根据自然语言指令生成并执行代码,以完成数据分析、图表制作和文件编辑等任务。尽管GPT-4代码解释器功能强大,但存在一些限制,如托管运行、无法访问互联网、预安装软件包有限、最大上传限制100MB、运行时间限制120秒,以及环境终止时文件或链接丢失的问题。为解决这些问题,开源项目Open Interpreter应运而生,支持本地运

2024-07-01 10:42:39 637

原创 RAG文本溯源的PDF高亮显示,让知识一目了然!

在网页中集成PDF文档的显示功能并实现RAG文本溯源的高亮处理,是一个并不常见的需求,因此相关的指导资料和教程较少。本篇文章通过介绍两种工具,来分享一下笔者是如何完成此需求的。

2024-07-01 10:29:13 239

原创 以ChatGPT为例,浅析AI究竟能干什么?

AI因为黑盒的深度学习对执行认知有着天然限制,同样的提示词,同样的问题可能第一次回答准确,第二次则无法得出期望的结果,这是大模型所产生的"幻觉"。关于AI的安全方面也存在疑虑,由于训练需要大量优质样本,可能包含了一部分敏感信息,关于版权与滞后的监管与审查,无法推断AI会存在怎样的风险。这可能会面临被黑客恶意攻击。深度学习人工智能技术正在以爆发式发展,预训练+微调的方式促进了神经网络训练资源的共享,从上文来看深度学习所需要的算力才是关键,谁掌握更多的算力谁训练出来的模型也就相对优质,这既是门槛也是瓶颈。

2024-06-24 13:51:30 767

原创 一文了解Milvus2.4新特性和多向量搜索体验

比如:先提取人员A的脸部照片向量、声纹向量,然后在 Milvus 中,把人员A的脸部照片向量在众多人员的脸部向量中进行搜索,并且把人员A的声纹向量在众多人员的声纹向量中搜索,最后根据设定的两个模态向量的权重,对两个向量搜索结果重新排序,这样得到的结果,要比单向量搜索的更加准确。多向量搜索的时候,我使用的还是同一张图片,并且我是用同一张图片在两个向量中搜索的,权重设置的是,第一张照片的向量占60%,第二张照片的向量占40%。说明多向量搜索,能弥补单向量搜索的不足,让搜索的结果准确度更高。

2024-06-18 11:10:37 973

原创 Open Interpreter利用Code Interpreter实现本地化

作为一个可以在本地环境中运行的工具,Open Interpreter可以访问互联网,没有文件大小和运行时间的限制,并且可以利用任何包或库。去年7月,OpenAI发布了一个强大的插件,名为Code Interpreter(代码解释器),它可以根据用户的自然语言需求生成并执行代码解决方案,帮助完成各种任务,如数据分析、图表创建和文件编辑等。Open Interpreter不仅是一个编码解释器,它还是一个强大的工具,专注于处理复杂任务,将GPT-4代码解释器的强大功能与本地开发环境的灵活性完美结合在一起。

2024-06-13 15:52:24 814

原创 AGI 远不止 ChatGPT!一文入门 AGI 通识及应用开发

模型层的代理层其实就是一个脚手架,通过代理机制利用大模型理解用户的需求,并将其切分为多个小任务,然后调用各种已知的工具来完成任务,当然这些工具需要事先告知给代理层。这是整个过程的最后一步,引入专家或其他人在不同时间点问同样的问题,观察回答的差异,尽管可能有些微差别,但意思可能是一样的。最底层是模型的能力,它是不可或缺的,而它的算力则是由CPU支撑,在这之上还有一些框架。在企业场景中,大量的数据都是私有的,无论是结构化还是非结构化的,例如企业文档、规章制度、报告等都可以存储在向量数据库中。

2024-06-12 16:23:34 829

原创 一文讲清楚精益数据方法论在数据治理中的应用

通过明确分析目标、优化数据流程、提升数据质量等步骤,精益数据方法论帮助企业更加精准地洞察市场趋势、优化产品策略、提升运营效率。通过明确分析目标、优化数据流程、提升数据质量等步骤,精益数据方法论帮助企业更加精准地洞察市场趋势、优化产品策略、提升运营效率。通过收集和分析数据,企业可以更好地了解其业务流程,并找到改进的机会,从而实现更高效、更灵活、更满足客户需求的运营。在数据驱动的时代,如何从海量的信息中提取有价值的见解,并将其转化为实际的业务成果,是每个企业和决策者面临的挑战。

2024-06-04 18:08:32 771

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除