在数字化道路无限探索

致力于用数字化技术重构企业价值!集云技术人才培养、软件研发及云方案交付为一体,为处在数字化转型不同阶段的行业客户提供全生命周期的产品、方案和研发交付服务。

  • 博客(397)
  • 收藏
  • 关注

原创 AGI|一篇小白都能看懂的RAG入门介绍!

随着近几年AIGC的发展,不仅是大模型自身在不断优化,相关支持应用也在不断涌现。本文的主角便是这些技术中较为引人注目的RAG(Retrieval-Augmented Generation)——检索增强生成技术。LLM虽然已经在通识领域展现出了惊人的能力,但要落实到真正具体的问题解决,特别是针对专业领域,企业领域的一些具体的,私人的数据生成解决方案,仅仅依靠LLM还是远远不够的。

2024-02-20 11:22:14 4000 2

原创 AIGC|LangChain新手入门指南,5分钟速读版!

你可以用langchain做一个属于自己的人工智能应用~

2023-11-27 10:07:49 2308

原创 AI时代的技术底座-向量数据库:一文讲清,建议收藏

向量数据库的前世今生,原理及应用场景合集

2023-11-20 09:59:42 2681 2

原创 人工智能|万字长文!一文带你弄懂AI技术及大模型演进的前世今生

一部大模型的历史演化进程

2023-08-21 09:54:41 2468

原创 云原生|浅谈Kubernetes 安全防护问题,构建安全容器化应用

在过去,安全性总是由单独的安全团队在开发周期快要结束时才参与进来,随着产品快速迭代,安全团队无法确保每个发布都是安全的,正是因为这种脱节才衍生出 DevSecOps 的概念。少部分受访者的安全防护和 DevOps 是分开的;使用 DevOps 平台配合另外一些安全扫描的工具也是一个不错的选择,这不仅解决了镜像的管理和构建,同时也解决了部署的问题。使用 Kubernetes 的网络策略也可以是一个选择,允许容器与容器之间的通信,实施零信任策略后可以确保单个容器受损后不影响其他容器,而造成应用的大面积宕机。

2024-09-09 13:47:26 1134

原创 数据库|使用 TiDB Vector 搭建 RAG 应用,创建文档问答助手

基于 TiDB Vector 给 TiDB 搭建一个文档问答小助手

2024-09-04 11:24:45 1137

原创 微服务|一文带你了解无感知部署方案实战

蓝绿部署是一种零停机时间的部署策略,它通过同时维护两个生产环境(一个是当前活跃的“Blue”环境,另一个是待部署的“Green”环境)来实现。在程序开发和运维过程中,会频繁地部署服务,并且每个服务的正常运行都依赖于其他服务,所以能够在不停服的情况下部署新版本服务来保持应用的整体稳定性可用性十分重要。Nacos接收到这个心跳包,首先检查当前服务在不在注册列表中,如果不在按新服务的业务进行注册,如果在,表示当前这个服务是健康状态。Nacos的服务管理有上下线服务的功能,且有open-api可直接调用触发。

2024-08-28 15:33:42 716

原创 AGI|前端页面如何支持多模态大模型的流式返回?一文弄懂!

通过流式传输,使模型在token可用时立即开始返回, 而不是等待整个token序列生成完毕。虽然这并不会改变获取所有token所需的时间,但它减少了获取第一个token的时间,对于希望显示部分进展或可能会中途停止生成的应用程序来说,这是一个更好的用户体验。

2024-08-23 10:36:09 1063

原创 数据库|TiDB告警推送-企业微信机器人

企业微信机器人是企业微信提供的一种机器人接口,通过该接口可以实现向企业微信群发送文本、图片、链接等消息,从而实现各种应用场景下的消息推送功能。企业微信机器人采用简单的 HTTP 请求接口,使用方便灵活,可以轻松集成到各种应用中。利用企业微信机器人实现 TiDB 的告警推送功能,提供了一种简单、高效的告警通知方式。这种方案不仅能够及时发现和解决 TiDB 集群中的问题,还能够提高团队的工作效率和响应速度,从而提升系统的稳定性和可靠性。

2024-08-21 14:40:15 672

原创 最前端|Git如此重要的6条高效命令,你不会还没学会吧?

本文分享我在Git开发工作中实践过的6大高效命令,这些都能够大大提高工作效率,还能解决不少疑难场景

2024-08-20 14:24:44 1073

原创 数据库|TiDB Vector抢先体验之用TiDB实现以图搜图

在以往,想在关系型数据库中对非结构化数据实现搜索是一件不敢想象的事,哪怕是号称无所不能的 PostgreSQL 在向量插件的加持下也没有获得太多关注,这其中有场景、性能、生态等各方面的因素制约。前有专门的向量数据库阻击,后有各种传统数据库追赶,这注定是一个惨烈的赛道,希望 TiDB 能深度打磨产品,突围成功。这里的distance就是两个向量之间的相似度,这个相似度是用vec_cosine_distance函数计算出来的,意味着两个向量之间的夹角越小相似性越高,夹角大小用余弦值来衡量。

2024-08-08 13:40:25 976

原创 AGI|玩转提示工程,优化LLM的实践指南!

简单清晰,一读就懂

2024-08-06 11:41:06 836

原创 AGI|如何用Open WebUI和Ollama在本地运行大型语言模型?

除此之外,在Workspace页,可以添加提示词(Prompt),在聊天界面通过@,#等命令引用对应的文档,提示词,让用户可以更高效的和大模型沟通。再看应用程序对应的文件,相应目录下确实存在webiu.db文件,存的是交互的数据,包含聊天记录,授权信息等,前面演示聊天上传的文件也在另外一个目录下。启动成功,浏览器访问 http://localhost:3000/,首次注册的用户为系统管理员,登录之后页面如下图,开始聊天之前选择想要的模型,就可以开始和大模型对话了。数据都存储在本地,也不用担心安全问题。

2024-07-31 10:08:47 919

原创 数据库|三大维度讲解TiDB性能优化之操作系统

操作系统参数总共跟三项有关:CPU、Memory、Disk

2024-07-25 10:38:27 1023

原创 最前端|5分钟速通ES6中set和map使用

唯一性:Set中的元素是唯一的,而Map中的键是唯一的。存储方式:Set存储的是单个元素,而Map存储的是键值对。迭代顺序:Set中的元素按照插入顺序进行排序,而Map中的元素也是按照插入顺序进行迭代的。用途:Set通常用于存储唯一的值集合,而Map用于存储键值对。作者:田俊| 前端开发工程师版权声明:本文由神州数码云基地团队整理撰写,若转载请注明出处。公众号搜索神州数码云基地,了解更多技术干货。

2024-07-23 11:15:40 328

原创 AGI|前方高能!一文了解大模型会话QA增强

但是对于大模型的对话,模型并没有人脑这样的能力,在用户进行多轮对话时,用户的简短提问可能会指代上文中的部分信息,如果仅用当次问题去问答,会使对话效果不佳,大模型答非所问,效果较差。QA增强的目的旨在提高模型的回复效果,从而获得更有效的信息。根据历史轮和当前轮的对话,从候选会话历史的集合中找到最适合对应指代位置的答案,然后将指代具体化,或者预测指代可能的具体内容以补全省略信息。在上面的场景中,我们需要了解RAG的相关知识,在后续对话中的指代和省略的内容需要替换成RAG的相关描述,在检索阶段搜索到有效的信息。

2024-07-17 14:48:58 724

原创 最前端|前端如何入门Axure?实践经验分享!

2、拖拽一个矩形组件进入,在右上角样式中设置矩形的高宽,先绘制底图,,可以点击截图的大小是1920-945,中间有个小锁标志是锁定高宽比例,设置其中一个值会同比例设置另外的值,选择填充,可以填充图片或者纯背景颜色。首先Axure是产品经理用来绘制原型的工具,在快速迭代快速发展的当下,原型能验证设计的概念,将现有的需求转化为具体可视方案,让团队成员可以更好的理解需求方案。复制替换热搜按钮,修改展示隐藏内容,然后选中两个按钮,右键选择,选项组,则这两个按钮在选中后都会互斥,展示选中颜色。

2024-07-12 16:57:04 639

原创 数据库|实践干货!实现tiup与prometheus迁移

(2)admin用户登录grafana ---> Confguration ---> Data Sources ---> 查看数据源prometheus地址是否是当前的,如果不是则将其地址更改为新的prometheus,查看监控数据是否完整。(1)使用root用户登录dashboard ---> 点击root ---> Prometheus 数据源 ---> 使用自定义地址(新的prometheus)--->查看监控数据是否完整。关于prometheus的数据迁移《迁移prometheus数据》(

2024-07-10 10:25:01 347

原创 AGI|Transformer自注意力机制超全扫盲攻略,建议收藏!

最强入门干货!

2024-07-05 11:04:07 1023

原创 【附下载】100+AI领域论文及研究报告合集免费领取!

小编整理汇总了目前网络上热门的AI领域研究报告、技术原理、以及超多工具解析,共计超100+篇!!持续更新ing目录AI全行业研究报告技术及原理文章主流大模型技术报告AI领域综述合集多模态大模型合集数据训练文章模型结构与技术5000+工具详解更多AI资讯及实践尝试持续更新 ing...报告通过正常网络渠道搜集整理获得,出于传递信息资讯,版权归原作者所有,如有侵权,联系删除

2024-07-03 16:12:32 385

原创 AGI|基于Joint BERT模型的意图识别技术实践

模型基于BERT的架构,利用其强大的双向上下文表示能力。Joint BERT模型的优化目标是最大化条件概率p(yi, ys|x),即给定输入x时,意图yi和槽位序列ys的联合概率。意图识别在诸多领域已经有了非常广泛的应用,例如各个品牌的智能语音助手,如今多模态模型能力迅猛增长,与LLM交流方式变得多样化,为了给LLM提供高质量有价值的上下文嵌入信息,引入意图识别变得尤为重要,其不仅能够过滤掉大部分无用但又不得不加入pipline的工具,还可以极大优化整个pipline的响应时间以获得更好的用户体验。

2024-07-03 11:24:22 1028

原创 AGI|RAG文本溯源的PDF高亮显示,让知识一目了然!

web环境中页面内嵌渲染PDF,高亮搜索文档中的段落

2024-06-27 10:07:49 813

原创 开源探索时刻!在LLaMA-Factory上实现GLM-4和Qwen2的工具格式化

在LLaMA-Factory上实现GLM-4和Qwen2的工具格式化

2024-06-25 11:08:31 1163

原创 AGI|以ChatGPT为例,浅析AI究竟能干什么?

当一个新事物的出现,最好的办法就是了解它出现的背景,发展的历史。当ChatGPT出现在我们面前,多轮对话能力让人震惊,仿佛机器真的可以"理解"人类语言。不同于当时Siri一样的语音助手,ChatGPT的准确率相比之下非常高。于是一夜之间AI的浪潮袭来,时至今日各个厂商相继公开自己的大模型并不断迭代:GPT-4-Turbo, Qwen-Max,智谱清言GLM-4等。AI能力也从最初的对话型衍生出多种:图片生成,语音识别,文档解析,代码补全,视频生成,AI搜索……

2024-06-20 14:35:16 757

原创 《失败的逻辑》|别再无效复盘了!学会认清每一次失败的必然性

例如,在水池的例子中,一个清晰的目标可能是“彻底解决水池发臭的问题”,这需要我们进一步分析发臭的原因,并采取相应的措施,如改善水质、定期清洁等。很多时候大家会发现,其实很多被委派任务的人,并不了解这个任务的本质,于是想当然的,他们依靠自己过往的“经验”以及搜集到的参考资料,做出了一个“不完美”的计划。问题在于,我们的目标仅仅停留在解决表面的症状——即水池的臭味,而没有深入探究并解决臭味的根源。通过这种方式,我们可以确保我们的目标是直击要害的,我们的努力能够带来持久的解决方案,而不仅仅是临时的缓解。

2024-06-18 13:49:38 913

原创 数据库|一文了解Milvus2.4新特性和多向量搜索体验

Milvus,自2019年开源以来,已成为向量数据库领域的佼佼者,专门用于处理由深度学习和其他机器学习模型生成的大规模向量数据。前段时间发布的Milvus 2.4版本引入了一系列创新功能,包括多向量检索、Grouping搜索和稀疏向量等等,进一步巩固了其在行业中的领先地位。

2024-06-18 11:50:10 1837

原创 最前端|还在焦虑网页内容无法保存?一文教你轻松给网页拍照

再也不愁网页无法保存了!

2024-06-14 11:48:58 657

原创 5位AI界“考生”参加高考作文写作,最高分竟然是...

ChatGPT、文心一言、Kimi...究竟谁能拔得头筹?

2024-06-12 10:09:55 678

原创 免费!GPT-4o发布,实时语音视频丝滑交互

我们通常所了解的大模型更新命名都是以【X.X】的形式,然而本次OpenAI创新性的提出一个新的理念,GPT-4o,这个“o”在OpenAI的官网中给出了解答,“o”代表“omni”,在拉丁语中表示“全能的、全知的”,意味着本次GPT-4o是一次全方位的升级。毫无疑问本次OpenAI给出的信息量无疑是爆炸式的,无论是GPT-4o所展现出的全新的可能性,还是OpenAI决定对免费用户开放更多的功能,其带给大众的震撼都是真实可见的。在发布会现场,OpenAI的工程师Mark Chen为我们演示了几个主要的能力。

2024-06-07 14:27:13 1062

原创 数据库|一文详解现网修改TiDB集群IP和端口

在实际应用中,可能会需要对 TiDB 各个组件的 IP 地址和端口进行修改,以适应不同的网络环境或需求。此文章是给大家分享现网修改TiDB集群各组件的IP或端口的方法,可以作为平时运维上的操作参考。修改 IP 地址和端口需要谨慎操作,以确保 TiDB 集群的稳定性和可靠性。在进行修改之前,请务必备份关键数据,并确保对 TiDB 集群的影响有清晰的认识。PD 不建议直接修改 IP 地址,先进行扩容,再缩容。PD 不建议直接修改 IP端口,先进行扩容,再缩容。将2379改为2479,2380改为2480。

2024-06-07 14:01:48 814

原创 AGI|Open Interpreter利用Code Interpreter实现本地化

一个好用的开源工具

2024-06-05 11:07:08 1254

原创 最前端|手把手教你打造前端规范工程

统一规范,方便你我他

2024-06-03 11:17:11 744

原创 数据开发|一文讲清楚精益数据方法论在数据治理中的应用

谷歌的所有产品都因其强大的安全功能而被认可,这些功能不断保护着用户的信息。而他们的旗帜生成式人工智能产品也不例外。精益数据方法论是一种基于数据仓库的商业智能分析方法论,它强调以最小的数据投入获得最大的业务价值。通过明确分析目标、优化数据流程、提升数据质量等步骤,精益数据方法论帮助企业更加精准地洞察市场趋势、优化产品策略、提升运营效率。精益数据方法论以其高效、精准的特点,在数据分析、数据治理领域展现出强大的潜力。

2024-05-30 16:48:21 486

原创 AGI |一文快速上手LangChain的新利器:LangGraph!

LLM Agent之所以受到广泛关注,是因为它代表了人工智能领域在处理和生成自然语言方面的最新进展,能够执行复杂的语言任务,如翻译、摘要、问答等,极大地推动了人机交互和自动化内容创作的边界。而LangGraph提供了一种创新的方法来增强LLM的语义理解和生成能力,通过构建和利用语言的图谱结构,LangGraph有助于提高模型对语言细微差别的捕捉能力,从而在各种语言任务中实现更准确、更自然的表现。本篇文章带大家一起,真实地上手尝试一下。

2024-05-28 11:45:03 1705

原创 云原生|为什么服务网格能够轻松重塑微服务?一文讲清楚!

跨集群进行访问,亦或跨不同云厂商的集群访问。例如:Minio/DB从单体部署演变成集群,势必涉及到部署的方式改变,数据的迁移,数据备份,容灾等......某些暂时无法进行拆分的基础设施成为了云原生环境下的边缘服务,示意图中的Minio也代表着这一类的服务(它们不好拆分或成本略高)……容器化技术与容器编排推动了微服务架构应用的演进,于是应用的扩展与微服务的数量日益增加,新的问题随之而来,监控服务的性能变得越来越困难,微服务与微服务之间相互通信变得越来越复杂,请求链路越来越长,排查问题变得越来越繁琐。

2024-05-24 18:12:11 959

原创 AGI|一文识别LangChain中ChatOpenAI 和OpenAI的区别

也就是OpenAI中列举的模型中以gpt-3.5-turbo和gpt-4开头是ChatOpenAI 支持的模型,其余都是OpenAI支持的模型。在探索LangChian的ChatOpenAI 和 OpenAI这两个类时,了解到这两个类使用OpenAI接口不一样, OpenAI使用的是/v1/completions接口,而ChatOpenAI 使用的是/v1/chat/completions。OpenAI提供了一系列强大的机器学习工具和算法,适用于广泛的应用领域,并且能够满足复杂的研究和开发需求。

2024-05-21 11:28:21 1822

原创 数据库|DR-AUTO-SYNC架构集群搭建及主备切换手册

部署一套名为“dr-autosync”的集群系统

2024-05-17 14:36:03 375

原创 最前端|你不知道的ES6新特性Reflect最全使用方法总结

总结来说,Reflect对象提供了一组与 JavaScript 内部操作直接对应的、用于对象操作的标准 API,它增强了代码的可读性、一致性,并且在某些情况下提供了更详细的控制和反馈。Reflect 对象的方法与Object对象上的同名方法(如get、set、defineProperty等)相对应,但它们通常返回一个布尔值以表示操作是否成功,而不是静默失败。attributes是一个包含属性描述符的对象。返回一个数组,包含目标对象target自身的所有属性键(包括可枚举和不可枚举的属性,以及符号属性)。

2024-05-10 14:06:07 1266

原创 PM说|还有不会DISC的项目经理?

在项目管理中,在团队内部管理和项目过程跟踪的过程中,DISC可以帮助PM通过了解和关注项目成员的不同类型,更好的安排项目工作任务,注重团队成员的感受,发挥不同资源的作用,不时进行检验,保证项目比较顺利、有效地进行。对于DISC模型的应用其实有很多的方式,很多人通过这些模型会给人贴标签,或是成为职场PUA的工具等等,这更多是取决于使用工具的人,DISC只是辅助我们的一个工具,更重要的是我们如何去使用它。他们往往擅长与人沟通和交流,热情洋溢,善于协调和组织,但也可能过于乐观和浮躁,缺乏细节和深度思考。

2024-05-07 17:55:01 843

原创 AGI|基于LangChain实现的三种高级RAG检索方法

自动合并检索方法,实现方法源自Llamaindex所封装的自动合并检索,但RAG全流程需要制定一套准确的规范,因此在用户文档完成读取和切片工作后,所得到的Langchain格式的Document对象需转化为Llamaindex定义的Document对象,便可通过Llamaindex的自定义算法自动划分整个切片列表的子节点和父节点,最后鉴于规范再重新转化为Langchain格式的Document对象,并将父节点信息、深度信息等封装进每个节点。由此可见,多路召回检索在数据源广而杂的情况下,富有更好的效果。

2024-05-07 17:09:39 1240

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除