- 博客(178)
- 收藏
- 关注
原创 金融大模型到底靠不靠谱?
一个“技术问题”,导致巴菲特的伯克希尔-哈撒韦公司股价暴跌近 100%。想必很多小伙伴已经感受过了这则铺天盖地的消息,所带来的亿点点震撼。而根据事后的消息来看,这个大故障是纽交所的合并报价系统(CTA)在更新软件时出现了问题。许多专家都对此做了分析,有人认为是 CTA 软件在进行版本更新时出现了数据一致性问题;也有人提出最大的问题应该是出现在了数据库。①人工智能/大模型学习路线②AI产品经理资源合集③200本大模型PDF书籍④超详细海量大模型实战项目⑤LLM大模型系统学习教程。
2025-05-18 23:58:43
573
原创 蓝耘平台介绍:算力赋能AI创新的智算云平台
蓝耘平台凭借高性能算力、灵活的资源配置及用户友好的设计,成为AI开发者与企业的重要工具。无论是科研探索还是产业落地,其“降本提效”的核心优势显著,适合作为入门级算力平台或企业级算力解决方案。未来随着算力需求的爆发式增长,蓝耘在智算云服务领域的潜力值得期待。
2025-05-18 23:54:42
782
原创 终于有人把多模态大模型讲这么详细了
多模态大型语言模型(Multimodal Large Language Models, MLLM)的出现是建立在大型语言模型(Large Language Models, LLM)和大型视觉模型(Large Vision Models, LVM)领域不断突破的基础上的。这里给大家总结了多模态大模型的结构,训练,评估方法以及幻觉问题的解决办法,通俗易懂!!
2025-05-18 23:49:47
504
原创 深度求索(DeepSeek):以AI之力重塑医疗未来
当DeepSeek的算法开始理解细胞凋亡的数学表达,当智能体能够模拟药物在血管中的湍流扩散,我们正在见证医疗范式的根本性转变。这不是机器取代医生的故事,而是人类智慧与人工智能的共进化史诗。从三甲医院到偏远村卫生室,从新药实验室到家庭健康终端,DeepSeek持续用技术突破拓展医疗普惠的边界。在这条用代码构建生命防线的道路上,每一次算法的精进,都在为人类健康共同体增添新的希望注脚。
2025-05-18 23:45:07
451
原创 数字人技术的核心:AI与动作捕捉的双引擎驱动(210)
AI 与动作捕捉技术的深度融合,正在重构数字人的 “生命体征”。随着 5G、AR/VR 技术的普及,数字人将从单一功能载体进化为具备自主意识的虚拟生命体,成为连接物理世界与数字空间的超级入口。未来的数字人不仅是技术的集合体,更是人类情感与智慧的数字化延伸。我们正站在一个新的时代起点上,见证着数字人技术带来的变革与创新。在这个虚实共生的新纪元中,数字人将与我们的生活、工作、娱乐深度融合,创造出无限可能的未来。
2025-05-18 23:41:23
621
原创 必须收藏!可能是最完整的全球AI大模型名单
ChatGPT的出现在全球掀起了AI大模型的浪潮。区块链是生产关系的重构,元宇宙是虚拟场景的重构,而互联网则解决了信息流通和生产效率的问题,但这些都是在生产关系范畴内,而ChatGPT的出现则大幅度提升了生产力,让人类可以将电能转换成脑力和通用智力。很多人已经把这次AI浪潮称为“第四次科技革命”。甚至《自然》杂志把非人类的Chat GPT列入“年度科学人物”根据国际数据公司IDC预测,全球AI计算市场规模将从2022年的195.0亿美元增长到2026年的346.6亿美元。
2025-05-18 23:37:27
513
原创 如何搭建基于大模型的智能知识库
基于RAG与LLM的知识库作为目前最有潜力的企业端大模型应用之一,从技术角度可以看到,建设方案已经完备;从业务角度,最终的应用效果和业务价值还需要观察,并通过业务侧的反馈不断地促进建设方案的进一步优化,比如增加对多模态知识的处理能力等。让我们共同期待这类应用普及那一天的到来。
2025-05-18 23:25:05
793
原创 大模型获取embdding
以qwen为例:本文将使用 Hugging Face 的库来完成这些步骤。这是一个非常流行且功能强大的库,用于处理各种预训练语言模型。
2025-05-18 23:21:08
114
原创 大模型的快速部署与高效推理——GGUF格式模型介绍与使用教程
在人工智能领域,大型语言模型的发展日新月异,它们在自然语言处理、机器翻译、智能助手等多个领域展现出了前所未有的能力。然而,随着模型规模的不断扩大,这些庞大的神经网络模型在存储、传输和加载上面临着一系列挑战。传统的文件格式在处理这些庞大的数据集时显得力不从心,不仅效率低下,而且兼容性和扩展性也难以满足日益增长的需求。在这样的背景下,GGUF(GPT-Generated Unified Format)应运而生。
2025-05-18 23:16:41
502
原创 大模型实操 ——LoRA、QLoRA微调大模型实战技巧分享
换句话说,Adam优化器在内存中为每个模型参数存储两个附加值,即如果我们正在训练一个7B参数的模型,那使用Adam就能够在训练的过程中跟踪额外的14B参数,相当于在其他条件不变的情况下,模型的参数量翻了一番。另外,值得注意的是,我的实验中包括两个算术基准测试。在之前的实验中,采用的参数是 r=8,alpha=16,这导致了2倍的扩展。可能大家都想学习AI大模型技术,也想通过这项技能真正达到升职加薪,就业或是副业的目的,但是不知道该如何开始学习,因为网上的资料太多太杂乱了,如果不能系统的学习就相当于是白学。
2025-05-18 23:11:55
620
原创 大模型+电力预测?
自ChatGPT问世以后,大模型非常的火,不出意外的话,电力系统方向又打算搞事情了。大模型+电力任重道远。最近听说了一些关于大模型+风光功率预测、负荷预测、电价预测的想法,初步分析下,很遗憾的是,个人得出结论是不可行。简单来说,如果强行使用大模型来做电力预测,本质上可能只是一厢情愿的希望大模型去预测一个噪声罢了。
2025-05-18 23:07:28
537
原创 解锁AIGC新时代:通义万相2.1与蓝耘智算平台的完美结合引领AI内容生成革命
通义万相2.1作为一个开源的视频生成AI模型,在发布当天便荣登了VBench排行榜的榜首,超越了Sora和Runway等业内巨头,展现出惊人的潜力。模型不仅能够生成1080P分辨率的视频,而且没有时长限制,能够模拟自然动作,甚至还可以还原物理规律,这在AIGC领域中简直堪称革命性突破。通过蓝耘智算平台,我们能够轻松部署这个模型,创建属于自己的AI视频生成工具。今天,我将为大家深入探讨通义万相2.1的强大功能,并分享如何利用蓝耘智算平台快速入门。
2025-05-16 21:32:12
792
原创 自己动手在Mac M1上搭建一个大模型聊天机器人
在本地运行开源模型的最有效方法是使用llama.cpp项目,llama.cpp是由机器学习专家Georgi Gerganov开发的开源大模型推理框架,最初是为了在本地运行Meta的Llama大模型,经过开源社区的努力,现在能够支持包括Google的Gemma、国内的通义千问、百川等在内的大模型,该项目在github上当前已有60K star。同样得益于技术社区的努力,一些基础的大模型(如llama 7b)也能够在CPU上运行,只是速度可能稍慢,这对于没有独立显卡的普通PC或笔记本用户来说是一个福音。
2025-05-16 21:28:07
902
原创 生成式 AI 分析:大模型 + 大量数据的神奇效果
如果你对这篇文章感兴趣,可以点击「【访客必读 - 指引页】一文囊括主页内所有高质量博客」,查看完整博客分类与对应链接。
2025-05-16 21:23:17
687
原创 日常工作效率翻倍?AI大模型技术告诉你怎么做!
朋友们,今天咱们来聊聊一个超炫酷的技术——AI大模型技术,它在文字创作、图片生成、视频制作等领域可是大放异彩,简直就是我们的超级助手!
2025-05-16 21:18:55
655
原创 快速掌握MCP——Spring AI MCP包教包会
是一个开源的协议,可以让大模型应用更方便的集成各种数据源和工具,经典举例为:使用Type-C接口适配各种电器,使用统一的接口为大模型应用提供各种工具。MCP官网中将MCP主要分为:MCP Hosts、MCP Clients、MCP Servers、Local Data Sources、Remote Services这几个部分。同时,MCP官网还提供了多种语言的SDK,python、java、c#、typescript等都有。在本文中所使用到的框架为spring-ai。
2025-05-16 21:13:22
581
原创 已成功入职华为,总结精选50个大模型高频面试题(附答案)
今天我给大家分享一下我整理的**《精选50个大模型高频面试题》** 大模型面试专题和答案,其中大部分都是面试常问的面试题,可以对照这查漏补缺奥!祝大家早日上岸呀!1.简述 GPT和 BERT的区别2.讲一下 GPT 系列模型的是如何演进的3.为什么现在的大模型大多是 decoder-only的架构4.讲一下生成式语言模型的工作机理5.哪些因素会导致 LLM 中的偏见6.LLM 中的因果语言建模与掩码语言建模有什么区别7.如何减轻 LLM 中的“幻觉”现象。
2025-05-16 21:07:48
1168
原创 大模型:突破AI的边界
大模型是指具有庞大参数数量的机器学习模型。传统的机器学习模型通常只有几百或几千个参数,而大模型则可能拥有数亿或数十亿个参数。这种巨大的模型规模赋予了大模型更强的表达能力和预测能力,可以处理更为复杂的任务和数据。
2025-05-16 21:00:30
761
原创 大模型相关技术综述
2021年4月,华为云联合循环智能发布盘古NLP超大规模预训练语言模型,参数规模达1000亿;联合北京大学发布盘古α超大规模预训练模型,参数规模达2000亿。阿里达摩院发布270亿参数的中文预训练语言模型PLUG,联合清华大学发布参数规模达到1000亿的中文多模态预训练模型M6。2021年6 月,北京智源人工智能研究院发布了超大规模智能模型“悟道 2.0”,参数达到 1.75 万亿,成为当时全球最大的预训练模型。2021年7月,百度推出ERNIE 3.0 知识增强大模型,参数规模达到百亿。
2025-05-16 20:56:07
736
原创 大模型之BERT技术详解
AI大模型是通过深度学习算法和人工神经网络训练出的具有庞大规模参数的人工智能模型。这些模型使用大量的多媒体数据资源作为输入,并通过复杂的数学运算和优化算法来完成大规模的训练,以学习和理解到输入数据的模式和特征。这些模式和特征最终通过大模型中庞大的参数进行表征,以获得与输入数据和模型设计相匹配的能力,最终来实现更复杂、更广泛的任务,如语音识别、自然语言处理、计算机视觉等。大模型的训练过程是根据大量的输入数据,通过算法调整模型中庞大的参数来优化模型性能。
2025-05-16 20:46:42
542
原创 在IntelliJ IDEA 2024.3中配置CodeGPT与DeepSeek AI的详细指南
在开发过程中,AI辅助工具可以极大地提高我们的工作效率。本文将详细介绍如何在IntelliJ IDEA 2024.3版本中配置CodeGPT插件,并使用DeepSeek AI作为自定义OpenAI服务。通过本文的步骤,您将能够在IDEA中直接与DeepSeek AI进行交互,享受AI带来的便利。通过以上步骤,您已经成功在IntelliJ IDEA 2024.3中配置了CodeGPT插件,并使用DeepSeek AI作为自定义OpenAI服务。现在,您可以享受AI带来的高效开发体验了!
2025-05-16 15:29:24
652
原创 全球AI大模型盘点(全网首发)
Grok xAI是由Grok公司开发的一个AI模型,它在特定领域如金融和医疗中展现出深度学习和模式识别的能力,用于解决复杂的行业问题。天工AI是由昆仑万维科技股份有限公司开发的AI搜索工具,提供多种搜索服务和应用权限,支持用户进行高效的信息检索。Synthesia是一个AI视频平台,可以创建逼真的虚拟演讲者,支持多种语言和风格,适用于视频制作和内容创作。Spline AI是一个AI驱动的3D设计工具,允许用户通过简单的提示生成对象、动画和纹理,简化3D设计过程。
2025-05-16 15:19:14
687
原创 从头到尾,手把手教你使用扣子(coze)搭建自己的AI智能体
智能体就像是一个有“脑子”的帮手。它存在于某个环境中(比如手机、电脑、机器人、甚至网络里),能自己观察周围的情况,思考该做什么,然后主动采取行动去完成目标。1.手机里的语音助手(Siri、小爱同学):你说话它听(感知环境),分析你的需求(比如“明早8点叫我起床”),然后自己设置闹钟(行动)。2.扫地机器人:它会自己探测房间哪里脏(感知),绕开障碍物(决策),主动去扫地(行动)。总之,智能体就是一个能自己看、自己想、自己动的“智能小助手”,它可能是软件(比如聊天机器人),也可能是硬件(比如机器人),
2025-05-16 15:07:48
823
原创 【MySql】navicat连接报2013错误
在不同的Linux系统下,my.cnf放在不同的位置。这里以CentOS8 Server做示例,其他系统请根据情况自行找到my.cnf的路径。但是我的配置文件并没有配置这一句,各种搜索均也没有解决问题。但是在别人连接成功的配置文件里发现了一个不同的配置语句。在前面加上#注释掉,然后加入通过键盘的左右键移动到最前面。根据这个错误提示,这是连接初始化阶段就丢失了连接的错误。我们需要通过键盘里的上下键来移动,游标找到。用vim打开配置文件,我的配置文件路径是。查看mysql数据库中所有的表。
2025-03-22 15:49:44
600
原创 Vllm进行Qwen2-vl部署(包含单卡多卡部署及爬虫请求)
阿里云于今年9月宣布开源第二代视觉语言模型Qwen2-VL,包括 2B、7B、72B三个尺寸及其量化版本模型。Qwen2-VL具备完整图像、多语言的理解能力,性能强劲。相比上代模型,Qwen2-VL 的基础性能全面提升,可以读懂不同分辨率和不同长宽比的图片,在 DocVQA、RealWorldQA、MTVQA 等基准测试创下全球领先的表现;可以理解 20 分钟以上长视频,支持基于视频的问答、对话和内容创作等应用;
2025-03-22 03:03:02
641
原创 SpringBoot后端服务重定向
选择哪种方法取决于具体需求和架构。在我的场景中,使用了Spring MVC的重定向。但如果需要一个长期的解决方案,需要考虑前端同步更新,避免不必要的重定向的开销。或者使用反向代理或者Spring Cloud Gateway。愿你我都能在各自的领域里不断成长,勇敢追求梦想,同时也保持对世界的好奇与善意!
2025-03-21 23:48:49
635
原创 Spring Cloud和SpringBoot版本对应关系?思维导图 代码示例(java 架构)
Spring Cloud 和 Spring Boot 的版本之间存在一定的对应关系,因为 Spring Cloud 依赖于 Spring Boot 提供的基础功能。通常情况下,每个主要版本的 Spring Cloud 都是与特定版本范围的 Spring Boot 兼容的。以下是截至2024年12月的最新版本信息和一个简化的关系图。
2025-03-10 22:39:20
388
原创 Redis连接池
redisTemplate.opsForValue().set(“name”,“谷歌”);支持基于JDK、JSON、字符串、Spring对象的数据序列化及反序列化。提供了对不同Redis客户端的整合(Lettuce和Jedis)提供了RedisTemplate统一API来操作Redis。支持基于Redis的JDKCollection实现。<–基于Springboot引入这两个依赖:–>支持Redis哨兵和Redis集群。支持基于Lettuce的响应式编程。支持Redis的发布订阅模型。
2025-03-10 16:39:30
330
原创 PostgreSQL JSONJSONB 查询与操作指南
PostgreSQL 提供了强大的和数据类型及相关操作,适用于存储和查询半结构化数据。本文将详细介绍其常用操作。: 返回 JSON 对象中的值,结果为 JSON 格式。– 返回:{“b”: 1}: 返回 JSON 对象中的值,结果为文本。– 返回:“1” (文本)– 返回:2 (JSON 格式)– 返回:“2” (文本)使用获取嵌套对象:– 返回:{“c”: 3}使用获取嵌套对象的文本值:– 返回:“3” (文本)
2025-03-10 11:53:09
825
原创 MySQL|MySQL 中 `DATE_FORMAT()` 函数的使用
是 MySQL 中的一个内置函数,用于格式化日期和时间数据。它可以根据指定的格式字符串来展示日期和时间,使得数据更容易阅读和理解。本文档将详细介绍函数的使用方法及其常见应用场景。
2025-03-07 22:03:17
617
原创 MySQL-触发器(TRIGGER)
例如,对于一张数据表,不能同时有两个 BEFORE UPDATE 触发器,但可以有一个 BEFORE UPDATE 触发器和一个 BEFORE INSERT 触发器,或一个 BEFORE UPDATE 触发器和一个 AFTER UPDATE 触发器。BEFORE 和 AFTER,触发器被触发的时刻,表示触发器是在激活它的语句之前或之后触发。现在触发器还只支持行级触发,不支持语句级触发。注意:当触发器设计对触发表自身的更新操作时,只能使用 BEFORE 类型的触发器,AFTER 类型的触发器将不被允许。
2025-03-05 18:18:05
1206
原创 Keepalived + Nginx实现高可用
IP规划VIPIPnginx端口默认主从80MASTER80BACKUP(1)配置IP(2)修改主机名(3)配置yum源(两台虚拟机相同)2. 安装nginx(1)首先安装依赖(两个节点同步)(2)安装nginx(3)解压nginx压缩包(4)进入nginx目录,编译并安装(两个节点同步)(5)修改nginx首页面IP地址(welcome to nginx改成本机IP,从节点同理,改为192.168.100.202)(6)启动nginx(两个节点同步)
2025-03-05 16:54:23
898
原创 java进阶--多线程学习
并行(parallel):指在同一时刻,有多条指令在多个处理器上同时执行。就好像两个人各拿一把铁锨在挖坑,一小时后,每人一个大坑。所以无论从微观还是从宏观来看,二者都是一起执行的。来个比喻:并发是一个人同时吃三个馒头,而并行是三个人同时吃三个馒头。并行是指多个处理器或者是多核的处理器同时处理多个不同的任务。并发是逻辑上的同时发生,而并行是物理上的同时发生。并发是指一个处理器同时处理多个任务。
2025-03-05 14:44:40
320
原创 ES在SpringBoot集成使用
按i进入插入模式,就可以编辑了,编辑完按ESC退出编辑模式,输入:,进入底行模式,再输入wq强制保存并退出,这些命令不懂的话去学下liunx基础。可以进行索引的创建、文档的增删改查等操作。Kibana是ES的一个图形化操作工具,也可以使用es-head,这里我本人使用的是es-head,因此我讲的也是es-head安装。其中的高亮显示是在ES7.9.x版本才有的好像,我在ES7.7版本显示报错,有一个方法不支持了。- http://localhost:9200 //es容器的地址,ip要换成虚拟机ip。
2025-03-05 00:26:51
854
原创 2023最新Java面试八股文汇总(五十万字总结版)
今年的疫情,让招聘面试变得雪上加霜。已经有不少大厂,如腾讯、字节跳动的招聘名额明显减少,面试门槛却一再拔高,如果不用心准备,很可能就被面试官怼得哑口无言,甚至失去了难得的机会。现如今,情势依然严峻,未来充满着不定性,想要跳槽涨薪的小伙伴,在面试前更是要做好充足的准备!接下来又准备到一年金九银十面试跳槽季,你准备好了吗?
2025-03-04 22:08:49
340
原创 02原理篇(D2_SpringBoot 自动装配原理)
自动装配简单来说就是自动把第三方组件的bean加到IOC容器里,在springboot项目中可以通过在启动类上加@SpringBootApplication注解来实现自动装配,这个注解是一个组合注解,真正实现自动装配的注解是@EnableAutoConfiguration。步骤一:main方法中SpringApplication.run(xxx.class,args)的执行流程中有而这个refreshContext(context)内部会解析,配置类上自动装配功能的注解。
2025-03-03 17:31:46
823
原创 (五)Spring Cloud Alibaba 2023.x:Seata 分布式事务配置与实现
在微服务架构中,分布式事务是确保多个服务之间数据一致性和完整性的关键。随着微服务的拆分,传统的单体事务无法满足跨服务的事务管理需求,这时分布式事务变得尤为重要。Seata作为一款轻量级、高性能的分布式事务解决方案,通过提供全局事务管理自动回滚等功能,帮助开发者轻松处理分布式系统中的事务问题,避免了数据不一致和服务失败的风险。
2025-03-03 12:19:07
692
原创 秒鲨后端之MyBatis【2】默认的类型别名、MyBatis的增删改查、idea中设置文件的配置模板、MyBatis获取参数值的两种方式、特殊SQL的执行
建议分成两种情况进行处理实体类类型的参数使用@Param标识参数。
2025-03-03 10:29:11
779
原创 工作中常用springboot启动后执行的方法
工作中难免会遇到一些,程序启动之后需要提前执行的需求。初始化缓存:在启动时加载必要的缓存数据。定时任务创建或启动:程序启动后创建或启动定时任务。程序启动完成通知:程序启动完成后通过邮件、短信等方式通知运维人员。外部系统同步:启动后与外部系统同步数据。
2025-03-02 21:19:52
231
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人