自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(85)
  • 收藏
  • 关注

原创 美媒:中国比美国更愿分享AI技术

美国《纽约时报》7月24日文章,原题:在人工智能领域,中国正缩小与美国的差距 本月在上海举行的世界人工智能大会上,一家初创公司创始人曲东奇(音)展示了最近在网上的一段视频:一张老照片中,一名妇女领着两个蹒跚学步的孩子。然后,照片仿佛有了生命,妇女把两个幼儿抱在怀里,孩子们惊喜地笑了。这段视频是用中国互联网公司快手的人工智能(AI)技术制作的。这让人想起美国初创公司OpenAI今年推出的视频生成器Sora。但与Sora不同的是,它是向公众开放的。

2024-07-27 13:32:08 287

原创 中国医疗AI领头羊讯飞医疗:最新招股书显示前三月收入破亿大关!

讯飞医疗,医疗AI创新企业,收入领先市场。计划港交所上市,用于研发升级、产品扩展及并购。市场潜力巨大,未来发展可期,将成医疗AI璀璨明星。各位看官,最近科技圈儿又有大新闻啦!讯飞医疗科技股份有限公司,这家把人工智能玩得风生水起的医疗界“侠客”,终于决定要在港交所主板大展拳脚了。今天,咱们就来扒一扒这家公司的前世今生,以及它未来准备怎么搞事情。

2024-07-27 11:59:24 763

原创 「研报解读」你知道吗?AI已经在医疗领域做了这些惊人的事情!

AI技术正重塑医疗服务全流程,提升效率质量,满足个性化需求,推动医疗创新发展。报告分析中国AI医疗产业现状、趋势与机遇,为政府、企业等提供参考,促进健康发展。人工智能技术正在深刻改变医疗行业的发展,为医疗服务提供了更智慧、更创新的解决方案。本报告从AI医疗的概念、特征、应用、市场、生态、挑战和未来展望等方面,对中国AI医疗产业进行了全面的研究和分析,旨在为读者提供一个清晰的AI医疗产业画像,以及对AI医疗产业的发展趋势和机遇的洞察。

2024-07-27 11:56:52 870

原创 Meta 发布Llama 3.1开源模型 NVIDIA推出AI 代工服务

在这周二,Meta发布了最新的AI模型Llama 3.1,并且是一个开源模型,面向公众免费提供,且提供8B、70B、305B参数版本,模型整体效果可与 GPT-4、GPT-4o、Claude 3.5 Sonnet 等领先的闭源模型相媲美。此次Llama 3.1 系列改进了推理能力及多语言支持,上下文长度提升至 128K,并且首次推出 405B 参数的旗舰模型。Llama 3.1 405B 是首个在常识、可操纵能力、数学、工具使用和多语种翻译等方面媲美顶级闭源人工智能模型的公开发布的模型。

2024-07-26 20:05:45 633

原创 北京率先建设AI原生城市,力争明年推出百个优秀行业大模型产品

7月26日,《北京市推动“人工智能+”行动计划(2024-2025年)》(简称《行动计划》)正式向社会发布,新京报记者在北京市发展和改革委员会举行的新闻发布会上获悉,北京将率先建设AI原生城市,将本市打造成为具有全球影响力的人工智能创新策源地和应用高地。根据《行动计划》,北京市将依托大模型创新资源和产业基础,从标杆应用、示范应用、商业应用等三个维度推动人工智能应用,构建大模型赋能经济社会发展的全景图。

2024-07-26 20:03:35 383

原创 信通院发布!首个大模型混合云标准

近日,中国信通院发布了首个大模型混合云标准,通过定位当前大模型混合云的能力水平,为基于混合云的大模型服务实践提供指引,并明确未来提升方向。同时,中国信通院基于标准展开大模型混合云能力成熟度专项测试,其中顺利完成专项测试的全部内容,在AI-Native云基础设施层能力、模型层能力、应用层能力、安全能力及运营运维能力的评级,达到大模型混合云能力成熟度评估的最高卓越级,华为云成为首批通过测试的企业。随着人工智能技术的不断突破,行业专属大模型日渐成为政企智能化的主要落地方向。

2024-07-26 19:59:22 658

原创 AI赋能学术论文写作:探索智能科技在学术领域的应用

论文摘要通常需要简洁地概括研究目的、方法、结果和结论,是读者了解文章内容的关键入口。但编写高质量的摘要对作者的语言表达能力和总结提炼能力有较高要求。AI摘要生成工具能够根据论文内容自动生成摘要,不仅能够提高摘要的质量,还能帮助作者从宏观上把握论文结构,进行必要的调整优化。

2024-07-25 11:40:06 460

原创 教师必看!AI与教育融合,你的职业生涯将迎来哪些颠覆性变化?

AI与教育的融合,不仅为学习者提供了更加个性化、高效的学习体验,同时也给教育工作者和相关从业人员带来了前所未有的挑战和机遇。那么,AI与教育的融合将如何影响你的职业生涯呢?本文将从以下几个方面进行探讨。AI技术能够根据学生的学习习惯、知识水平和兴趣点,提供个性化的学习资源和路径。这意味着教育工作者需要从传统的“一刀切”教学模式转变为更加关注个体差异的指导者。你的职业生涯可能需要更多地关注如何利用AI技术来满足学生的个性化需求。随着AI技术的进步,许多传统学科的知识也在不断更新。

2024-07-25 11:38:53 326

原创 AI人工智能:高校教育数字化转型与创新人才培养的加速器

在21世纪的科技浪潮中,人工智能(AI)作为最耀眼的明珠之一,正以前所未有的速度和深度改变着各行各业,其中AI人工智能以其独特的优势,成为推动这一变革的重要力量,随着信息技术的飞速发展,高校教育正逐步从传统的“以教师为中心”的教学模式向“以学生为中心”的个性化、智能化方向转变。AI人工智能以其强大的数据处理能力、智能分析算法以及自动化学习机制,为高校教育的数字化转型提供了强有力的技术支撑,也为创新人才的培养开辟了新路径。

2024-07-25 11:37:27 329

原创 【推荐收藏】可显著提升模型效果的4种超参自动优化方法

上面我们用Iris鸢尾花数据集试了不同的超参自动调优方法,发现贝叶斯优化和随机搜索都比格子搜索好。从一些论文反映,贝叶斯优化是更香的,但是贝叶斯优化好像在实践中用的不是那么多,网上也有很多分享者,像Nagesh Singh Chauhan,说的那样:[10]为什么呢?我想原因是贝叶斯的开销太大了,前面有提到,在每次循环选超参值的时候,贝叶斯优化都需要将 带入昂贵的目标函数 中,去得到输出值y,当目标函数特别复杂时,这种情况的评估开销是很大的,更何况随着搜索空间和搜索次数的变大,计算会越发昂贵。

2024-07-24 18:03:41 836

原创 大模型增量预训练新技巧:解决灾难性遗忘

该方法主要通过增加恒定块扩展模型层数,使模型在增量训练过程中仅训练新增层、冻结原始层,保持模型原有能力,防止模型出现灾难性遗忘现象。但有两点存疑:目前来说mistral要好于llama,为啥不用mistral进行实验不用恒定块,性能会差多少​。

2024-07-24 18:02:24 805

原创 LLamaFactory:当下最容易上手的大模型微调工具

近日,国内的一款微调框架发布了自己的论文《LLAMAFACTORY: Unified Efficient Fine-Tuning of 100+ Language Models》,对他们的框架做了系统性的总结。该框架自推出后迅速出圈,现已斩获15.6k的star,逐步成为当下微调的首选工具。

2024-07-24 18:01:04 645

原创 AI大模型:使用大模型解析用户问题

拓展开来,其实现在很多任务都可以使用大模型来解决,只要规定好输入和输出是什么即可,另外将任务描述清楚也是一项很重要的技能,否则模棱两可的描述在使用大模型的时候可能会出现适得其反的效果。作为一名热心肠的互联网老兵,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。如果是类似这样的长问题多问题的输入,我们就要对问题进行分析,眼下最方便的实现方式是使用大模型先对原问题进行分析,然后拆分出合理的若干子问题。

2024-07-23 10:24:17 968

原创 谷歌:使用大模型构建端到端的对话式推荐系统

最近,大型语言模型(LLM)表现出了前所未有的自然对话能力,并将世界知识和常识推理融入语言理解中,释放了这种范式的潜力。然而,在对话式推荐系统 (CRS) 中有效利用大模型带来新的技术挑战,包括正确理解和控制复杂的对话以及从外部信息源检索。本文提供了一个使用大模型来构建端到端大规模对话推荐系统的路线图。具体的,其提出了用户偏好理解、对话管理和可解释推荐的新实现,并将其作为LLM驱动的集成架构的一部分。为提高个性化,本文描述了大模型如何使用可解释的自然语言配置文件,并使用它们来调整会话级上下文。

2024-07-23 10:21:23 779

原创 华为:大语言模型在推荐系统的实践应用

本文从应用视角出发,尝试把大语言模型中的一些长处放在推荐系统中。

2024-07-23 10:16:54 760

原创 大模型提示工程(Prompt)(上篇),掌握Prompt原理与技巧,提高AI生成内容质量

关于ChatGPT等的账号如何注册,这里不再说描述,网上教程一搜一大把。好多人有这样一种感觉,拿到ChatGPT的账号,一顿尝试操作,当你过了新鲜的阶段,发现不好用,ChatGPT 回答的好空,没有太多参考价值;或者说,发现自己好像并没有什么好问的,不知道可以用 GPT 怎么来使用,于是过了这阵风,可能好久也想不起来再登录一次了。然而实际情况是,不管是相关技术从业者还是其他行业的从业者,越来越多的人正把它变为自己的生产力工具。

2024-07-22 13:46:44 697

原创 一文讲清楚,AI、AGI、AIGC与AIGC、NLP、LLM,ChatGPT等概念

随着chatgpt3.5的横空出试,大模型爆火,这个风暴传递到了各行各业。各类公众号、帖子,也涌现出了各种概念,AI、大模型、LLM、AI、AIGC、AGI、GPT、ChatGPT等等。总觉得被这些概念搞得头晕。我花了点时间,梳理了下一些常见的概念,希望从基本上能对大模型(LLM)有个基本的认识。

2024-07-22 13:44:25 1001

原创 医疗AI新纪元:大模型绘就医疗未来蓝图|专题报告集

Sam Altman,OpenAI的杰出创始人之一,曾深刻预言:“我们正身处一场前所未有的AI变革之中。”自今年2月Sora惊艳问世以来,大模型技术的发布浪潮席卷而来,热点纷呈,从长文本处理到知识库构建,从MOE优化到多模态融合,再到端到端解决方案,无一不彰显着技术的飞速进步。,获取专题报告合集全文,解锁145份医疗AI相关行业研究报告。

2024-07-22 10:05:16 930

原创 AI 大模型算力芯片产业深度分析 2024

算力需求爆发拉动芯片量价齐升ChatGPT热潮席卷全球。ChatGPT(Chat Generative Pre-trained Transformer)是由OpenAI于2022年12月推出的对话AI模型,一经面世便受到广泛关注,其2023年1月月活跃用户达到1亿,是史上月活用户增长最快的消费者应用。在问答模式的基础上ChatGPT可以进行推理、编写代码、文本创作等等,这样的特殊优势和用户体验使得应用场景流量大幅增加。1、▲芯片需求=量↑ x 价↑ , AIGC拉动芯片产业量价齐升。

2024-07-20 13:30:00 1200

原创 中国自动驾驶和未来出行服务市场展望 2024

***当前市场参与者的发展进展。

2024-07-20 12:45:00 1115

原创 MoneyPrinterPlus全面支持本地Ollama大模型

作为一名热心肠的互联网老兵,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。对于没有安装过Ollama的朋友,可以直接进入Ollama的官网: https://ollama.com/ 进行安装和下载。如果要下载对应的模型,可以ollama pull llama3从Ollama的模型注册表中拉取指定的模型到本地。支持云厂商的原因是现在大模型使用基本都很便宜,并且大厂的稳定性,性能都比本地搭建要好很多。

2024-07-20 10:15:00 1512

原创 你们大模型面试是真不准备啊?背完这些,LLM大语言模型面试就稳了 (附面试文档)

求职者背景:计算机硕士,整个面试下来,从自我介绍、项目连环深挖、反问环节,回答的都很惊艳,反问环节也突出了对业务的兴趣。紧接着主要围绕项目进行9个问题的深问环节,主要考察对业务的理解、AIGC平台得介绍、AI应用场景创新的理解。4. 所以到的RAG插件、prompt插件、模型部署,这几个部分服务过程中,整体的业务流、数据流是怎样的?8. 如果超过了大模型上下文长度,如何让大模型记住之前的节点回复的内容?✅基本的大模型技术要掌握,尤其是幻觉的解决方式,整体平台的核心业务流,整体的业务场景。

2024-07-19 15:36:53 336

原创 LLM大模型系列:提示词管理

大模型应用需要一个针对产品级大型语言模型的高效管理系统。这一系统致力于精确处理输入至语言模型的各类查询与指令,其运作机制可类比于数字图书馆的管理体系,只不过这里的“藏书”换成了一个个精心设计的提示词。从抽象视角来看,提示词管理是一系列优化实践的集合,旨在提升应用程序中大模型对提示的处理能力。其核心在于实现提示词的版本控制,确保其与应用程序的核心代码及部署流程相分离,同时保证从请求的角度能够轻松追踪。

2024-07-19 15:35:02 938

原创 ai大模型:最清晰解读提示工程(Prompt Engineering)

Prompt提示是什么呢?Prompt提示是模型接收以生成响应或完成任务的初始文本输入。我们给AI一组Prompt输入,用于指导模型生成响应以执行任务。这个输入可以是一个问题、一段描述、一组关键词,或任何其他形式的文本,用于引导模型产生特定内容的响应。例如,在chatGPT中,用户通常使用 prompt 来与大语言模型进行交互,请求回答问题、生成文本、完成任务等。模型会根据提供的 prompt 来生成一个与之相关的文本,尽量符合用户的要求。

2024-07-19 15:29:52 1131

原创 什么是大模型?一文读懂大模型的基本概念

1大模型是指具有大规模参数和复杂计算结构的机器学习模型。本文从大模型的基本概念出发,对大模型领域容易混淆的相关概念进行区分,并就大模型的发展历程、特点和分类、泛化与微调进行了详细解读,供大家在了解大模型基本知识的过程中起到一定参考作用。本文目录如下:· 大模型的定义· 大模型相关概念区分· 大模型的发展历程· 大模型的特点· 大模型的分类· 大模型的泛化与微调大模型是指具有大规模参数和复杂计算结构的机器学习模型。这些模型通常由深度神经网络构建而成,拥有数十亿甚至数千亿个参数。

2024-07-18 19:59:22 959

原创 在RAG系统中应用知识图谱

对于复杂的 RAG 和多跳数据检索的一般场景,如下图所示, 关于RAG的更多信息可以参考《[大模型系列——解读RAG]》。

2024-07-18 17:39:30 1006

原创 十分钟学会微调大语言模型

有同学给我留言说想知道怎么训练自己的大语言模型,让它更贴合自己的业务场景。完整的大语言模型训练成本比较高昂,不是我们业余玩家能搞的,如果我们只是想在某个业务场景或者垂直的方面加强大模型的能力,可以进行微调训练。本文就来介绍一种大语言模型微调的方法,使用的工具是我最近在用的 Text Generation WebUI,它提供了一个训练LoRA的功能。

2024-07-18 14:47:54 852

原创 Mistral AI两连发:7B数学推理专用、Mamba2架构代码大模型

网友很好奇,Mathstral能不能搞定「9.11和9.9谁大」这一问题。前天,AI圈竟然被「9.11和9.9谁大」这样简单的问题攻陷了,包括OpenAI GPT-4o、Google Gemini等在内的大语言模型都翻了车。这让我们看到,大语言模型在处理一些数字问题时并不能像人类那样理解并给出正确的答案。对于数字以及复杂的数学问题,专用模型更术业有专攻。今天,法国大模型独角兽 Mistral AI 发布了一个,来解决需要复杂、多步骤逻辑推理的高级数学问题。

2024-07-18 09:25:38 1678

原创 如何利用大模型提高金融合规场景的工作效率?

针对挂号、住院、陪诊等服务,在首次致电收集需求、出号提醒等电话沟通场景,根据服务流程要求(客户需求、待办事项等),自动解析、生成结构化总结,提升后续服务环节的服务质量。

2024-07-17 17:01:42 944

原创 大模型算法岗常见面试题100道(值得收藏)

大模型LLM(Large Language Models) 通常采用基于Transformer的架构。Transformer模型由多个编码器或解码器层组成,每个层包含多头自注意力机制和前馈神经网络。这些层可以并行处理输入序列中的所有位置,捕获长距离依赖关系。大模型通常具有数十亿甚至数千亿个参数,可以处理大量的文本数据,并在各种NLP任务中表现出色。

2024-07-17 11:51:57 700

原创 LLM大模型-24年最新大语言模型新书!这本LLM大模型黑书你一定要学(附PDF)

1.1 Transformer 的生态系统1.2 使用Transformer 优化NLP模型1.3 我们应该使用哪些资源1.4 本章小结1.5 练习题8.1 文本到文本模型8.2 使用T5 进行文本摘要8.3 使用GPT-3 进行文本摘要8.4 本章小结8.5 练习题。

2024-07-17 09:39:58 816

原创 大模型书籍-从零开始大模型开发与微调:基于PyTorch与ChatGLM(附PDF)

哈喽各位,今天又来给大家分享大模型学习书籍了,今天是这本,大模型是深度学习自然语言处理皇+冠上的一颗明珠,也是当前AI和NLP研究与产业中最重要的方向之一。本书使用PyTorch 2.0作为学习大模型的基本框架,以ChatGLM为例详细讲解大模型的基本理论、算法、程序实现、应用实战以及微调技术,为读者揭示大模型开发技术。

2024-07-16 17:04:52 525

原创 快速入门大模型应用开发,这本书帮你轻松实现!

如果问个问题:有哪些产品曾经创造了伟大的奇迹?ChatGPT 应该会当之无愧入选。仅仅发布 5 天,ChatGPT 就吸引了 100 万用户——当然,数据不是关键,关键是其背后的技术开启了新的 AI 狂潮,成为技术变革的点火器。就算我们这些周边吃瓜群众都日日活在 ChatGPT 带来的震撼里,更不用说在 AI 领域摸爬滚打的专家们了。有了 OpenAI API 和 ChatGPT,一切都变得不一样了!不需要什么高深的技术,只要懂一点 Python,就可以即刻动手开发自己的智能应用了!

2024-07-16 12:02:26 762

原创 聊聊心理医疗领域大模型的落地思考

近来,工作偏向于心理医疗领域方面的大模型,仅从领域大模型的落地,聊聊个人的一些思考。

2024-07-16 09:37:45 1005

原创 产品经理与AI:共生与创新的未来

产品经理和人工智能(AI)之间的关系是现代技术发展中一个非常有趣且复杂的主题。随着AI技术在各个领域的应用日益广泛,产品经理的角色也正在经历着前所未有的变革。产品经理与人工智能:共生与创新的未来在当今数字化时代,人工智能(AI)已经成为推动各行各业创新和转型的关键力量。作为技术和商业策略的桥梁,产品经理的角色在AI时代显得尤为重要。本文将探讨产品经理与AI之间的关系,以及这种关系如何塑造未来的产品开发和市场策略。传统的产品经理主要负责定义产品愿景、规划产品路线图、协调跨职能团队以及确保产品满足市场需求。

2024-07-15 17:29:42 1139

原创 快速入门大模型应用开发,这本书帮你轻松实现!

如果问个问题:有哪些产品曾经创造了伟大的奇迹?ChatGPT 应该会当之无愧入选。仅仅发布 5 天,ChatGPT 就吸引了 100 万用户——当然,数据不是关键,关键是其背后的技术开启了新的 AI 狂潮,成为技术变革的点火器。就算我们这些周边吃瓜群众都日日活在 ChatGPT 带来的震撼里,更不用说在 AI 领域摸爬滚打的专家们了。有了 OpenAI API 和 ChatGPT,一切都变得不一样了!不需要什么高深的技术,只要懂一点 Python,就可以即刻动手开发自己的智能应用了!

2024-07-15 11:43:48 716

原创 全网爆火!学大模型必备的大模型黑书来了!内行人全都在学~ (附pdf)_大模型黑书pdf 百度云

1.1 Transformer 的生态系统1.2 使用Transformer 优化NLP模型1.3 我们应该使用哪些资源1.4 本章小结1.5 练习题8.1 文本到文本模型8.2 使用T5 进行文本摘要8.3 使用GPT-3 进行文本摘要8.4 本章小结8.5 练习题。

2024-07-15 10:59:49 1079

原创 LangChain v0.2:向稳定性迈进的一大步

LangChain v0.2:向稳定性迈进的一大步❝本文经翻译并二次整理自LangChain v0.2: A Leap Towards Stability一文。LangChain官方正式对外宣布了LangChain v0.2的预发布版本,这个版本在提升LangChain的稳定性和安全性方面迈出了重要一步。还记得四个月前我们发布的LangChain首个稳定版吗?今天,我们继续这一进步,带来了langchainv0.2的预发布版。这个新版本不仅在v0.1的基础上进行了改进,还吸纳了社区的反馈。

2024-07-13 18:03:17 1061

原创 【国内超大型智能算力中心建设白皮书 2024】_智算中心算力规划

文末有福利!智算中心建设通过领先的体系架构设计,以算力基建化为主体、以算法基建化为引领、以服务智件化为依托,以设施绿色化为支撑,从基建、硬件、软件、算法、服务等全环节开展关键技术落地与应用。一、体系架构(一)总体架构图8 智算中心总体架构智能算力中心建设白皮书,重点围绕基础、支撑、功能和目标四大部分,创新性地提出了智算中心总体架构。其中,基础部分是支撑智算中心建设与应用的先进人工智能理论和计算架构;支撑部分围绕智算中心算力生产、聚合、调度、释放的作业逻辑展开;功能部分提供算力生产供应、数据开放共享、智能生态

2024-07-13 11:54:24 805

原创 【超万卡GPU集群关键技术深度分析 2024】_构建10万卡gpu集群的技术挑战

文末有福利!1. 集群高能效计算技术随着大模型从千亿参数的自然语言模型向万亿参数的多模态模型升级演进,超万卡集群吸需全面提升底层计算能力。具体而言,包括增强单芯片能力、提升超节点计算能力、基于 DPU (Data Processing Unit) 实现多计算能力融合以及追求极致算力能效比。这些系统性的提升将共同支持更大规模的模型训练和推理任务,满足迅速增长的业务需求。1.1 单芯片能力超万卡集群中,单芯片能力包括单个 GPU 的计算性能和 GPU 显存的访问性能。在单个 GPU 计算性能方面,首先需要设计先

2024-07-13 09:30:27 407

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除