学习资源
文章平均质量分 87
代码讲故事
这个作者很懒,什么都没留下…
展开
-
LeCun谢赛宁首发全新视觉多模态模型,等效1000张A100干翻GPT-4V,AI视频长度扩展调优技术:ExVideo帮你轻松生成更长、更优质的视频,EVTexture:提升视频分辨率的新方法!利用
LeCun谢赛宁首发全新视觉多模态模型,等效1000张A100干翻GPT-4V,AI视频长度扩展调优技术:ExVideo帮你轻松生成更长、更优质的视频,EVTexture:提升视频分辨率的新方法!利用AI将模糊视频变清晰!原创 2024-09-19 11:15:58 · 353 阅读 · 0 评论 -
通用端到端OCR模型开源,拒绝多模态大模型降维打击,完全免费、可离线使用,2024最佳开源项目对比盘点整理,无需CA证书即可抓取HTTPS明文的工具,基于eBPF技术实现
通用端到端OCR模型开源,拒绝多模态大模型降维打击,完全免费、可离线使用,2024最佳开源项目对比盘点整理,无需CA证书即可抓取HTTPS明文的工具,基于eBPF技术实现。原创 2024-09-14 10:34:30 · 1185 阅读 · 0 评论 -
震撼!AI实时生成游戏,每秒20帧,谷歌扩散模型最新突破一夜爆火,附论文介绍和GitHub代码
震撼!AI实时生成游戏,每秒20帧,谷歌扩散模型最新突破一夜爆火,附论文介绍和GitHub代码。原创 2024-09-14 10:18:18 · 813 阅读 · 0 评论 -
60秒直出3D内容,纹理逼真!Meta最新3D Gen模型实现60倍速生成
60秒直出3D内容,纹理逼真!Meta最新3D Gen模型实现60倍速生成在图像生成和视频生成这两个赛道上,大模型仅用了两年多的时间就卷得如火如荼。即使是效果堪比Sora的Gen-3、Luma等模型发布,也很难引起曾经的轰动反应。你可能会疑惑,AI还能玩出新花样吗?Meta放出的最新研究告诉你——能!不管是图像还是视频,即使能做出3D效果,终究只是二维空间中的像素组成的。Meta最近发布的3D Gen模型,则能实现1分钟内的端到端生成,从文本直出高质量3D资产。原创 2024-07-19 21:54:59 · 1213 阅读 · 0 评论 -
ICML 2024高分论文 | 零阶优化器微调大模型,大幅降低内存,附代码地址下载
ICML 2024高分论文 | 零阶优化器微调大模型,大幅降低内存,附代码地址下载原创 2024-07-15 10:16:24 · 1175 阅读 · 0 评论 -
Z Product | 全球首款室内类人巡航清扫AI机器人,全球开源的扫地机器人项目,附代码和硬件相关地址
Z Product | 全球首款室内类人巡航清扫AI机器人,全球开源的扫地机器人项目,附代码和硬件相关地址。原创 2024-07-15 09:52:20 · 1242 阅读 · 0 评论 -
号称世界上第一个开源实时翻译的 App,微软开源GraphRAG:极大增强大模型问答、摘要、推理,以及开源基于ChatGPT的超级文本代码智能体(附代码地址)
号称世界上第一个开源实时翻译的 App,微软开源GraphRAG:极大增强大模型问答、摘要、推理,以及开源基于ChatGPT的超级文本代码智能体(附代码地址)原创 2024-07-12 18:00:52 · 1520 阅读 · 0 评论 -
open-chat-video-editor:开源短视频生成和编辑工具,以及抖音|TikTok 的移动端短视频项目
open-chat-video-editor:开源短视频生成和编辑工具,以及抖音|TikTok 的移动端短视频项目。原创 2024-06-28 16:29:35 · 798 阅读 · 0 评论 -
AI 卖货主播大模型:Streamer-Sales 销冠!MoneyPrinterTurbo :简直就是营销号的梦想工具!
AI 卖货主播大模型:Streamer-Sales 销冠!MoneyPrinterTurbo :简直就是营销号的梦想工具!原创 2024-06-28 16:25:12 · 683 阅读 · 0 评论 -
AI 音乐生成器 MusicGPT,同声传译StreamSpeech!Web短视频平台Sharine
AI 音乐生成器 MusicGPT,同声传译StreamSpeech!Web短视频平台Sharine。原创 2024-06-28 16:20:00 · 1129 阅读 · 0 评论 -
AI黑盒研究的突破性进展:Anthropic详解大模型的「思维」特征
AI黑盒研究的突破性进展:Anthropic详解大模型的「思维」特征。一直以来 AI 都是一个黑盒子(black box),其内部运作机制是不可见的。人们输入数据并得到结果,但无法检查输出结果的逻辑或者系统的代码。原创 2024-06-21 15:09:08 · 884 阅读 · 0 评论 -
盘点一下免费开源中最重要的两款大模型,马斯克旗下 xAI 推出首款多模态模型Grok-1.5V,OpenChat:性能高达105.7%,第一个超越ChatGPT的开源模型?
盘点一下免费开源中最重要的两款大模型,马斯克旗下 xAI 推出首款多模态模型Grok-1.5V,OpenChat:性能高达105.7%,第一个超越ChatGPT的开源模型?原创 2024-06-11 06:47:38 · 694 阅读 · 0 评论 -
QAnything 1.3:新增Python直接部署能力,fastfit:提供快速准确少样本分类方法的Python库,qlora-pipe:用于训练大语言模型的开源脚本
QAnything 1.3:新增Python直接部署能力,fastfit:提供快速准确少样本分类方法的Python库,qlora-pipe:用于训练大语言模型的开源脚本。原创 2024-05-10 21:56:12 · 319 阅读 · 1 评论 -
多模态模型Mini-Gemini:代码模型数据均开源,MiniCPM小钢炮2.0全家桶四连发,可以在Android 手机端上运行的大模型,效果还不错
多模态模型Mini-Gemini:代码模型数据均开源,MiniCPM小钢炮2.0全家桶四连发,可以在Android 手机端上运行的大模型,效果还不错。原创 2024-05-10 21:51:20 · 927 阅读 · 0 评论 -
LiteChain:构建LLMs应用的轻量级LangChain,Superagent : 轻松构建AI代理,创建机器人,ChatGLM-RLHF:对ChatGLM直接使用RLHF提升或降低目标输出概率
LiteChain:构建LLMs应用的轻量级LangChain,Superagent : 轻松构建AI代理,创建机器人,ChatGLM-RLHF:对ChatGLM直接使用RLHF提升或降低目标输出概率。原创 2024-05-10 21:45:27 · 1131 阅读 · 0 评论 -
AI 模型量化格式介绍,LangChain Agent 原理解析,HugggingFace 推理 API、推理端点和推理空间使用介绍
AI 模型量化格式介绍,LangChain Agent 原理解析,HugggingFace 推理 API、推理端点和推理空间使用介绍。在 HuggingFace 上下载模型时,经常会看到模型的名称会带有fp16、GPTQ,GGML等字样,对不熟悉模型量化的同学来说,这些字样可能会让人摸不着头脑,我开始也是一头雾水,后来通过查阅资料,总算有了一些了解,本文将介绍一些常见的模型量化格式,因为我也不是机器学习专家,所以本文只是对这些格式进行简单的介绍,如果有错误的地方,欢迎指正。原创 2024-05-10 21:30:05 · 1061 阅读 · 0 评论 -
上下文窗口长度达到了100万token,LWM支持处理多模态信息,能在100万token中准确找到目标文本,还能一口气看完1小时的视频,RingAttention还与FlashAttention结合
上下文窗口长度达到了100万token,LWM支持处理多模态信息,能在100万token中准确找到目标文本,还能一口气看完1小时的视频,RingAttention还与FlashAttention结合使用,并通过Pallas框架进行优化,从而提高性能。原创 2024-04-25 22:09:36 · 841 阅读 · 0 评论 -
搜索整理的全球先进开源项目、软件、资料、框架、各类开发编程语言大整理及排行总榜,基本上搜罗了所有本地的所有语言的优秀高分开源项目,妥妥的神仙级福利知识库
搜索整理的全球先进开源项目、软件、资料、框架、各类开发编程语言大整理及排行总榜,基本上搜罗了所有本地的所有语言的优秀高分开源项目,妥妥的神仙级福利知识库。原创 2024-04-25 21:48:02 · 380 阅读 · 0 评论 -
Sora有了开源平替文生视频和图生视频:OpenDiT!作为一个开源项目,通过其高性能的Diffusion Transformer(DiT)实现,为文本到视频或文本到图像的生成应用带来了革命性的提升
Sora有了开源平替文生视频和图生视频:OpenDiT!作为一个开源项目,通过其高性能的Diffusion Transformer(DiT)实现,为文本到视频或文本到图像的生成应用带来了革命性的提升。原创 2024-04-25 21:32:10 · 1123 阅读 · 1 评论 -
一篇文章Linux技术急速入门,掌握这些命令可以解决日常 99% 的问题
一篇文章Linux技术急速入门,掌握这些命令可以解决日常 99% 的问题。当你听到Linux[1]时,大多数人会想到只有程序员才会使用的复杂操作系统。但是,其实并非如此,虽然Linux给普通用户的感觉可能很深奥,需要很多操作命令才能使用,但实际上只要会少量命令你就可以运用自如了。原创 2024-04-07 20:58:48 · 1345 阅读 · 0 评论 -
100 个网络基础知识,看完成半个网络高手
100 个网络基础知识,看完成半个网络高手。原创 2024-04-07 20:52:28 · 657 阅读 · 0 评论 -
OpenChat:性能高达105.7%,第一个超越ChatGPT的开源模型?
OpenChat:性能高达105.7%,第一个超越ChatGPT的开源模型?原创 2024-03-03 13:37:07 · 1213 阅读 · 0 评论 -
斯坦福发布最新LLM排行榜AlpacaEval,微软WizardLM登顶开源模型第一
斯坦福发布最新斯坦福发布最新LLM排行榜AlpacaEval,微软WizardLM登顶开源模型第一。排行榜AlpacaEval,微软WizardLM登顶开源模型第一。原创 2024-03-03 13:23:57 · 1396 阅读 · 0 评论 -
LangFlow——一款可轻松实验和原型化 LangChain流水线的AI项目
LangFlow——一款可轻松实验和原型化 LangChain流水线的AI项目。原创 2024-03-02 11:17:40 · 2516 阅读 · 0 评论 -
零一万物模型官方 Yi-34B 模型本地离线运行部署使用笔记(物理机和docker两种部署方式),200K 超长文本内容,34B 干翻一众 70B 模型,打榜分数那么高,这模型到底行不行?
零一万物模型官方 Yi-34B 模型本地离线运行部署使用笔记(物理机和docker两种部署方式),200K 超长文本内容,34B 干翻一众 70B 模型,打榜分数那么高,这模型到底行不行?目前最具公信力的 HuggingFace 榜单中,包括 Yi-34B 在内,排在它前面的模型只有 26 个,但是其中 48% (14个)都是 Yi-34B 和 Yi-34B 200K 的变体模型,其中第一名是来自社区用户 fblgit 的 “LLaMa Yi 34B”原创 2024-02-27 17:56:56 · 4389 阅读 · 0 评论 -
CPU、GPU 混合推理,非常见大模型量化方案:“二三五六” 位量化,模型量化详细实现方案
CPU、GPU 混合推理,非常见大模型量化方案:“二三五六” 位量化,模型量化详细实现方案。非常见整型位数的量化,来自让各种开源模型能够在 CPU 环境、CPU & GPU 环境混合推理的技术方案:llama.cpp 。为了能够在低配置上机器运行,降低入门的硬件门槛还是很有必要的。模型量化技术就是这样一个“神奇、有效”的方案。原创 2024-02-27 16:13:13 · 1753 阅读 · 0 评论 -
开源大模型LLM大爆发,数据竞赛已开启!如何使用FuseLLM实现大语言模型的知识融合?
开源大模型LLM大爆发,数据竞赛已开启!如何使用FuseLLM实现大语言模型的知识融合?原创 2024-02-27 14:20:53 · 1329 阅读 · 0 评论 -
Stability AI发布全新代码模型Stable Code 3B!媲美70亿Code Llama,没GPU也能跑,专写代码,支持18种编程语言,上下文100K,笔记本离线就能跑
Stability AI发布全新代码模型Stable Code 3B!媲美70亿Code Llama,没GPU也能跑,专写代码,支持18种编程语言,上下文100K,笔记本离线就能跑。原创 2024-02-27 09:58:24 · 1136 阅读 · 0 评论 -
全网公开的大模型评测数据集整理
全网公开的大模型评测数据集整理。原创 2024-02-26 10:26:27 · 2152 阅读 · 0 评论 -
轻量级模型,重量级性能,TinyLlama、LiteLlama小模型火起来了,针对特定领域较小的语言模型是否与较大的模型同样有效?
轻量级模型,重量级性能,TinyLlama、LiteLlama小模型火起来了,针对特定领域较小的语言模型是否与较大的模型同样有效?当大家都在研究大模型(LLM)参数规模达到百亿甚至千亿级别的同时,小巧且兼具高性能的小模型开始受到研究者的关注。小模型在边缘设备上有着广泛的应用,如智能手机、物联网设备和嵌入式系统,这些边缘设备通常具有有限的计算能力和存储空间,它们无法有效地运行大型语言模型。因此,深入探究小型模型显得尤为重要。原创 2024-02-26 10:17:05 · 1450 阅读 · 0 评论 -
Meta AI | 指令回译:如何从大量无标签文档挖掘高质量大模型训练数据?
Meta AI | 指令回译:如何从大量无标签文档挖掘高质量大模型训练数据?文章来自Meta AI,self-Alignment with Instruction Backtranslation[1]:通过指令反向翻译进行自对准。一种从互联网大量无标签数据中挖掘高质量的指令遵循数据集的方案,它利用少量种子数据,从大量互联网上无标签的数据,挖掘出大量高质量的、多样性也不错的训练数据,成功将llama(美洲驼)进化成Humpback(座头鲸)。原创 2024-02-24 22:28:45 · 1033 阅读 · 0 评论 -
Llama2模型的优化版本:Llama-2-Onnx
Llama2模型的优化版本:Llama-2-Onnx。Llama-2-Onnx是Llama2模型的优化版本。Llama2模型由一堆解码器层组成。每个解码器层(或变换器块)由一个自注意层和一个前馈多层感知器构成。与经典的变换器相比,Llama模型在前馈层中使用了不同的投影大小。例如,Llama1和Llama2的投影都使用了2.7倍的隐藏大小,而不是标准的4倍隐藏大小。Llama1和Llama2之间的一个关键区别在于注意层的架构变化,Llama2利用了分组查询注意(GQA)机制来提高效率。原创 2024-02-24 22:15:21 · 1592 阅读 · 0 评论 -
跨越千年医学对话:用AI技术解锁中医古籍知识,构建能够精准问答的智能语言模型,成就专业级古籍解读助手(LLAMA)
跨越千年医学对话:用AI技术解锁中医古籍知识,构建能够精准问答的智能语言模型,成就专业级古籍解读助手(LLAMA)。在 Ziya-LLaMA-13B-V1基线模型的基础上加入中医教材、中医各类网站数据等语料库,训练出一个具有中医知识理解力的预训练语言模型(pre-trained model),之后在此基础上通过海量的中医古籍指令对话数据及通用指令数据进行有监督微调(SFT),使得模型具备中医古籍知识问答能力。原创 2024-02-24 22:07:30 · 1272 阅读 · 0 评论 -
macOS、Windows、Linux、Docker等各个平台通过ollama一键部署谷歌最新开源的gemma大模型,免费开源离线部署使用超越llama2、chatgpt4
macOS、Windows、Linux、Docker等各个平台通过ollama一键部署谷歌最新开源的gemma大模型,免费开源离线部署使用超越chatgpt4。谷歌最强开源大模型亮相!Gemini技术下放,笔记本就能跑,可商用。原创 2024-02-23 17:56:58 · 5117 阅读 · 0 评论 -
免安装WebDNN使用和配置,浏览器上最快的DNN执行框架WebDNN:从基本特性到性能测评
免安装WebDNN使用和配置,浏览器上最快的DNN执行框架WebDNN:从基本特性到性能测评。WebDNN 是网页浏览器中最快的 DNN 执行框架,而本文首先简单介绍了 WebDNN 特征与其框架结构,即表明了为什么 WebDNN 能为端用户提供高效的 DNN 应用。而后文章将给出 WebDNN 与 Keras.js 的详细对比,并在最后一部分介绍 WebDNN 的安装环境与步骤。原创 2024-02-23 15:55:49 · 1006 阅读 · 0 评论 -
清华系2B模型杀出支持离线本地化部署,可以个人电脑或者手机上部署的多模态大模型,超越 Mistral-7B、LLaMA-13B
清华系2B模型杀出支持离线本地化部署,可以个人电脑或者手机上部署的多模态大模型,超越 Mistral-7B、LLaMA-13B。基于 MiniCPM-2B 的指令微调与人类偏好对齐的 MiniCPM-2B-SFT/DPO。基于 MiniCPM-2B 的多模态模型 MiniCPM-V,能力超越基于 Phi-2 的同参数级别多模态模型 。MiniCPM-2B-SFT/DPO 的 Int4 量化版 MiniCPM-2B-SFT/DPO-Int4。基于 MLC-LLM、LLMFarm 开发的 MiniCPM原创 2024-02-23 15:14:39 · 2050 阅读 · 0 评论 -
利用docker一键部署LLaMa2到自己的Linux服务器支持视觉识别支持图文作答支持中文,有无GPU都行、可以指定GPU数量、支持界面对话和API调用,离线本地化部署包含模型权重合并
利用docker一键部署LLaMa2到自己的Linux服务器支持视觉识别支持图文作答支持中文,有无GPU都行、可以指定GPU数量、支持界面对话和API调用,离线本地化部署包含模型权重合并。两种方式实现支持界面对话和API调用,一是通过搭建text-generation-webui。二是通过llamma.cpp转换模型为转换为 GGUF 格式,使用 quantize 量化模型,使用 llama.cpp 运行 GGUF 模型。原创 2024-02-23 14:14:00 · 2352 阅读 · 0 评论 -
万字总结!5大AI应用场景+17个细分方向+40多个案例精选
万字总结!5大AI应用场景+17个细分方向+40多个案例精选。探讨现阶段 AI 应用的方向、实际体验及其对应价值,为想要做 AI 应用的小伙伴提供方向价值判断参考。这里筛选了我个人目前看到的比较亮眼且有实际应用场景的案例,对实际体验感受做了总结,也推荐大家自己上手感受。原创 2024-02-22 15:15:15 · 2529 阅读 · 0 评论 -
MedicalGPT 训练医疗大模型,实现了包括增量预训练、有监督微调、RLHF(奖励建模、强化学习训练)和DPO(直接偏好优化)
MedicalGPT 训练医疗大模型,实现了包括增量预训练、有监督微调、RLHF(奖励建模、强化学习训练)和DPO(直接偏好优化)。MedicalGPT: Training Your Own Medical GPT Model with ChatGPT Training Pipeline. 训练医疗大模型,实现了包括增量预训练、有监督微调、RLHF(奖励建模、强化学习训练)和DPO(直接偏好优化)。原创 2024-02-21 14:30:36 · 1734 阅读 · 0 评论 -
5个顶级开源法学硕士大型语言模型 (LLM)
5个顶级开源法学硕士大型语言模型 (LLM)。原创 2024-02-20 11:19:28 · 1139 阅读 · 0 评论