AI开源项目
文章平均质量分 93
Aitrainee
AI算法工程师 | AIGC时代,立志成为超级个体。
知音难求,自我修炼亦艰。
吾生也有涯,而知也无涯。
公众号:AI进修生。
展开
-
文生视频新王登场:Luma官宣免费、电影级大片生成,Sora?可灵?SD3.0?(内附网址)
Dream Machine能够理解视频的主题、风格和情感等创意因素,并自动选择最佳的拍摄角度、镜头转换和叙事节奏,营造出独特的意境和艺术氛围。这款工具生成的画面非常清晰细腻,质量极高,可以模拟专业的光影变化、镜头语言和特效渲染,输出的视觉效果堪比专业影视作品。:AI 能够理解视频的主题、风格和情感等创意因素,自动选择最佳拍摄视角、镜头转换和叙事节奏,营造出独特的艺术氛围。:支持在生成过程中实时调整文本和图片,即时更新视频内容,实现创意的快速迭代,并通过学习用户反馈不断优化生成效果。,都达到了电影级的水准。原创 2024-06-15 14:38:54 · 1025 阅读 · 0 评论 -
Qwen-Agent:Qwen2加持,强大的多代理框架 - 函数调用、代码解释器以及 RAG!
等,进一步支撑你的行动,以提升本文的帮助力。原创 2024-06-15 14:37:58 · 3369 阅读 · 1 评论 -
Mi-gpt:将小爱音箱接入 ChatGPT ,智能家居 Agent,播放音乐,调节灯光,逗你开心
类似于小爱技能,无需每句话都以“小爱同学”开头。原创 2024-06-15 14:37:07 · 3005 阅读 · 0 评论 -
FinGPT:12.3k 星星!金融领域的开源大模型来了!
FinGPT允许您对模型进行微调以适应特定的金融任务。# 加载预训练的FinGPT模型# 定义训练数据{"text": "这是一个积极的新闻", "label": "positive"},{"text": "这是一个消极的新闻", "label": "negative"}# 定义训练参数# 进行微调。原创 2024-06-15 14:36:18 · 1432 阅读 · 0 评论 -
Coolify:24.2K 星星!使用全新、开源免费且自托管的替代方案,部署应用程序的最佳工具(停止使用 Vercel)
Coolify的功能几乎与Vercel一样强大:你可以将GitHub仓库连接到它,几秒钟内就能设置好一切,从SSL证书到数据库备份都能管理,还提供一些分析工具。6. 安装和使用Coolify的步骤:安装Docker,克隆Coolify的GitHub代码,在服务器上运行,创建账户,添加项目和资源,部署网站。5. Coolify几乎与Vercel一样易用,支持多种语言,集成Git,管理SSL证书和数据库备份,还具有一些分析工具。来说还不错,但随着规模扩大,费用会迅速增加,特别是当你需要后端服务和数据库时。原创 2024-06-15 14:35:17 · 806 阅读 · 0 评论 -
AI Vs 作家?Groqbook: AI写书神器,使用 Groq 和 Llama3 几秒生成一本完整的书籍!
Llama3-70b,利用较大的模型生成书籍结构,使用较小的模型创建内容。** Groqbook ** 是一个基于 Streamlit 的应用程序,它可以通过一个简单的提示使用 Groq 上的 Llama3。要使用 Groqbook,你可以访问 groqbook.streamlit.app 上的托管版本。🌟Groqbook可以通过一个简单的提示使用 Groq 上的 Llama3 来生成书籍。它应该仅用于生成娱乐用途的书籍。生成的书籍内容不仅结构合理,语言也非常连贯,类似于人类作者撰写的非小说类书籍。原创 2024-06-15 14:34:22 · 1157 阅读 · 1 评论 -
你可以直接和数据库对话了!DB-GPT 用LLM定义数据库下一代交互方式,数据库领域的GPT、开启数据3.0 时代
🤖️ DB-GPT 是一个开源的AI原生数据应用开发框架。让围绕数据库构建大模型应用更简单,更方便。Hello,大家好。今天介绍DB-GPT,这是一个11.8k Star的开源项目,挺精彩的!DB-GPT目的是构建大模型领域的基础设施,通过开发多模型管理(SMMF)Text2SQL效果优化、RAG框架以及优化、框架协作、AWEL(智能体工作流编排)等多种技术能力,在开始介绍这个项目之前,首先我想提个问题:通用模型真的能解决所有问题吗?我们是否需要领域模型?展望未来,多模型之间将如何协作与交互呢。原创 2024-06-08 19:49:08 · 2405 阅读 · 0 评论 -
使用 Ollama 和 Open WebUI 自托管 LLM 聊天机器人(无需 GPU)
等,进一步支撑你的行动,以提升本文的帮助力。原创 2024-06-08 19:47:55 · 1918 阅读 · 0 评论 -
CopilotKit:开源 Copilot 框架,部署应用内 AI 代理,使用 Langchain 自动执行任何任务!
🌟 ** : **构建应用感知的AI聊天机器人,可以“看到”当前的应用状态并在应用内执行操作。AI聊天机器人可以与您的应用前端和后端以及第三方服务(如Salesforce、Dropbox等)进行对话,支持生成式UI。几秒钟内开始使用:🌟 ** : **任何的替代品,具有AI辅助文本生成功能。自动完成 + AI编辑 + 从头生成。基于用户数据和Copilot应用上下文。只需将textarea更改为。🌟为代理提供实时应用上下文,让代理在应用内执行操作。🌟。原创 2024-06-06 18:43:47 · 1159 阅读 · 0 评论 -
Verba:终极 RAG 引擎 - 语义搜索、嵌入、矢量搜索等!
Verba是一个完全可定制的个人助手,用于查询和与您的数据交互,无论是在本地还是通过云部署。解决文档中的问题,交叉引用多个数据点,或从现有知识库中获取见解。Verba结合了最先进的 RAG 技术与 Weaviate 的上下文感知数据库。根据您的个人使用情况,在不同的 RAG 框架、数据类型、分块与检索技术以及 LLM提供商之间进行选择。原创 2024-06-06 18:42:32 · 1074 阅读 · 0 评论 -
最新开源!Cover Agent 自动生成代码!开源的Copilot!
等,进一步支撑你的行动,以提升本文的帮助力。原创 2024-06-06 18:41:23 · 1246 阅读 · 0 评论 -
将网站转变为大模型训练数据的神器:自动化爬虫工具FireCrawl,两周斩获4K Star!
等,进一步支撑你的行动,以提升本文的帮助力。原创 2024-06-06 18:37:25 · 1479 阅读 · 0 评论 -
世界模型:我用AI智能体帮我填写简历表格并申请求职!(开源)
Hello,大家好啊,我是Aitrainee,今天想分享一个新开源的大型动作模型框架:LaVague。这是一个开源的大型 ** 操作模型 **我们希望构建一个数据集,供 AI 社区使用,以构建更好的大型操作模型,从而实现更好的 Web Agents。注意,这些示例使用我们的默认 OpenAI API 配置,您需要在本地环境中设置 OPENAI_API_KEY 变量,并提供有效的 API。要在 Google Colab 中查看 LaVague 的端到端示例,请参见我们的 快速浏览笔记本。原创 2024-06-06 18:34:00 · 892 阅读 · 0 评论 -
8.7k Star!Khoj:你的AI第二大脑、开源RAG Copilot、平替 MS Copilot与ChatGPT
关于自己托管部署的话,也就是自己安装khoj,你可以到这个链接(好处就是你不必使用官方的体验地址,因为那个免费的使用是受限的,付费才能体验更多的功能)除此以外,我们在网站设置页面可以看到它提供多种数据输入方式,比如你上传的本地文档以及notion中的数据,同时也支持切换不同的lm基础模型。:Obsidian 提供了丰富的插件支持,用户可以根据自己的需求安装和使用各种插件,扩展软件的功能。:用户可以在笔记之间创建双向链接,从而建立起一个类似于知识图谱的结构,方便信息的关联和检索。:您的个人数据保持本地状态。原创 2024-06-06 18:32:11 · 3401 阅读 · 0 评论 -
14.8k Star!CrewAI:部署一支由你指挥的人工智能代理大军,股票分析、发布帖子、支持Ollama!
等,进一步支撑你的行动,以提升本文的帮助力。原创 2024-06-06 18:30:47 · 1272 阅读 · 0 评论 -
Draw-A-UI:你的前端可以直接用笔画出来!通过绘画创建 Web 应用 | 感觉就像魔术一样(附教程)
🌟Draw-a-UI可以平替 OpenUI和v0。它用 AI 把转换成前端代码,支持很多框架,比如Tailwind、NextJS、React 和 Vue,还能把 Figma 文件变成 HTML。GitHub: https://github.com/SawyerHood/draw-a-ui 嘿,大家好!。这是一个改变 UI 开发游戏规则的神器!你可以用它轻松绘制线框,然后一键转换为 Tailwind 或 JavaScript代码。这是一个新的。原创 2024-06-06 18:24:43 · 984 阅读 · 0 评论 -
ChatTTS webUI & API:ChatTTS本地网页界面的高效文本转语音、同时支持API调用!
有API真的是帮大忙了,就可以随心操作了,往期文章在这里,话不多说,今天这个 ** ChatTTS-ui ** 也是一个开源项目。这是一个能让你在网页上直接使用ChatTTS进行语音合成的项目,还提供API接口供你调用,项目地址在 GitHub。项目绑定的扩展项目,通过调用 ChatTTS API 接口功能,使用 Streamlit 作为 Web 界面的前端库。🌟一个简单的本地网页界面,直接使用ChatTTS将文字合成为语音,同时支持对外提供API接口。亲爱的读者朋友们,你们好。原创 2024-06-06 18:23:36 · 3642 阅读 · 0 评论 -
SWE-Agent:普林斯顿大学开源,和Devin一样的软件工程师!
SWE-agent 的工作原理是通过设计简单的 LM-centric 命令和反馈格式,让大模型更容易浏览仓库、查看、编辑和执行代码文件。3. 确认问题后,它会一步步找到解决方案,查看代码,找到问题所在,修复问题,最后发出拉取请求。:当编辑命令发出时,我们会运行一个 linter,如果代码语法不正确,编辑命令不会通过。1. 当 SWE-agent 收到一个问题时,它会提出一个计划,比如首先复制所描述的错误。2. 它会创建一个新的文件来重现这个错误,然后运行代码看看能不能遇到同样的问题。原创 2024-06-06 18:21:39 · 751 阅读 · 0 评论 -
六位一线AI工程师总结Agent构建经验,天工SkyAgents的Agent构建实战。
🌟我们给人类新手明确的目标和具体的计划,而不是模糊的开放式指示,对Agent也应该这样做。最成功的Agent开发者可能也是工程师团队的管理者,因为给AI制定计划的过程和管理初级员工的方式类似。▲ 六位一线AI工程师分享自身总结,公开大模型应用一年心得我们给人类新手明确的目标和具体的计划,而不是模糊的开放式指示,对Agent也应该这样做,详细展开的话,总的来说有下面两点在任务中需要提供多样化的输出,比如根据用户之前购买过的产品推荐新产品时,仅仅通过提高模型的温度参数可能并不足够,甚至会带来一些问题。原创 2024-06-06 18:18:36 · 1269 阅读 · 0 评论 -
全球首创4090推理!昆仑万维开源Skywork-MoE模型:2千亿参数架构、训练与评估(技术浅析)
相较于EP对GPU数量的限制和ETP在千卡集群上的低效,EDP可以较好地解决大规模分布式训练MoE的并行痛点,同时EDP的设计简单、鲁棒、易扩展,可以较快地实现和验证。对于计算负载较高的模型,从头训练可能更有效;DeepSpeed为大规模模型提供了强大的优化支持,MoE架构通过专家模块提升了模型的处理能力,而Upcycling技术将二者结合,显著提高了模型的训练和推理效率。为了解决混合专家模型(MoE)训练困难和泛化性能差的问题,Skywork-MoE相较于Mixtral-MoE,设计了两种训练优化算法。原创 2024-06-06 18:17:06 · 1474 阅读 · 0 评论 -
10.6k Star!GPT Researcher:尖端AI搜索的深入研究者,告别偏见或破碎的信息、API集成进业务!
等,进一步支撑你的行动,以提升本文的帮助力。原创 2024-05-17 16:06:36 · 1125 阅读 · 0 评论 -
7.1k Star!RAGFlow:最新开源OCR+深度文档理解的RAG引擎、大海捞针测试、降低幻觉、服务化API集成进业务!
RAG,也就是检索增强生成,听上去可能有点科技感,但其实这个概念相当直观。它基本上就是通过一个巧妙的方法来让大型语言模型(LLM)生成更精准、更有用的回答。这个过程开始于一种特殊的数据库,我们可以称之为“垂直领域数据库”。当你向LLM提出一个问题时,RAG不是直接回答,而是先到这个数据库里去搜索与你的问题最相关的信息。这就好比你问了一个复杂的问题,RAG先跑去图书馆查资料。接下来的步骤是关键:RAG把这些检索到的信息整合成一个精细的提示模板。然后,这个模板和你的原始问题一起被送到LLM。原创 2024-05-11 09:55:45 · 4706 阅读 · 1 评论 -
26.8k Star!AI,现世丘比特:将微信聊天记录转化为情感洞察和年度报告
1. 获取手机号、微信昵称、wxid 这部分涉及到用户信息的提取,需要访问微信数据库中的用户表,并提取相应字段的数据。2. 解析微信聊天记录数据库 微信聊天记录通常存储在数据库中,包含了文本、图片、系统消息等多种类型的消息。解析这些记录需要访问消息表,并根据消息类型进行相应的解析和处理。3. 查看聊天记录 一旦解析了聊天记录数据库,就可以查看聊天记录了。这可能需要编写一个简单的界面或者命令行工具来实现。4. 按昵称、备注搜索某个好友 搜索好友需要访问联系人表,并根据昵称、备注等信息进行搜索。原创 2024-05-09 10:15:00 · 1583 阅读 · 0 评论 -
23.5k Star!OpenVoice:这款AI工具能够精准模仿你的声音并说出任何语言!
原创 Aitrainee | 公众号:AI进修生:AI算法工程师 / Prompt工程师 / ROS机器人开发者 | 分享AI动态与算法应用资讯,提升技术效率。🌟从一小段音频中复制声音并生成多种语言的语音。它不仅支持精准的音色克隆,还可以灵活控制语音风格,如情感和口音,确保声音输出自然流畅。原创 2024-05-08 09:00:00 · 708 阅读 · 0 评论 -
24.4k Star!Flowise :LLM开源低代码工具、可视化的LangChain实现、可定制AI Agent
Aitrainee | 公众号:AI进修生:AI算法工程师 / Prompt工程师 / ROS机器人开发者 | 分享AI动态与算法应用资讯,提升技术效率。🌟拖放 UI 以构建您的定制 LLM 流程:Flowise,一个用户友好的、无代码的平台,它简化了构建LangChain工作流的过程, 允许开 发人员创建LLM应用程序,而无需编写代码。F lowise的关键特性,包括拖放式UI、用户友好性和多功能性。**通过直观的拖放界面简化LangChain流程开发。原创 2024-05-08 08:30:00 · 2436 阅读 · 1 评论