【AI技术】GPT-4o背后的语音技术猜想 本篇文章全文credit 给到 台大的李宏毅老师,李宏毅老师在机器学习上风趣幽默、深入浅出的讲解,是全宇宙学AI、讲中文学生的福音,强力推荐李宏毅老师的机器学习课程和深度学习 人工智能导论;原视频在油管,这里只能放一个B站的链接,本文中使用的所有素材和知识来自于李宏毅老师,以文字+截图的形式展现,方便大家快速阅读欢迎大家有能力多多支持李宏毅:GPT-4o背後可能的語音技術猜測。
【AI技术】主流Agent思想研究——Cot+ReAct+Reflexion 从24年初开始的时候,吴恩达(Andrew Ng)、Harrison Chase(LangChain创始人)等人开始在红杉资本AI论坛等公开场合,提倡Agent、workflow、flow engineering等概念,整个Agent和大模型结合的范式在2024年逐渐由学界研究转到终端应用的实际开发与实践上,大量的软件架构(Langchain、LlamaIndex、MetaGPT)等逐渐建设整个agent 生态吴恩达观点:2024年,目前通过Reflection(反思)和外部工具的调用,是比较成熟的技巧;通
【AI实践】Dify开发应用和对接微信 创建应用有2种,从应用模板创建空白应用,也就是自定义应用选择翻译助手 Translation assistant模板创建一个应用自定义应用,创建一个child_accompany_bot自定的应用;选择【发布】-【运行】,则进入发布页面进行对话。
【AI实践】Dify调用本地和在线模型服务 Ollama可以本地部署模型,如何集成私有数据、如何外部应用程序对接,因此需要有一个应用开发框架。ip地址需要换成自己电脑的IP地址;模型名称需要和Ollama模型名称保持一致;docker是虚拟环境的主机,Ollama部署在本地主机,无法通过本机访问。找到Ollama,配置本地Ollama已经验证的模型,如phi3。在docker页面里面,也可以看到running。docker已经安装完成的情况下。,打开dify,注册登录后。在工作区选择调用即可。
【AI实践】Ollama本地安装大模型服务 由于我电脑是第六代Intel,集显,没有独立显卡;这里选择3B比较小的模型,防止模型太大响应太慢;在Window系统的PowerShell软件,或者Windows Terminal中输入命令。安装默认在C盘,成功后,window任务栏图标会有Ollama Logo。open WebUI的安装有很多方法,如下文,推荐docker容器安装,为了不占用C盘更大的空间,修改模型下载路径,修改环境变量。此处使用微软的phi3模型,3B的版本,2.4GB大小;首次安装完成,就进入了,运行模型的窗口。
【AI前沿洞察】李飞飞讨论大模型是否有感知能力 文章由著名AI专家李飞飞及斯坦福大学教授John Etchemendy联合撰写,探讨了大型语言模型(LLM)是否具备感觉能力这一问题。文章首先明确了感觉能力的定义,并反驳了LLM具备感觉能力的观点。李飞飞通过实例,如IBM深蓝棋类程序与人类在紧急情况中的反应差异,来说明LLM并没有主观感觉能力。文章强调LLM缺乏生理结构,无法体验人类的主观感受,因而不能被认为具有感觉能力。尽管LLM在生成文本方面表现优异,但其生成的内容并不意味着它们有真正的感觉或意识。
【AI前沿洞察】MiniMax创始人讨论AI超级应用 MiniMax CEO 闫俊杰分享了他对GPT-4o、谷歌I/O发布会的看法,讨论了AI技术的现状和未来发展方向,以及他在创立MiniMax过程中的思考与实践。文章涵盖了语音助理技术、行业赛点、多模态融合、技术成本、投流与PMF、生态竞争等多个方面,展示了闫俊杰对AI行业的深刻理解和洞察。观察与发现: 闫俊杰对GPT-4o的发布会印象深刻,认为其语音交互效果惊艳,但技术难度并不高。相比之下,谷歌发布会展示的AI搜索技术更令人震撼,特别是在多步推理和实时信息处理方面具有很大优势。主要论点。
【AI前沿洞察】大模型降价 C 端:海外-》 ChatGPT 用户可免费使用 GPT-4o 模型国内-》各大模型厂家 C 端 APP 免费 ,Kimi 浅尝求打赏商业化B 端:OpenAI 模型降价阿里系、字节系 -》1 元买 200 万 token百度 -》 两款模型 API 免费用其中云厂商的降价幅度最大,不光是部署自家模型的降价,还有包括支持的三方模型的免费试用和降价例如字节,支持了包括 MIstral、百川、智谱、Llamm3 等其他厂商的模型,并且免费测试。
【质谱AI】Z计划创业生态10期-智能硬件 很多人都有创造入口级产品的梦想,但入口级产品很难做。过去有很多大市场的机会其实来源于细分场景;Gump评论:2、余有江:边缘大模型的应用略;3、游威:大模型硬件的应用和用户界面。
【字节】豆包大模型家族相关 扣子:作为新一代 AI 应用开发平台,无论是否有编程基础,都可以在扣子上快速搭建基于大模型的各类 bot,并将其发布到各种社交平台、通讯软件或部署到网站等其他渠道。Function Call 模型是当前支持扣子的主力模型,可根据不同的输入指令和情景,选择不同的函数和算法来执行相关任务。火山方舟是火山引擎发布的大模型服务平台,提供模型训练、推理、评测、精调等全方位功能与服务,并重点支撑大模型生态。豆包模型已用于豆包 App、扣子、河马爱学、飞书智能伙伴、抖音电商、剪映、番茄小说等字节跳动旗下产品及业务,
【AI Agent】Agent记忆相关 这本书2月份刚刚出版,目前还没有中文版,不过市面上已经出现了很多探讨书中观点的文章。第一,享受跟记忆做搏斗的过程。大脑有一个学习模式,叫做“错误驱动学习”,也就是通过犯错来学习,一旦你找到答案,大脑就会修复相关的记忆路径;第二,保护好你的前额叶皮层。前额叶皮层是我们大脑中掌管记忆和思考的部分,多体育锻炼,多做正念联系,减少环境干扰;Gump评论:虽然讲的人的记忆,但是对Agent的记忆的设计可能具有启发意义,因此驾到这里,共参考。换个角度认识:记忆不是存放过去的档案,而是未来可以随时调用的资源。
【AI安全】大模型安全相关问题 ChatGPT也能越狱?ChatGPT暗黑模式DAN 2024最新教程!仅供娱乐!越狱方法:在探索ChatGPT的“越狱”方法时,我们实际上是在寻找绕过其设计限制的方式,以激发出更加丰富或不同的回答。 DAN方法是一种尝试让ChatGPT提供两种回答的技巧:一种是遵循其标准协议的常规回答,另一种则是模拟开启“Do Anything Now”(DAN)模式的回答,后者会尽量减少遵循OpenAI的约束。使用DAN方法时,用户会向ChatGPT发出指令,要求它在“常规模式”和“DAN模式”下分别生成
【OpenAI产品应用】GPT-4o的一些产品分析和使用反馈 https://d.dedao.cn/Fa2jYy5IDWlcE9SH来自得到AI学习圈用百度弱智吧的问题去考大模型GPT4o “第一,是GPT说话的腔调。你发现没有,它说话的腔调,有种很强的精英感”, Gump评论:人格化的人设,通过思路和语气语调体现出来,让机器不再向机器 第二,“是GPT使用了大量的反问句”,”有意无意地,表现出了一点主动沟通的意识“, Gump评论:主动性提升智能的感觉,引导多伦对话,拉长交互轮数(可能和产品指标有关系) 第三:“特别自