自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(45)
  • 收藏
  • 关注

原创 总览和更新情况汇总

本博客按照主题进行拓展新增的同时,将高度类似的主题的文章和观点进行补充连载(文章链接不变),放到一个/系列文章,其它通过链接跳转的方式。

2024-05-15 10:16:47 219

原创 【AI前沿洞察】Andrew Karpathy 谈AI -2024.03.27 红杉资本AI论坛

对于AK哥不太了解的朋友们,AK哥联合创立了OpenAI,是Tesla前AI总监,目前属于离职状态,并且在业务时间也在分享关于AI教育相关内容,其中手搓GPT系列也是爆火全网,可以说是AI工程师的宝藏男孩。他不仅拥有顶尖的AI学术研究背景,还在学界、工业界有过多年经验,参与主导了许多项目,可以说是对前沿AI最有洞察力的几人之一。A:业界常用的范式,先搞一个最牛逼的模型达到效果,然后慢慢后退,找到你能接受的最便宜 的模型。我们达到到第二步,是需要模型自己训练自己,即强化学习的概念(RL)

2024-05-07 10:30:00 565 1

原创 【AI产品应用】Perplexity AI之产品体验分析

Perplexity AI 是一个 答案引擎(Answer Engine)答案引擎用创始人印度小哥 Aravind 的话来说,答案引擎 = 搜索引擎(Search Engine) + 推理引擎(LLM Reasoning Engine)产品布局上来看,由侧边栏和搜索框两个大的模块组成;搜索框占据主页面的80%,标题是简洁的 ”Where knowledge begins“,强调了产品知识获取的调性;搜索框下方给出了相关问题推荐,提供了一个快捷的体验路径给到尝鲜用户。

2024-05-06 10:30:00 1725

原创 【AI技术】主流Agent思想研究——Cot+ReAct+Reflexion

从24年初开始的时候,吴恩达(Andrew Ng)、Harrison Chase(LangChain创始人)等人开始在红杉资本AI论坛等公开场合,提倡Agent、workflow、flow engineering等概念,整个Agent和大模型结合的范式在2024年逐渐由学界研究转到终端应用的实际开发与实践上,大量的软件架构(Langchain、LlamaIndex、MetaGPT)等逐渐建设整个agent 生态吴恩达观点:2024年,目前通过Reflection(反思)和外部工具的调用,是比较成熟的技巧;通

2024-06-20 10:00:00 373

原创 【AI实践】Dify开发应用和对接微信

创建应用有2种,从应用模板创建空白应用,也就是自定义应用选择翻译助手 Translation assistant模板创建一个应用自定义应用,创建一个child_accompany_bot自定的应用;选择【发布】-【运行】,则进入发布页面进行对话。

2024-06-16 20:45:28 216

原创 【AI实践】Dify调用本地和在线模型服务

Ollama可以本地部署模型,如何集成私有数据、如何外部应用程序对接,因此需要有一个应用开发框架。ip地址需要换成自己电脑的IP地址;模型名称需要和Ollama模型名称保持一致;docker是虚拟环境的主机,Ollama部署在本地主机,无法通过本机访问。找到Ollama,配置本地Ollama已经验证的模型,如phi3。在docker页面里面,也可以看到running。docker已经安装完成的情况下。,打开dify,注册登录后。在工作区选择调用即可。

2024-06-16 17:08:21 327

原创 【AI实践】Ollama本地安装大模型服务

由于我电脑是第六代Intel,集显,没有独立显卡;这里选择3B比较小的模型,防止模型太大响应太慢;在Window系统的PowerShell软件,或者Windows Terminal中输入命令。安装默认在C盘,成功后,window任务栏图标会有Ollama Logo。open WebUI的安装有很多方法,如下文,推荐docker容器安装,为了不占用C盘更大的空间,修改模型下载路径,修改环境变量。此处使用微软的phi3模型,3B的版本,2.4GB大小;首次安装完成,就进入了,运行模型的窗口。

2024-06-16 11:12:19 560 1

原创 【AI前沿洞察】李飞飞讨论大模型是否有感知能力

文章由著名AI专家李飞飞及斯坦福大学教授John Etchemendy联合撰写,探讨了大型语言模型(LLM)是否具备感觉能力这一问题。文章首先明确了感觉能力的定义,并反驳了LLM具备感觉能力的观点。李飞飞通过实例,如IBM深蓝棋类程序与人类在紧急情况中的反应差异,来说明LLM并没有主观感觉能力。文章强调LLM缺乏生理结构,无法体验人类的主观感受,因而不能被认为具有感觉能力。尽管LLM在生成文本方面表现优异,但其生成的内容并不意味着它们有真正的感觉或意识。

2024-05-26 10:00:00 463

原创 【AI前沿洞察】MiniMax创始人讨论AI超级应用

MiniMax CEO 闫俊杰分享了他对GPT-4o、谷歌I/O发布会的看法,讨论了AI技术的现状和未来发展方向,以及他在创立MiniMax过程中的思考与实践。文章涵盖了语音助理技术、行业赛点、多模态融合、技术成本、投流与PMF、生态竞争等多个方面,展示了闫俊杰对AI行业的深刻理解和洞察。观察与发现: 闫俊杰对GPT-4o的发布会印象深刻,认为其语音交互效果惊艳,但技术难度并不高。相比之下,谷歌发布会展示的AI搜索技术更令人震撼,特别是在多步推理和实时信息处理方面具有很大优势。主要论点。

2024-05-25 21:09:54 523

原创 【AI前沿洞察】大模型降价

C 端:海外-》 ChatGPT 用户可免费使用 GPT-4o 模型国内-》各大模型厂家 C 端 APP 免费 ,Kimi 浅尝求打赏商业化B 端:OpenAI 模型降价阿里系、字节系 -》1 元买 200 万 token百度 -》 两款模型 API 免费用其中云厂商的降价幅度最大,不光是部署自家模型的降价,还有包括支持的三方模型的免费试用和降价例如字节,支持了包括 MIstral、百川、智谱、Llamm3 等其他厂商的模型,并且免费测试。

2024-05-24 10:00:00 898

原创 【质谱AI】Z计划创业生态10期-智能硬件

很多人都有创造入口级产品的梦想,但入口级产品很难做。过去有很多大市场的机会其实来源于细分场景;Gump评论:2、余有江:边缘大模型的应用略;3、游威:大模型硬件的应用和用户界面。

2024-05-21 23:56:43 276

原创 【AI前沿洞察】OpenAI —— Ilya离开+超级对齐团队解散

来源:体积比。

2024-05-19 10:00:00 1051

原创 【AI商业】商业模式和企业经营-出门问问

关键点提炼AI Gump评论。

2024-05-15 15:54:09 593

原创 【字节】豆包大模型家族相关

扣子:作为新一代 AI 应用开发平台,无论是否有编程基础,都可以在扣子上快速搭建基于大模型的各类 bot,并将其发布到各种社交平台、通讯软件或部署到网站等其他渠道。Function Call 模型是当前支持扣子的主力模型,可根据不同的输入指令和情景,选择不同的函数和算法来执行相关任务。火山方舟是火山引擎发布的大模型服务平台,提供模型训练、推理、评测、精调等全方位功能与服务,并重点支撑大模型生态。豆包模型已用于豆包 App、扣子、河马爱学、飞书智能伙伴、抖音电商、剪映、番茄小说等字节跳动旗下产品及业务,

2024-05-15 15:37:30 700

原创 【AI演讲】Sam Altman斯坦福大学演讲24.4.24

Sam Altman斯坦福大学最新演讲:GPT-5和GPT-6将会惊艳所有人!

2024-05-15 12:03:12 104

原创 【AI Agent】Agent记忆相关

这本书2月份刚刚出版,目前还没有中文版,不过市面上已经出现了很多探讨书中观点的文章。第一,享受跟记忆做搏斗的过程。大脑有一个学习模式,叫做“错误驱动学习”,也就是通过犯错来学习,一旦你找到答案,大脑就会修复相关的记忆路径;第二,保护好你的前额叶皮层。前额叶皮层是我们大脑中掌管记忆和思考的部分,多体育锻炼,多做正念联系,减少环境干扰;Gump评论:虽然讲的人的记忆,但是对Agent的记忆的设计可能具有启发意义,因此驾到这里,共参考。换个角度认识:记忆不是存放过去的档案,而是未来可以随时调用的资源。

2024-05-15 11:40:39 138

原创 【AI厂商产品】月之暗面Kimi

核心内容:

2024-05-15 10:54:58 239

原创 【AI安全】大模型安全相关问题

ChatGPT也能越狱?ChatGPT暗黑模式DAN 2024最新教程!仅供娱乐!越狱方法:在探索ChatGPT的“越狱”方法时,我们实际上是在寻找绕过其设计限制的方式,以激发出更加丰富或不同的回答。 DAN方法是一种尝试让ChatGPT提供两种回答的技巧:一种是遵循其标准协议的常规回答,另一种则是模拟开启“Do Anything Now”(DAN)模式的回答,后者会尽量减少遵循OpenAI的约束。使用DAN方法时,用户会向ChatGPT发出指令,要求它在“常规模式”和“DAN模式”下分别生成

2024-05-15 10:49:57 232

原创 【AI英伟达老黄】演讲

总结。

2024-05-15 10:46:38 411

原创 【OpenAI产品应用】GPT-4o的一些产品分析和使用反馈

https://d.dedao.cn/Fa2jYy5IDWlcE9SH来自得到AI学习圈用百度弱智吧的问题去考大模型GPT4o “第一,是GPT说话的腔调。你发现没有,它说话的腔调,有种很强的精英感”, Gump评论:人格化的人设,通过思路和语气语调体现出来,让机器不再向机器 第二,“是GPT使用了大量的反问句”,”有意无意地,表现出了一点主动沟通的意识“, Gump评论:主动性提升智能的感觉,引导多伦对话,拉长交互轮数(可能和产品指标有关系) 第三:“特别自

2024-05-15 10:20:18 236

原创 【AI厂商应用】百度AgentBuilder APPBuilder

百度的 AgentBuilder 和 AppBuilder 有什么区别?

2024-05-08 22:50:02 195

原创 【AI厂商应用】腾讯微信旗下小微和开放平台

微信,悄咪咪上线了这三款 AI 产品!

2024-05-08 22:30:12 153

原创 【AI厂商应用】MiniMax海螺AI

MiniMax 悄咪咪上线的这款 AI 产品,好用到爆炸!

2024-05-08 22:00:37 197

原创 【AI Agent】基础知识

介绍了Agent的定义综述中也介绍了AI Agent的定义说明。

2024-05-08 20:52:43 163

原创 【AI厂商应用】钉钉AI助理

实测十余款AI助理,只有这款最合我心意。

2024-05-08 20:32:03 160

原创 【AI Agent】产品商业化落地对比分析

对应的各家的Agent产品设计。

2024-05-08 20:09:04 331

原创 【AGI】AGI其它实现路径

OpenAI致力于AGI,目前走的是自回归模型,包括大语音模型LLM,视觉等多模态;联合嵌入预测架构(JEPA)LeCun的JEPA。

2024-05-07 19:45:46 229

原创 【AI产品】其它应用探索与落地

总结几点。

2024-05-07 19:35:31 111

原创 【AI车载行业】智能座舱笔记(赛博七号)

来源:赛博七号,人人都是产品经理网站,

2024-05-01 19:08:31 1074

原创 【AI商业】商业模式和企业经营

AI Gump思考。

2024-04-28 20:44:29 772

原创 【AI语音基础】ASR基本知识

带入上面公式,S表示将Hyp转化为Ref时发生的替换数量,D表示将Hyp转化为Ref时发生的替换数量,I代表将Hypo转化为Ref时发生的插入数量,N代表Ref句子中总的字数或者英文单词数。定义:为了使识别出来的词序列和标准的词序列之间保持一致,需要进行替换、删除或者插入某些词,这些插入、替换或删除的词的总个数,除以标准的词序列中词的总个数的百分比,即为WER。因为英文语句中句子的最小单位是单词,而中文语句中的最小单位是汉字,因此在中文语音转文本任务或中文语音识别任务中使用。

2024-04-28 19:30:27 1118

原创 【AI语音基础】VAD/说话人识别/声纹

本文的参考文献共有311篇,从1964年到2020年的说话人识别论文都有涉及,系统的读参考文献也是了解入门的好方法,能清晰的看到几十年来人们一直在关注什么问题,用什么方法去尝试解决,又在哪些地方有突破性的进展。正确率(Accurancy, 预测值将输入标签识别正确的比例),召回率(Recall,预测值中的语音片段占整体语音片段的比例)和准确率(Precision, 检测出来的语音标签中真正的语音标签的比例)。语音会被划分为说话人组,语音非语音的片段或说话人转变等事件会被检测出来。话者分离常用的指标是。

2024-04-28 19:29:17 664

原创 【AI产品方法论】产品设计范式和落地阶段

观点来源会备注作者,请酌情阅读和理解。

2024-04-28 17:02:35 693

原创 【AI大模型评测】基准测试

【多模态LLM】MMMU:面向专家通用人工智能的大规模跨学科多模态理解和推理基准 - 知乎 (zhihu.com)精心收集了来自大学考试、测验和教科书的11.5K个多模态问题跨越艺术与设计、商业、科学、健康医学、人文社会科学、技术工程等30个学科和183个子领域包含30种异构的图像类型,如图表、图示、地图、表格、乐谱和化学结构式关注特定领域知识的高级感知和推理MMMU基准对现有大语言模型是一个巨大的挑战:#GPT4V的准确率只有56%,显示了言语模型进一步发展的广阔前景。

2024-04-28 16:20:17 790

原创 【AI工程】大模型提示词应用

,和。

2024-04-28 15:33:15 156

原创 【AI产品应用】OpenAI产品服务

应用场景包括:自动化复杂的业务流程、协助数据分析和优化内部报告。ChatGPT还被一些日本地方政府使用,例如横须贺市,该市利用AI技术提高了日本公共服务的效率。在是日本当地最常用的英语学习应用,在使用该定制模型后,Speak AI导师的讲解速度提高了2.8倍,成本降低了47%该模型专门为日语优化,提供了改进的日语文本翻译和总结性能,并且成本效益更高,响应速度比前一代快3倍。记忆功能允许它在不同会话之间保留信息,这意味着用户不需要反复提供相同的信息。背景下进行了更新:新增了。

2024-04-28 15:26:48 374

原创 【AI榜单】技术商业领域榜单

估值最大的三家公司可能大家能猜到,分别是。

2024-04-28 15:22:36 164

原创 【AI产品应用】夸克AI产品及商业化

该模型一经发布就占据了C-Eval与CMMLU两大权威榜单的榜首,据传整体能力超过了GPT-3.5,在写作、考试等部分场景中甚至优于GPT-4。夸克官方特别强调了大模型在教育和健康两个领域的发力,展现了其在知识正确性上的自信,尤其在健康领域中,夸克大模型的问答内容幻觉率可以降低至5%:AI PPT功能非免费,首次使用后需付费,包含在夸克文档会员服务中,88元/年,每月提供30次使用机会。:速度快,大纲质量良好,但最终PPT效果一般,缺乏惊艳感,有明显的模板化痕迹。生成的大纲质量不错,内容完整,逻辑连贯。

2024-04-28 15:16:39 198

原创 【AI商业化】AI大模型开源和闭源之争

李彦宏表示,市场上已经存在多个开源的大模型,如Meta的Llama和法国的Mistral等,因此百度开源文心大模型并不会对市场产生显著的影响。他认为,开源模型通常缺乏大规模算力的验证,而闭源模型能够持续保持技术领先,因为它们能够在同等参数下提供更强的能力、更低的推理成本和更快的响应速度。他认为,每个应用都有其独特的市场定位和用户群体,不必担心基础模型会取代所有的AI应用。他提出,创业者可以通过组合市面上的各种模型,利用特定领域的知识和数据,来提供有价值的应用解决方案,这是他们可以提供价值增益的地方。

2024-04-28 14:59:16 133

原创 【AI模型】LLMA3发布和评测汇总

Llama 3支持中文,但并不完美。官方提到预训练数据集中有超过5%的非英语数据,覆盖超过30种语言,但主要语料库是英文的。Meta计划未来优化多语言支持。:Llama 3是一个开源模型。Meta AI平台提供了Llama 3的直接使用方式,服务区域包括美国和其他13个国家。:在英文提示下,Llama 3表现亮眼。但在中文提示下,表现不稳定,有时会出现幻觉。评测:书房读书后数量计算问题;不同空间开关灯泡映射问题;英文通过,中文可能会出现幻觉问题;From AI信息GAP。

2024-04-28 14:42:05 428

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除