7月22日场
中心化大模型:指的是以chatgpt为代表的,闭源靠API收益的大模型。
去中心化大模型:指的是以llama、百川为代表的,开源的、可以独立部署的大模型。
张鹏
①大模型不是中心化的操作系统,更像是计算机。未来每个个体都可能拥有不止一个大模型。中心化大模型长期看,价值只占20%。
②行业中心化大模型很可能是个伪命题。企业不会愿意把自己的knowhow分享出去,而是更倾向于通过闭源大模型增强本公司的竞争力。
③有三种创新:放首创新、进攻创新、革命创新。对于C端强粘性的公司,并不急于发大模型,到时候只要在他自己的产品里加上大模型功能,就够了。比如说字节和腾讯。
④我们正处在一个类似于2007年iPhone发布的关键时刻,当时只有少数人能够看到iPhone和苹果的巨大潜力。移动互联网公司于2011年开始爆发,之间间隔了四年。从新技术到新时代爆发的时间间隔只会越来越短。
⑤创新最有价值的部分往往源于非共识。
王小川
①未来世界,80%大模型是开源的,闭源只占20%,类似于苹果和安卓。
②百川模型在中文领域的评测得分,远超英文模型。
③llama2的9个技术创新点,6个百川已经在做,2个带来新的启发。
④百川模型完全自研,由于效果之好,曾让投资人误以为是llama套壳。
⑤大模型非常依赖高质量的数据,低质量的数据会把大模型学傻。
⑥搜索技术在提取高质量数据、模型训练、实验迭代等方面有很大的优势。
⑦投入大规模模型训练的成本极高,如果没有实质性的应用,这种投入可能导致投资崩盘。到GPT4为止,还没有出现基于大模型的超级应用。
⑧OpenAI的数据飞轮已经被证伪。真正的核心在于优质数据的制备和配比。llama的数据就是精而少。数据配比这件事,在openai内部已经科学化了。
7月23日场
周鸿祎
①未来不会只有几个大模型搞垄断,大模型将无处不在。
②开源带来科技平权。
③大模型走进千家万户,才能引发工业革命。类比于最早的计算机到个人计算机的过程。
④80%的机会在企业市场。
很多企业对大模型神往,但顾虑。希望能让大模型根据自己的业务做结合,但是又不希望数据外泄。
⑤企业市场使用大模型的7大痛点:
痛点1:问他什么都会,但是认知比较浅。
痛点2:不懂企业,没有企业内部的知识。
企业内部有knowhow,肯定不愿意训练到公有大模型里。
美国是公有云的天下。中国对服务器放在哪儿是非常在意的。
痛点3:数据隐患问题。
痛点4:知识模糊、幻觉问题。内容不可信
痛点5:知识更新不及时的问题。
痛点6:费用高昂。
痛点7:对大模型数据所有权非常在意。安全性无比重要。
比如中石化的数据不能给中石油。
⑥垂直大模型是金光大道,用一根针捅破市场。
⑦大模型最常用的功能还是知识问答和内容创作。
先把这两个功能找到最细化的垂直场景去应用。
⑧四大最好落地的需求类型:上下内外
上:信息决策、舆情分析
下:企业知识搜索、新员工培训
内:办公协作、办公生成
外:智能客服
这些场景企业客户比较能接受,也比较快能落地。
⑨LUI、CUI(ChatUI)、GUI
LUI还是面向爱好者的,门槛还是比较高的。大部分用户不会研究提示词到这个程度。
CUI,把一些功能定义为数字人、数字员工、数字顾问、数字专家。当人面对一个聊天界面的时候,想提示词是很难的。但是面对的是一个法律专家的时候,他绝对不会问一些法律无关的问题。
GUI,传统的界面还是会存在的。仍会并行。
monica(肖弘)&即时设计(李国锐)
①GPT是大脑,应用是数据。应用的价值就在于获取大脑没有的数据。直接套壳的产品意义不大。
②浏览器插件就是一个非常好的获取GPT没有数据的形态。
③浏览器插件可以更快加速AI技术普及。有很多网站还没有进行AI升级,但是通过浏览器插件就可以用到AI能力。
④monica现在有150万用户。
⑤用户最多还是使用搜索、问答功能。
⑥因此,下一步做很多不同的机器人,去承接不同领域的问答。
⑦即时设计使得之前无法生成前端页面的甲方能生成初稿,提升了设计师公司的沟通效率。降低了甲方公司的设计成本。
傅盛
①互联网上的知识,只是全部知识的很小一部分,真正的、落地的知识都在各个公司中。是互联网上没有的。
②开源是一座金矿。比如llama2和百川智能。
③知识库也不是那么好做的,要抓住细节,魔鬼藏在细节中。
④prompt非常重要。
⑤现在是过去的未来,现在不是未来的过去。