- 博客(3)
- 收藏
- 关注
转载 AI大模型应用开发入门-LangChain开发聊天机器人ChatBot
我们定义对话状态,并用 LangChain 的})这只是 LangGraph 的一个入门示例,但它的潜力远不止如此。你可以:添加更多节点(如知识检索、函数调用、代码执行等)与前端(如 Gradio / Streamlit)结合打造完整应用利用数据库管理多用户会话历史原创作者: chenyishi转载于: https://www.cnblogs.com/chenyishi/p/189251122.AI大模型应用开发入门-LangChain开发Agent06-13。
2025-07-04 07:57:19
40
转载 DeepSeek R1再进化:这次更新让它直接对标Claude 4
有网友测试了一个经典的空间推理问题:"一个长八米的细长棍子,能否通过宽三米高四米的门",结果发现只有o3和新的DeepSeek-R1答对了,其他诸如claude-opus-4、gemini2.5-pro等模型都没能正确回答[19]。从最初的R1震惊全球,到现在的持续优化,DeepSeek正在用实际行动证明,中国的AI技术不仅能够达到国际先进水平,还能够在开源的前提下实现商业化成功。更重要的是,有网友测试新版R1的风格,发现几乎和OpenAI的o3差不多[1][6]。社区测试中最令人震惊的是编程能力的提升。
2025-06-08 06:17:28
37
转载 解密prompt系列25. RLHF改良方案之样本标注:RLAIF & SALMON
前言上一章我们主要唠了RLHF训练相关的方案,这一章我们主要针对RLHF的样本构建阶段,引入机器标注来降低人工标注的成本。主要介绍两个方案:RLAIF,和IBM的SALMON。RLAIFRLAIF: Scaling Reinforcement Learning from Human Feedback with AI Fee...
2024-08-09 02:38:49
114
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅