不为人知的刘看山-CSDN博客

转载 AI大模型应用开发入门-LangChain开发聊天机器人ChatBot

我们定义对话状态，并用 LangChain 的})这只是 LangGraph 的一个入门示例，但它的潜力远不止如此。你可以：添加更多节点（如知识检索、函数调用、代码执行等）与前端（如 Gradio / Streamlit）结合打造完整应用利用数据库管理多用户会话历史原创作者: chenyishi转载于: https://www.cnblogs.com/chenyishi/p/189251122.AI大模型应用开发入门-LangChain开发Agent06-13。

2025-07-04 07:57:19 40

转载 DeepSeek R1再进化：这次更新让它直接对标Claude 4

有网友测试了一个经典的空间推理问题："一个长八米的细长棍子，能否通过宽三米高四米的门"，结果发现只有o3和新的DeepSeek-R1答对了，其他诸如claude-opus-4、gemini2.5-pro等模型都没能正确回答[19]。从最初的R1震惊全球，到现在的持续优化，DeepSeek正在用实际行动证明，中国的AI技术不仅能够达到国际先进水平，还能够在开源的前提下实现商业化成功。更重要的是，有网友测试新版R1的风格，发现几乎和OpenAI的o3差不多[1][6]。社区测试中最令人震惊的是编程能力的提升。

2025-06-08 06:17:28 37

转载解密prompt系列25. RLHF改良方案之样本标注：RLAIF & SALMON

前言上一章我们主要唠了RLHF训练相关的方案，这一章我们主要针对RLHF的样本构建阶段，引入机器标注来降低人工标注的成本。主要介绍两个方案：RLAIF,和IBM的SALMON。RLAIFRLAIF: Scaling Reinforcement Learning from Human Feedback with AI Fee...

2024-08-09 02:38:49 114

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

转载 AI大模型应用开发入门-LangChain开发聊天机器人ChatBot

转载 DeepSeek R1再进化：这次更新让它直接对标Claude 4

转载 解密prompt系列25. RLHF改良方案之样本标注：RLAIF & SALMON

空空如也

空空如也

转载解密prompt系列25. RLHF改良方案之样本标注：RLAIF & SALMON