自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

转载 AI大模型应用开发入门-LangChain开发聊天机器人ChatBot

我们定义对话状态,并用 LangChain 的})这只是 LangGraph 的一个入门示例,但它的潜力远不止如此。你可以:添加更多节点(如知识检索、函数调用、代码执行等)与前端(如 Gradio / Streamlit)结合打造完整应用利用数据库管理多用户会话历史原创作者: chenyishi转载于: https://www.cnblogs.com/chenyishi/p/189251122.AI大模型应用开发入门-LangChain开发Agent06-13。

2025-07-04 07:57:19 40

转载 DeepSeek R1再进化:这次更新让它直接对标Claude 4

有网友测试了一个经典的空间推理问题:"一个长八米的细长棍子,能否通过宽三米高四米的门",结果发现只有o3和新的DeepSeek-R1答对了,其他诸如claude-opus-4、gemini2.5-pro等模型都没能正确回答[19]。从最初的R1震惊全球,到现在的持续优化,DeepSeek正在用实际行动证明,中国的AI技术不仅能够达到国际先进水平,还能够在开源的前提下实现商业化成功。更重要的是,有网友测试新版R1的风格,发现几乎和OpenAI的o3差不多[1][6]。社区测试中最令人震惊的是编程能力的提升。

2025-06-08 06:17:28 37

转载 解密prompt系列25. RLHF改良方案之样本标注:RLAIF & SALMON

前言上一章我们主要唠了RLHF训练相关的方案,这一章我们主要针对RLHF的样本构建阶段,引入机器标注来降低人工标注的成本。主要介绍两个方案:RLAIF,和IBM的SALMON。RLAIFRLAIF: Scaling Reinforcement Learning from Human Feedback with AI Fee...

2024-08-09 02:38:49 114

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除