- 博客(9)
- 收藏
- 关注
原创 如何用 DPO 训练 LLM,提升 RLHF 效果?
DPO(Direct Preference Optimization)是 RLHF(强化学习人类反馈)的一种优化策略,可提高 LLM 训练效率。
2025-02-20 17:09:21
269
原创 如何使用 AWS Nitro Enclaves 保护 AI 推理数据安全?
AWS Nitro Enclaves 提供了独立的计算环境,确保 AI 任务的数据隐私性和安全性。
2025-02-20 17:06:19
520
原创 如何使用 RAG+Agent 提高 AI 生成结果的准确性?
RAG(Retrieval-Augmented Generation)+ AI Agent 能显著提高 AI 生成内容的准确度和专业性。
2025-02-20 17:05:45
326
原创 TensorFlow
2. **计算图(computational graph)**:TensorFlow 使用计算图来表示机器学习模型,计算图是由一系列节点(表示计算操作)和边(表示数据流)构成的有向图。1. **张量(tensor)**:在 TensorFlow 中,数据以张量的形式表示,张量可以是标量(0 维张量)、向量(1 维张量)、矩阵(2 维张量)或更高维度的数组。- **自然语言处理**:使用循环神经网络(RNN)或 Transformer 模型进行文本生成、机器翻译等任务。
2025-02-19 23:52:05
190
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅