- 博客(5)
- 收藏
- 关注
原创 基于大语言模型的智能体入门
该转换器不仅考虑原始输入,还会结合检索到的文档,以确保生成的响应精确且有意义,最终的响应是检索到的信息和模型自身生成能力的组合。:检索模型接收输入(如查询或提示)后,使用检索系统在广泛的文档数据库中搜索与输入最相关的文档,运用各种技术(如 tf-idf、bm25 或密集检索器等神经方法)来排序和选择最相关的信息,然后将选定的信息传递给生成模型。1.定义:Prompt 工程指的是精心设计输入给模型的提示 (Prompt),以引导模型生成更准确、有用和符合期望的输出。
2024-08-14 12:04:18 515
原创 大型语言模型(LLM)
例如,GPT-3 凭借其巨大的规模和出色的表现,在文本生成、问答、翻译等多个领域展现出了令人瞩目的成果,引发了广泛的关注和研究。4.预训练语言模型阶段:2018 年左右,以 OpenAI 的 GPT 系列和 Google 的 BERT 为代表的预训练语言模型取得了重大突破。例如,GPT-4 等模型具有数万亿的参数,能够处理更加复杂的任务,生成更加准确和自然的语言。1.大语言模型是一种基于深度学习技术的自然语言处理模型,通过利用海量的文本数据进行训练,从而学习到语言的语法规则、语义理解、上下文关系等知识。
2024-08-08 18:00:45 917
原创 阿里云天池
当各指标相差很大时,如果直接使用原始指标值计算综合指标,就会突出数值较大的指标在分析中的作用、削弱数值较小的指标在分析中的作用。2.One-Hot 编码每个唯一的分类值都被赋予一个唯一的二进制向量,也被称为“独热”向量,因为在这个向量中, 只有一个位置的元素是1(表示该类别的存在),其余所有位置的元素都是0。(3)学习率的选择和调整是一个不断尝试和优化的过程,需要结合具体的数据集、模型架构和训练目标来确定最适合的学习率策略。在正区间,ReLU 的导数为 1,有助于梯度在网络中的传播,从而使训练更容易收敛。
2024-07-28 21:57:08 756
原创 Pandas入门
Pandas 是 Python 的核心数据分析支持库,提供了快速、灵活、明确的数据结构,旨在简单、直观地处理关系型、标记型数据。3. 查看数据的描述性统计信息:df.describe()df.dropna() # 删除包含缺失值的行。2. 查看数据的基本信息:df.info()(5) 25% : 样本数据25%的时候的值。(6) 50% : 样本数据50%的时候的值。(7) 75% : 样本数据75%的时候的值。(2) mean : 样本数据的平均值。(3) std : 样本数据的标准差。
2024-07-22 17:45:11 288
原创 Python基础学习
7. 文件错误(FileNotFoundError、IOError):尝试打开不存在的文件或其他输入/输出操作失败时产生,在较新的 Python 版本中,更具体的文件不存在的错误通常会被归类为 FileNotFoundError,而其他一些与文件操作相关的错误可能仍然会引发 IOError;5. 列表(list):是一个有序的可变序列,可以包含不同类型的元素,用方括号 [] 表示,例如 [1, 2, 3] 、['a', 'b', 'c']。变量不需要事先声明类型,直接赋值即可创建。
2024-07-17 16:30:07 830 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人