- 博客(10)
- 收藏
- 关注
原创 第二章 生成式大语言模型基础
本文介绍了生成式大语言模型的基础实践应用。首先展示了如何下载和加载开源模型Qwen2.5-Insturct,包括环境检查、模型加载和参数查看。接着演示了文字续写任务的基本实现方法,通过pipeline接口生成连贯文本。最后讲解了生成过程的干预技术,包括通过调节温度值(temperature)、Top-k采样、Top-p采样等参数来控制生成文本的严谨性或创造性。文章提供了完整的Python代码示例,涵盖了从模型加载到文本生成的全流程,适合初学者快速上手大语言模型的基本应用。
2026-02-15 21:04:43
231
原创 huggingface下载模型
本文介绍了使用国内镜像网站hf-mirror.com下载Hugging Face模型的方法。由于访问限制,建议使用镜像站点。教程包含:1)安装huggingface_hub包;2)设置环境变量指向镜像网站;3)使用hf download命令下载指定模型(以Qwen2.5-0.5B-Instruct为例)。该方法适用于在Anaconda虚拟环境中操作,能有效解决国内用户下载Hugging Face资源的问题。
2026-02-14 12:47:18
227
原创 大模型算法第一章
本文介绍了自然语言处理(NLP)的基本概念与应用。NLP包含自然语言理解(NLU)和自然语言生成(NLG)两大能力,分为词法、句法、语义和语用四个分析层次。NLP的主要任务包括文本分类、命名实体识别、关系抽取、机器翻译、文本摘要、问答系统、文本生成和对话系统等。这些任务构成从基础文本理解到高级交互生成的完整生态。学习NLP可提升AI对语言的理解与执行能力。文章最后提供了相关环境搭建的参考链接。
2026-02-09 22:17:32
378
原创 pytorch基础知识(一)
张量是多维数组的推广,可以看作是一种多维数据结构,用于表示在不同坐标系下变换时遵循特定规则的数学对象。张量维度 代表含义0维张量 数字1维张量 向量2维张量 矩阵高阶张量 时间序列数据、单张彩色图片、视频数据一些存储在各种类型张量的公用数据集类型:3维 = 时间序列;4维 = 图像;5维 = 视频。但是,在机器学习工作中,我们经常要处理不止一张图片或一篇文档——我们要处理一个集合。
2025-08-15 20:19:07
630
原创 指针与常量
指针值和指针指向的值都是常量,无法赋值。指向常量的指针,指针解引用后无法赋值。指针值时一个常量,指针无法被赋值。):指向某个变量的地址。
2025-08-04 16:48:23
253
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅