自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

原创 Datawhale AI夏令营 使用机器学习方法入门时间序列预测

其中id为房屋id,dt为日标识,训练数据dt最小为11,不同id对应序列长度不同;type为房屋类型,通常而言不同类型的房屋整体消耗存在比较大的差异;target为实际电力消耗,也是我们的本次比赛的预测目标。

2024-07-17 23:30:49 861

原创 LLM应用开发第六课 个人知识库

在对知识库文本进行分割和向量化后,就需要定义一个向量数据库用来存放文档片段和对应的向量表示了,在向量数据库中,数据被表示为向量形式,每个向量代表一个数据项。项目利用Langchain中的文本切割器完成知识库向量化操作前的文本分割,向量数据库使用高效的索引和查询算法来加速向量数据的存储和检索过程,快速的完成个人知识库数据建立与使用。:项目展示了 RAG 技术在解决 Langchain 幻觉问题方面的优势,通过结合检索和生成的方式,提高了信息的准确性和可靠性,为智能信息管理领域的技术创新提供了新的思路。

2024-06-30 22:54:43 1212

原创 大模型应用评估 第五课

我们也可以考虑构建倒排索引,即针对知识库的每一个知识片段,构建一个能够表征该片段内容但和 query 的相对相关性更准确的索引,在检索时匹配索引和 query 的相关性而不是全文,从而提高匹配关系的准确性。这样的思路其实就是目前大火的 Agent 机制的雏形,即针对用户指令,设置一个 LLM(即 Agent)来理解指令,判断指令需要执行什么工具,再针对性调用需要执行的工具,其中每一个工具可以是基于不同 Prompt Engineering 的 LLM,也可以是例如数据库、API 等。① 知识查找正确性。

2024-06-28 17:52:50 921 1

原创 大模型应用开发第三课 --Embeddings

词向量(Embeddings)将非结构化数据,如单词、句子或者整个文档,转化为实数向量的技术。这些实数向量可以被计算机更好地理解和处理。从response这行开始,将输入的文本的text封装成Embeddings。

2024-06-24 22:53:18 682

原创 使用LLM API开发应用 DataWhale第二课

即通过调用LLM提供的接口开发应用,数据传递给LLM,结果返回调用方。

2024-06-20 18:04:19 147

原创 大模型应用开发 --1/6

为解决大模型的幻觉和知识滞后的问题,使用检索增强生成(RAG, Retrieval-Augmented Genera)整合了从自己准备的知识库中检索到的相关信息,指导大型语言模型生成更为精准的答案。能使计算机更好地理解使用语言,使人类和计算机的互动方式更加自然简单,拓宽了人类接触信息的形式和范式。4. **大模型**:GPT、讯飞星火、文心一言、GLM 等。5. **前后端**:Gradio 和 Streamlit。2. **Embedding 模型**:GPT、智谱。3. **数据库**:Chroma。

2024-06-19 19:21:33 230

原创 基于时间序列预测算法的嵌入表示

注册为模块的缓冲区,这意味着它不会作为模型参数被更新,但会作为模型的一部分保存和加载。,并将其设置为不需要梯度计算,因为位置编码是固定的,不需要在训练过程中更新。Autoformer中的嵌入表示代码:共包含值嵌入、位置嵌入和时间维度嵌入。,并将其设置为不需要梯度计算,因为固定嵌入在训练过程中不会更新。,它是用于位置编码的周期性变化因子,通过指数运算得到。确保返回的嵌入在计算图中是独立的,不会反向传播梯度。,卷积核大小为 3。,然后将其权重设置为之前计算的固定嵌入矩阵。其类似位置嵌入,但是编码固定,不更新。

2024-06-12 23:33:00 269

原创 在Github上创建项目 并关联本地文件夹教程

在github上的操作#:访问并登录账号:登录后,在页面的右上角点击 "+" 图标,然后选择 "New repository"**点击“Create repository”**完成创建。

2024-06-11 23:02:57 374

原创 链表和树结构分析和基本操作

链表和树这两中数据结构,不同于数组这种可以直接按索引访问的数据结构。链表和树通过每个基本单元内的指针,储存下一节点的位置。

2024-04-08 22:57:03 180 1

原创 二分查找总结

二分查找

2024-04-07 20:09:34 119

原创 数据结构和算法梳理

基础需要掌握算法的读取和输出,最好掌握两种语言,我是学的C++和python。

2024-04-06 16:27:12 922

原创 书生浦语实战营第二课 部署InterLM2

使用A100快速部署大模型,使用HuggingFace下载文件

2024-04-04 21:48:43 467

原创 书生浦语大模型 第一节课笔记

陈恺老师介绍了书生·浦语大模型的全链路开源体系,首先老师介绍了通用人工智能的发展趋势,NLP领域从特定任务模型向通用大模型的转变。老师还介绍了Interlm2的提升,包括支持多模态、8K语境和不同尺寸的模型,更好地提升语言建模能力、对话交互和智能体框架方面的能力。

2024-03-31 19:59:35 311

原创 书生浦语模型介绍

支持增量续训,加入某个垂类领域知识,能保持很好的原生通用能力,这点非常赞。轻量化接口非常好,LMDeploy性能领先,每秒可生成2k+的tokens,支持模型轻量化、量化和推理服务,与评测工具无缝对接。- Interlm2介绍:采用了新的数据清理过滤技术,高质量语料和有针对的数据补全提升了模型性能,模型使用更少数据也能达到上一代效果,整体性能增强。老师还介绍了Interlm2的提升,包括支持多模态、8K语境和不同尺寸的模型,更好地提升语言建模能力、对话交互和智能体框架方面的能力。

2024-03-31 19:55:03 179

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除