自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 资源 (1)
  • 收藏
  • 关注

原创 LLaMA-Factory在华为显卡上的实验记录

如何判断目前所选择的模型是否支持在项目的这个地址中会有不同模型的支持模版。这里用目前我最常用的两个模型举例子 一个是智谱的glm4-9B模型这段代码看起来是在定义一个模板(template)的注册过程,可能是在某个框架或者系统中使用。这是一个函数或者方法,用来注册一个名为"glm4"的模板。

2024-07-09 18:00:12 1111

原创 在某公司被毙掉的生成式文本大模型解决方案到底哪里有问题

智能客服系统方案项目概述负责设计和实现一个智能客服系统,专为民航客服中心量身打造。系统利用大模型技术,结合预训练、微调和强化反馈机制,提升客户服务质量和用户满意度。系统包含用户解读、意图识别、对话管理、情感分析等多个核心单元,整合客服手册和业务百科,实现24/7全天候高效服务。智能客服系统整体方案:核心交互单元:用户解读单元:分析用户特征、预测意图多模态处理单元:处理文本、语音、图像输入意图识别单元:识别用户当前查询的意图对话管理单元:管理多轮对话上下文知识图谱交互单元:提取结构化知

2024-07-09 14:19:09 677

原创 大模型业务系统

OCR单元 → 富文档解析单元 → 文本分类单元 → 实体识别单元 → 知识图谱交互单元 → 数据库交互单元。意图识别单元 → 用户解读单元 → 对话管理单元 → 知识图谱交互单元 → 情感分析单元 → 回复生成。数据库交互单元 → 计算单元 → 推理单元 → 数据可视化单元 → 富文档解析单元 → 文档生成。数据库交互单元 → 用户解读单元 → 计算单元 → 推理单元 → 任务规划单元 → 可视化单元。用户解读单元 → 知识图谱交互单元 → 学习进度分析单元 → 内容推荐单元 → 交互式学习单元。

2024-07-03 15:54:36 278

原创 探索 Dify:开源 LLM 应用开发平台

在快速发展的 AI 和机器学习领域,开发人员不断寻求高效的工具,以无缝地从原型过渡到生产。Dify 正是在这样的背景下应运而生的。这是一个开源平台,专为大语言模型(LLM)应用开发设计。凭借其直观的界面、全面的功能和强大的后端支持,Dify 将彻底改变开发人员创建和部署 AI 应用程序的方式。

2024-07-02 10:12:11 1000

原创 面向大模型智能客服场景的多源、多方法的智能信息检索和整合策略

这里面我们面向不同的信息来源进行指令的拼接所用到的算法是不同的,例如我们可以利用bge向量搜索引擎帮助我们进行基于对话的客服准则的向量搜索返回一定的相关的客服准则条款,可以利用nl2sql的能力在客服进行交互的时候的商品画像的搜索,可以在用户交流过程中基于当前客户对话为索引向量搜索历史成交结果较好的客户对话记录。通过将这些多种多样的信息源智能地融入当前对话,大模型时代的智能客服不再是简单的问答系统,而是演变成了一个强大的决策支持工具。这不仅能够避免客户重复陈述问题,还能让客服对客户的需求有更深入的理解。

2024-06-26 10:51:23 704

原创 培训机构毕业了以后还怎么学习呢

有位同学问我一个问题在it培训机构毕业了以后还怎么学习呢?从一年的角度看 毕业后半年开始从事相关工作 从三年的角度看 毕业后开始成为一个小组长 从五年的角度看 开始创造新得体系 从十年看 有一个流行的开源工作是你主导的。到这一步就达成了一个终身成就了。而我选择了安逸。这是一个非常有远见的问题,说明这位同学有着长远的职业规划和追求。在IT行业,持续学习和职业发展是非常重要的。以下是一些建议,帮助你制定一年的、三年的、五年的和十年的学习和职业规划。

2024-06-21 17:25:06 799

原创 深入解析ReLU激活函数的优缺点及其平衡策略

ReLU(Rectified Linear Unit)是一种常用的激活函数,广泛应用于深度神经网络中。它有其优缺点,在不同场景下需要权衡使用。

2024-06-21 11:13:06 874

原创 多模态教案:Open-Sora 1.2 报告

Open-Sora 1.2 引入了一系列新的功能和改进,主要包括视频压缩网络、改进的模型训练流程、多阶段训练和评估方法等。通过结合文本和视觉内容,本教案旨在帮助学生深入理解这些技术,并通过实际操作来强化知识。

2024-06-18 16:47:06 749

原创 llama3简介与国内最快体验方式

Meta公司研发并推出了Meta Llama 3系列大型语言模型(LLMs),该系列包括8B和70B参数量的预训练及指令调优生成文本模型。Llama 3的指令调优模型专为对话场景优化设计,在行业通用基准测试中表现优于众多开源聊天模型,并且我们在开发过程中特别注重提高其有用性和安全性。启动后,你可以复制 API 地址并将其粘贴到浏览器中打开 Open Webui 页面。通过 admin@example.com 和 adminadmin 登录。如果你有任何疑问或需要进一步的帮助,请随时提问。

2024-04-19 18:29:48 2983 1

原创 llama 3 震撼来袭 8B 150k 词元 8Ktoken长度 4T token 参与预训练与对齐训练 使用GQA

Meta开发了并发布了Meta Llama 3系列大型语言模型(LLMs),这是一组在8亿和70亿参数规模下预训练和指令调整的生成文本模型。Llama 3的指令调整模型针对对话用例进行了优化,并在常见的行业基准测试中超越了众多开源聊天模型。模型架构:Llama 3是一个使用优化变压器架构的自动回归语言模型。调整后的版本使用监督式微调(SFT)和基于人类反馈的强化学习(RLHF)来与人类对有益性和安全性的偏好保持一致。变体:Llama 3提供两种大小——8B和70B参数——分别有预训练和指令调整版本。

2024-04-19 17:29:09 724

原创 【无标题】

您展示的代码片段是关于使用PaddlePaddle Time Series (Paddlets) 库中的 AutoTS 工具进行时间序列预测的一个例子。AutoTS 是一个自动时间序列预测工具,它使用机器学习算法来搜索最佳的时间序列模型和超参数配置。您提供的代码是使用 PaddlePaddle Time Series (Paddlets) 库进行时间序列预测的示例。

2024-02-06 11:34:58 1191

原创 pandas基于单个数据列的指定内容筛选dataframe数据、筛选dataframe中指定数据列的值大于某一固定值的数据行

在Python的Pandas库中,可以使用多种方法来筛选DataFrame中的数据。

2024-02-05 18:56:32 665

原创 pandas基于单个数据列的指定内容筛选dataframe数据、筛选dataframe中指定数据列的值大于某一固定值的数据行

在Python的Pandas库中,可以使用多种方法来筛选DataFrame中的数据。

2024-01-18 16:20:13 838

原创 pdf 目录 实体关系联合抽取

PDF文档是一种通用的文档格式,它可以被不同操作系统、软件和设备所识别和读取。PDF文档可以包含文本、图像、音频和视频等多种内容,并且可以保持文件格式的完整性,使其在不同的环境下都能被正确地呈现和处理。PDF文档也被广泛用于电子签名、文件共享和协作等领域。大部分是一种多特征的ner来做的包括了一些位置特征加入了模型进行目录结构训练。面对pdf文档领域,应该如何实现对其目录结构的自动化挖掘工作一直备受关注。那我们今天用pdf中的目录作为一个实体关系联合抽取的工作。

2023-08-31 19:37:18 94

翻译 强化学习

《机器学习及其应用》汪荣贵等编著 机械工业出版社 2019 年第 1 版1第六章 强化学习我们知道,机器学习是一种从经验数据中构造和改善模型的理论与方法,前述监督学习和无监督学习主要以带标注或不带标注样本数据作为反映外部环境特征的经验数据。事实上,除样本数据之外还可使用外部环境的反馈信息作为经验数据构造和改善模型,由此形成一种名为强化学习的机器学习类型。强化学习又称为再励学习或评价学习,...

2019-10-17 14:14:20 3272

原创 Lucene8.0 高速倒排索引数据库

Lucene8.0 demo最不爽的事情就是新的lucene出来了整个中国IT论坛都没跟新lucene 8.0功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FL...

2019-05-07 21:07:54 1017

albert_large_zh(2).zip

albert_large的模型,很好,很快,很强大,30GB中文数据进行训练。

2019-10-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除