自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(84)
  • 资源 (11)
  • 问答 (1)
  • 收藏
  • 关注

原创 LLaMA-Factory+算力云6步开启你的第一次大模型训练

下面的步骤是在Ubuntu安装LLaMA-Factory的详细步骤;建议用Ubuntu,安软件非常好安。注意:端口必需是6006,算力云的默认要求,只有这样才可以通过给定的域名访问。想用就开机,开机才收费,和网吧一样。就这几项配置,改成你自己期望的就可以了。参数配置好,启动训练就可以了。

2024-09-19 09:25:07 318

原创 Ubuntu LLaMA-Factory实战

CUDA 是由 NVIDIA 创建的一个并行计算平台和编程模型,它让开发者可以使用 NVIDIA 的 GPU 进行高性能的并行计算。首先,在查看您的 GPU 是否支持CUDA保证当前 Linux 版本支持CUDA. 在命令行中输入,应当看到类似的输出x86_64检查是否安装了gcc. 在命令行中输入,应当看到类似的输出在以下网址下载所需的 CUDA,这里推荐12.2版本。注意需要根据上述输出选择正确版本如果您之前安装过 CUDA(例如为12.1版本),需要先使用卸载。

2024-09-18 19:17:46 964

原创 一般初中生可以理解的大模型概念汇总15条

RAG是的缩写,意思是“检索增强生成”。听起来有点复杂,其实可以用一个简单的比喻来理解。RAG就像是一个既聪明又勤奋的朋友。它不仅能用自己知道的知识回答你的问题,还能去查找更多的信息,帮助它给出更好的答案。这让它在很多情况下,比只靠记忆的助手更有用、更强大。希望这个解释能帮你理解 RAG 是什么!

2024-09-18 10:39:59 528

原创 Ubuntu系统安装mysql、nginx、.netcore

在 Ubuntu 上安装 MySQL 非常简单,尤其是在 Ubuntu LTS 版本上。你可以通过以下步骤进行安装。

2024-09-18 09:42:56 274

原创 mysql设置远程连接最好用的方式,没有之一

要将localhost修改为。

2024-09-15 20:11:31 236

原创 大模型中的模型预测是什么意思?

假设你有一个很聪明的朋友,他很擅长根据过去的事情来猜测未来会发生什么。这位朋友会通过你告诉他的信息来预测结果,类似于你问他:"明天会不会下雨?" 你的朋友会根据过去的天气情况,比如今天的云层、风速等,告诉你他的猜测:"我觉得明天会下雨。在人工智能和大模型中,模型预测就是这样的过程。模型通过从大量数据中学习,尝试根据新的输入信息来做出“预测”或“推测”。这些“预测”可能是下一步的动作、答案,或者对未来某件事情的估计。

2024-09-14 09:30:37 413

原创 大模型评估当中的指令跟随、鲁棒性、偏见、幻觉、安全性是什么意思?

通过评估这些维度,可以全面了解大模型的性能与局限性,并进行针对性优化。

2024-09-14 09:22:54 430

原创 魔搭上的Transformer原理图是倒着画的,大家看看正过来的效果哪个好?

魔搭上的原理图:

2024-09-13 09:23:40 99

原创 什么是大模型的推理?

你可能会根据你过去的经验和常识做出猜测,最有可能的是:“早餐” 或者 “面包”。你不会猜“手机”或“书”这样的词,因为它们不符合句子的上下文。大模型的推理过程主要是基于海量数据的训练,来生成或预测出最可能的输出。以语言模型为例,它是通过输入一段文本(称为。:想象你和朋友在玩一个猜谜游戏。朋友给你一个不完整的句子:“我今天早上吃了……”,你要猜出最后的单词。,通过这些参数,模型能够为每个可能的输出分配一个概率,最终选择最可能的结果。)并根据之前的上下文预测下一个词或句子。这一过程依赖于模型内部的大量。

2024-09-12 09:45:01 418

原创 ELK预警方案:API+XXLJob

【代码】ELK预警方案:API+XXLJob。

2024-09-11 12:52:02 488

原创 大模型的Base和Instruct等多版本有什么区别

Base 模型更像是一块未经雕刻的毛坯,拥有广泛的语言知识但不擅长直接执行指令。Instruct 模型是在 Base 模型上微调后的版本,专门设计用于听从和执行用户指令,适合用于对话系统、生成任务等具体应用场景。Instruct 模型通常更加实用,而 Base 模型则更适合研究人员或开发者进行进一步微调和定制。

2024-09-10 09:09:34 921

原创 大模型中的token是干什么用的?

在大模型中,是模型处理语言的基本单位,它就像语言的“拼图块”。我们可以把 token 想象成一句话或一段文字中的“碎片”,这些碎片可以是一个单词、一个词的一部分,或者甚至是一个符号。模型通过理解和处理这些 token 来完成任务,比如翻译、回答问题、生成文本等。

2024-09-10 08:36:35 307

原创 人工智能中的模型推理指的是什么

在人工智能(AI)领域,**模型推理(inference)**指的是利用训练好的模型对新的、未见过的数据进行预测或决策的过程。简而言之,推理是将已经训练好的机器学习或深度学习模型应用到实际问题上来获取输出结果的阶段。

2024-09-09 09:41:00 302

原创 人工智能领域的AGI指的是什么?

AGI,全称为,中文一般翻译为“通用人工智能”,是人工智能(AI)研究中的一个目标和理念,指的是一种能够像人类一样在广泛的任务中表现出智能的人工系统。与当前大多数专门处理某种特定任务的和的能力。

2024-09-09 09:33:05 654

原创 大模型中的多模态概念指的是什么

大模型中的(Multimodal)概念是指模型能够同时处理和理解来自多种类型的数据或信息模式(modalities),如文本、图像、音频、视频等。这种模型不仅可以从单一模态(如仅文本或仅图像)中学习,还能够结合多种模态的数据,从而增强模型的理解能力和表现。

2024-09-09 09:01:49 703

原创 人工智能入门,都要掌握哪些知识点

AI入门时,应该从基础的数学、编程、机器学习等知识点入手,逐步深入到深度学习、特定领域的应用(如CV、NLP)和实际项目实践。通过不断学习和实践,可以逐步掌握并深入AI领域。

2024-09-08 23:13:22 1042

原创 人工智能领域的微调指的是什么?

微调是AI模型开发中的一个重要步骤,通过将预训练好的模型在特定任务或领域的数据上进行再训练,模型可以在特定任务中展现出更好的效果。它不仅提高了模型的适应性,还能节省大量的计算资源,广泛应用于自然语言处理、计算机视觉、语音识别等领域。

2024-09-08 22:57:08 984

原创 人工智能中的RAG指的是什么

RAG模型是一种将检索与生成紧密结合的架构,既保留了生成模型的灵活性,又引入了外部知识库的权威性和实时性,使得生成的文本更加精准和信息丰富。这种架构特别适合于动态信息密集型的任务。

2024-09-08 22:45:55 507

原创 人工智能领域的智谱指的是什么

在人工智能(AI)领域,"性能"(performance)通常指的是一个AI系统或模型在执行特定任务时的表现和效率。AI的性能可以从多个角度衡量,具体取决于任务的类型和应用场景。

2024-09-08 21:18:10 849

原创 人工智能领域的性能指的是什么

在人工智能(AI)领域,"性能"(performance)通常指的是一个AI系统或模型在执行特定任务时的表现和效率。AI的性能可以从多个角度衡量,具体取决于任务的类型和应用场景。

2024-09-08 21:08:08 850

原创 提示词工程:AI时代的新技能

提示词工程指的是为大规模语言模型(如GPT-4)设计高效的输入,最大限度地提高生成模型的输出质量。近年来,OpenAI推出的GPT系列语言模型,以及其他公司推出的类似模型,如Google的LaMDA,Meta的LLaMA,已经成为AI领域的代表性技术。其次,不同语言模型对同一提示词的响应可能不同,提示词的可迁移性有限。例如,内容生成领域中可以创建固定格式的提示词模板,以确保每次生成的内容具有一致的结构和风格。在有限的计算资源下,设计优质的提示词可以让模型在最少的推理次数内生成期望结果,从而节省资源。

2024-09-08 20:58:21 840

原创 通过API方式访问llama3

API方式访问llama3结果如下:

2024-09-03 20:50:05 283

原创 LLama3本地部署安装

5.控制台中键入ollama run llama3:8b,会自动进行8B模型下载,该模型有80亿参数,普通电脑可以执行。4.进入官网找到想要下载的模型名称 https://ollama.com/library/llama3/tags。这篇教程将指导你如何在本机上安装 LLama3 客户端和可视化对话界面,我们会分为三部分:安装 LLama3 客户端、部署大模型和设置模型文件路径。3.打开cmd控制台,键入ollama,如果如下图显示命令提示就说明安装已经成功。如果需要解除限制,或是其他微调功能,可以在。

2024-08-23 10:07:37 953

原创 .netcore dapper数据库异步操作方法比较

这两个方法的主要区别在于同步执行和异步执行的处理方式。以下是它们的本质区别、各自的优点,以及异步方法减轻了谁的压力。

2024-08-22 10:41:53 616

原创 Transformer 模型详解

Transformer 是一种基于注意力机制的神经网络架构,它最初是为了解决机器翻译问题而提出的,但它的应用范围现在已经扩展到许多自然语言处理(NLP)任务,如文本生成、情感分析、语音识别等。不同于传统的递归神经网络(RNN)或卷积神经网络(CNN),Transformer 利用全局的自注意力机制(Self-Attention)在不依赖顺序处理的情况下高效地处理序列数据。

2024-08-20 09:00:03 511

原创 开源免费大语言模型(LLMs)排行榜

发布方模型大小: 7B, 13B, 30B, 65B 参数特点: 高效、轻量级模型,具有良好的推理性能,能在较小的显存上运行较大的模型。优点训练高效,精度优秀在推理时速度快7B 模型对硬件要求较低缺点: 65B 参数模型需要极高的计算资源。最低配置要求7B 参数: 24 GB 显存 GPU(如 A100 40GB 或 RTX 3090)65B 参数: 256 GB 显存的多张 GPU在神经网络(尤其是像 Transformer 这样的语言模型)中,参数是指模型中可训练的权重。

2024-08-20 08:50:58 1147

原创 深入理解命名实体识别(NER)

命名实体识别(NER,Named Entity Recognition)是自然语言处理(NLP)中的一项重要技术,用于从文本中识别出特定类型的实体,并将这些实体分类到预定义的类别中。实体通常包括人名、地名、组织名、日期、时间、数量、货币等。例如,在句子“Barack Obama was born in Hawaii in 1961”中,NER任务的目标是识别“Barack Obama”作为人名,“Hawaii”作为地名,以及“1961”作为日期。

2024-08-12 00:24:46 398

原创 深入了解SQLite

SQLite是一种嵌入式的关系数据库引擎,以其轻量级、跨平台、易于使用的特点而闻名。它不需要独立的服务器进程,数据存储在单一的文件中,使得它成为许多应用程序中默认的数据库解决方案。SQLite作为一种轻量级、强大且灵活的数据库引擎,已经在全球范围内广泛应用。尽管它有一些局限性,但其易用性和可靠性使其在许多场景中成为首选。

2024-08-12 00:06:06 659

原创 Boddotstrap使用技巧指南

Boddotstrap 是一种基于 Bootstrap 框架的增强工具,旨在帮助开发者更快、更轻松地创建响应式网站。它不仅提供了 Bootstrap 的所有功能,还加入了更多自定义选项和优化工具,使得主题开发和项目定制更加灵活。Boddotstrap 是一个功能强大且灵活的工具,适合用于各种前端项目。从基础的定制主题到高级的组件扩展,Boddotstrap 都能为您提供强大的支持。本指南涵盖了一些实用的技巧,帮助您在开发过程中更加高效。如果您能够充分利用这些技巧,您将能够创建出更加出色的响应式网站。

2024-08-09 16:55:08 807

原创 Kafka和Zookeeper的安装与使用指南

在分布式系统的世界中,Kafka是一种高性能的消息队列系统,而Zookeeper则作为分布式协调服务的基础工具之一,为Kafka的高效运行提供支持。本指南将详细介绍在Windows和Linux系统中安装和配置Zookeeper和Kafka的步骤,并包含一些常用命令和经验总结,帮助你更好地掌握这些工具。

2024-08-09 16:15:49 867

原创 sqlserver如何建索引

例如,如果一个查询需要返回某些列的值,而这些列不在索引键中,那么在该索引上包含这些列可以避免需要额外的 I/O 操作来检索这些值。总体来说,如果你想要让SQL Server能够使用索引来优化LIKE查询,那么最好避免在查询模式的开头使用通配符字符,并确保适当的索引已经创建在需要查询的列上。然而,如果你的查询模式没有以通配符字符开头,并且你的表上有一个适当的索引,那么它可以使用索引来优化查询。在SQL Server中,使用LIKE操作符进行模糊匹配时,在某些情况下是可以命中索引的,但在其他情况下可能不会。

2024-08-09 09:33:34 446

原创 在 CentOS 7 上安装 Redmine 的详细步骤及 20 个经典用法

支持自定义字段,适应不同项目的需求。

2024-08-09 09:09:48 1158

原创 18个最佳开源低代码开发平台

低代码/无代码开发平台使用图形向导构建软件,而不是像传统方法那样使用计算机编程语言来构建应用程序。在本文中,我们介绍面向个人和企业用户的18个开源的最佳低代码/无代码平台。低代码/无代码指的是提供可视化开发工具,支持拖放,内置组件浏览器和逻辑构建器。低代码/无代码的概念并不新鲜,这可以追溯到十多年前的无代码编程技术 (PWCT) 以及类似的系统。然而,这一概念在开发人员社区中并未得到支持。如今,数十个低代码 / 平台和服务正蜂拥而至,因为事实证明,这个概念不仅仅是可用于快速原型项目。

2024-08-09 09:00:40 3007

原创 Visual Studio 2022: 100 个实用技巧及详细操作方法

点击视图 > 工具栏 > 自定义。在弹出的“自定义”窗口中,选择“命令”标签。从“类别”列表中选择功能,然后从“命令”列表中拖动所需命令到工具栏。**操作方法:**创建一个项目或文件模板,点击文件 > 导出模板。按照向导步骤保存模板,并在以后使用文件 > 新建 > 项目中选择你的自定义模板。解决:挨个项目编译,排查卡在哪个项目的编译上,然后检查该项目依赖的文件包,是否有问题。解决包依赖,就可以顺利编译通过了。在 VSIX 项目中添加一个新的“工具窗口”。

2024-08-09 08:56:16 940

原创 Node.js 常用命令集合

Node.js 的生态系统庞大而丰富,通过掌握以上常用命令,可以大大提高开发效率和项目的可维护性。从环境配置到打包发布,再到依赖管理,理解并熟练运用这些命令,将帮助你更好地管理和开发 Node.js 项目。希望这篇文章能够成为你的 Node.js 开发的有效参考。

2024-08-08 22:13:40 572

原创 个人编程原则总结(不喜勿喷)

通过遵循以上编程原则和技巧,开发团队能够写出更加高效、可维护、易扩展的代码。这不仅有助于项目的顺利进行,还能为团队的长期合作奠定坚实的基础。定期回顾和优化这些规则,将有助于持续改进代码质量和团队效率。

2024-08-08 22:05:55 1096

原创 什么是NLP实体识别?

实体识别是自然语言处理中的一个子任务,其主要目标是识别文本中的实体,并将这些实体分类为预定义的类别(如人名、地名、组织名、时间、数值等)。例如,在句子“苹果公司在2024年发布了新款iPhone”中,实体识别任务将识别出“苹果公司”作为组织名,“2024年”作为时间,“iPhone”作为产品名。基于规则的方法通过预定义的规则或模式来识别实体。规则通常由领域专家制定,涉及模式匹配、正则表达式、词典查找等。例如,可以使用正则表达式来匹配可能的英文人名,或使用词典查找常见的公司名。简单易用,容易理解和维护。

2024-08-08 21:50:35 907

原创 如何解析五大招聘平台简历:BOSS直聘、智联招聘、前程无忧、58同城、猎聘

在当今数字化招聘过程中,解析来自不同平台的简历是招聘系统的核心需求之一。由于每个平台的简历格式各异,解析方法需要多样化和灵活性。以下将详细介绍如何解析BOSS直聘、智联招聘、前程无忧、58同城、猎聘五大平台的简历,并提供多种解析方案。

2024-08-08 21:34:46 1094

原创 SqlServer五种分表策略

垂直分表是将一个大表按列分成多个小表。每个小表包含原表的一部分列,共同使用相同的主键。水平分表是将一个大表按行分成多个小表。通常根据某个分区键(如ID、日期)来分割数据。混合分表结合垂直分表和水平分表,先按列分表,再对分表后的数据进行水平分表,或反过来。分区表是在同一个逻辑表中使用物理上的分区来存储数据。每个分区包含表的一部分数据,通常根据某个分区键来划分。索引视图是将视图的结果物化存储,并对视图进行索引,以提高查询性能。

2024-08-06 16:01:49 773

原创 MacOS的100个超实用技巧

调整Dock的大小、位置和行为。打开“系统偏好设置”。选择“Dock”。设置大小、位置和自动隐藏等选项。更改系统声音设置。打开“系统偏好设置”。选择“声音”,在“效果”选项卡中选择声音效果。

2024-08-04 12:31:30 936

Ext JS框架 经验之作2000页

Ext案例总结 最牛的JS框架 泣血大作 分享网友

2014-06-23

天气图片包 天气下载weather

天气图片包 天气下载weather 图片包 方便编程

2013-07-25

Microsoft.ReportViewer三件套-2008

C# 报表 打印技术 打印 Microsoft.ReportViewer三件套-2008

2013-07-06

ky_Setup长途客运售票系统

客运 长途客运 售票系统 长途客运售票系统,功能齐全

2013-07-06

httpwatch_20063

httpwatch 看透http协议 神器 监听http流

2013-07-06

Everything-1.2.1.371 全磁盘搜索神器

磁盘搜索 everything 神器 全盘搜索文件, 你会有意想不到的收获

2013-07-06

数据库文档生成工具databasedoc12

数据库文档自动生成器 神器 数据库 文档 自动生成 生成器 神器

2013-07-06

2013-7-4程序员工作效率低下11大原因

程序员 工作效率低下11大原因 简要概括了程序员一族工作效率低下的主要原因 总结的不很全面,往读者多多补充,多多指正

2013-07-05

GridView模板列前台绑定数据和后台接收控件被绑定数据的方法探讨

gridview模板列前后台数据绑定 html控件数据绑定 服务器控件绑定

2013-07-03

mysql数据库安装,配置,图解

(1)mysql详细配置,看图详解。 (2)cmd命令窗口,如何开启,关闭mysql。

2013-07-02

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除