自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Watson的博客

粗俗易懂详细

  • 博客(39)
  • 资源 (3)
  • 收藏
  • 关注

原创 强化学习和有监督学习的区别

随着ChatGPT、Claude 等通用对话模型的成功,强化学习在自然语言处理领域获得了越来越多的注意力。在深度学习中,有监督学习和强化学习不同,可以用旅行方式进行更直观的对比,和可以看做,每种旅行都具备着自己独特的风景、规则和探索方式。

2024-07-23 17:11:09 361

原创 分布式训练并行策略

大模型分布式训练并行策略介绍

2024-07-23 10:00:56 1046

原创 浅谈全量微调和PEFT高效微调(LoRA)

是指在预训练的大型模型基础上调整所有层和参数,‌使其适应特定任务的过程。‌这一过程使用较小的学习率和特定任务的数据进行,‌可以充分利用预训练模型的通用特征。

2024-07-15 21:27:47 263

原创 什么是Base模型?什么是chat模型?什么是instruct?什么是4Bit?

常常在开源模型仓看到大模型库中有`base`、`chat`、`instruct`和`4bit`等模型,作为小白来说经常搞不明白需要下载哪一个,今天就带大家简单了解一下

2024-07-15 20:12:59 665

原创 浅谈RLHF---人类反馈强化学习

通俗理解什么是RLHF

2024-07-14 22:46:18 233

原创 使用shell命令awk处理大模型日志,进行loss曲线画图

使用awk命令进行大模型日志处理,提取loss值进行loss曲线画图

2024-07-09 16:06:40 313

原创 07浅谈大语言模型可调节参数tempreture

浅谈大语言模型输出随机性参数temperature

2024-07-07 15:42:12 723

原创 06浅谈大语言模型可调节参数TopP和TopK

浅谈大预言模型本文生成随机性控制超参之top_K和top_P

2024-07-07 02:17:00 334

原创 02浅谈大模型文本生成的背后逻辑

浅谈大预言模型文本生成逻辑

2024-07-06 14:56:57 198

原创 AI算法/模型/框架/模型库...都是什含义区别和联系?

算法(Algorithm):算法是解决某一特定问题的步骤或规则集合。在AI/ML领域中,算法是用于训练模型、优化参数和执行推理的数学规则和计算方法。算法是模型训练的核心,通过不断优化模型参数以最小化误差或最大化性能。

2024-07-06 01:47:46 1123

原创 03浅谈提示工程、RAG和微调

通俗理解提示工程/RAG及微调

2024-07-05 00:59:17 448

原创 04通俗理解自注意力机制(self-attention)

通俗易懂理解自注意力机制

2024-07-04 00:30:38 271

原创 01通俗理解大模型预训练和微调

但是通用大模型在某些方面的垂直能力可能还不具备,因此需要用到一些领域的数据或私有化数据对大模型进行改良,这个过程叫做微调。通过海量数据数据,训练一个通用大模型,此时大模型具备很多能力。简单理解大模型预训练和微调的过程。

2024-07-03 00:59:35 131

原创 大模型基础

AI大模型基础名词概念总结

2024-07-03 00:55:34 1068

原创 自动抓取服务器功耗

linux系统内通过ipmitool工具自动抓取服务器当前功耗power,每隔5分钟抓取一次,累计抓取20次。

2024-06-18 20:09:15 365 1

原创 网络聚合通信测试--自动化测试脚本

常见集群网络聚合通信测试,包含:alltoall/allgather/allreduce/barrier/bcast/gather/reduce/scatter。进程数从2开始,以2的幂次增加至满核。自动化测试脚本

2024-06-18 19:54:00 293

原创 正则表达式----IP地址合法性判断

使用正则表达式,进行IP地址合法性判断

2024-06-06 23:55:54 547

原创 正则表达式基础

思考–问题答案在文末Q1:什么是正则表达式?正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。Q2:他有什么用处?常见匹配字符常用的匹配规则-匹配字符数量匹配前一个字符出现0次或者无数次匹配前一个字符出现1次或者无数次。

2024-06-06 23:44:45 971

原创 深度学习框架-----Tensorflow2基础

静态图:采用静态图(模式)的即s可正w,通过计算图将计算的定义和热行分隔升,这是-种声明式(declarative)的编程模型。Graph模式下,需要先构建og命计算图然后开启对话(sesSsion),再喂进数据才能得到执行结果。这种静态图在分布式训练,性能优化和部署方面有很多优势。但是在de叫g时确实非常不方 更,类似以于对编译好的语言程序调用,此时是我们无法对其进行内部的调试,因此有了基 于动态计算图的EagerExecutiog。

2024-06-06 20:59:25 1214

原创 tensorflow2常用模块之网络构建基础

常见的模型类型是层的堆叠:tf.keras.Sequential模型。

2024-05-29 02:25:45 850

原创 shell脚本开发基础

* 和$的区别你了解吗?$* 和 $@ 都表示传递给函数或脚本的所有参数当 $* 梨 $@ 不被双引号”“包围时,它们之间没有任何区别,都是将接收到的每个参数看做一份数据,彼此之间以空格来分隔。但是当它们被双引号”“包含时,就会有区别了:“ $* “会将所有的参数从整体上看做一份数据,而不是把每个参数都看做一份数据。"name 111 222 333 444" " $@ “仍然将每个参数都看作一份数据,彼此之间是独立的。

2024-05-27 00:09:50 1004

原创 shell脚本实战--批量修改文件名

shell批量修改文件名

2024-05-27 00:05:55 311

原创 日常学习记录之---linux环境变量

* 获取shell脚本所有参数,不加引号等同于 $@作用,加上引号“ $*“作用是接收所有参数为单个字符串,“$1$2…环境变量一般指的是用export内置命令导出的变量,用于定义shell的运行环境、保证shell命令的正确执行。$@ 不加引号,效果同上,加引号,是接收所有参数为独立字符串,如"$1"“$2"shell的特殊变量,用在如脚本,函数传递参数使用,有如下特殊的,位置参数变量。$n 获取she11脚本的第n个参数,n在1~9之间,如$1,$2,$_ 获取上次执行的命令的最后一个参数。

2024-05-26 23:43:48 772

原创 shell脚本实现linux系统自动化配置免密互信

进行linux自动化运维时需要先配置免密,但某些特定场景下,做了互信的节点需要取消免密,若集群庞大节点数量多时,节点两两之间做互信操作非常麻烦,比如有五个节点,彼此两两之间做互信,就需要做5。1=120次,工作量十分巨大,因此若将该工作自动化进行将省时省力。5.根据打印的菜单栏,输入选项1/2/3/4,按回车。节点IP 节点用户名 节点登录密码。

2024-05-14 23:37:46 327 1

原创 GPU Burn测试指导

上传工具到操作系统下,解压缩工具,使用make命令完成编译(确保cuda环境变量已经配置成功、nvcc -v能显示结果)。如果安装异常,请根据提示检查是否缺少依赖包,根据缺少的包安装依赖包比如gcc、g++等。指定GPU后,然后执行开始测试:测试过程,再开个窗口执行nvidia-smi ,可以查看GPU当前状态,如下显示举例,查看当前跑的GPU1的状态可以查看当前gpu burn测试进度,如下表示进度32.4%测试完成后,会有记录当前性能数值,以及提示GPU卡是否OK。

2024-05-14 23:10:32 585 2

原创 linux系统修改网卡名称

5、重启系统,测试。

2024-05-14 23:01:54 752

原创 OSU micro-benchmarks安装测试指导

OSU Micro benchmark工具是由Ohio State University提供的MPI(Message Passing Interface,消息传递接口)通信效率评测工具。该工具旨在通过执行不同模式的MPI操作,来测试并度量MPI通信的带宽和延迟等性能参数。具体来说,OSU Micro benchmark工具分为点对点通信和组通信两种形式。点对点通信模式主要用于测试两个节点之间的通信性能,而组通信模式则用于测试多个节点之间的协作和通信效率。

2024-05-14 00:54:08 850

原创 Linux quota磁盘配额限额操作

linux系统磁盘配额是用来限制用户和用户组的磁盘使用额度,可以理解为限制该用户、用户组在该分区下使用的文件大小、文件数量。而这个操作就需要quota来实现。

2024-05-11 22:08:13 1181

转载 umask详解

在linux系统中,我们创建一个新的文件或者目录的时候,这些新的文件或目录都会有默认的访问权限,umask命令与文件和目录的默认访问权限有关。若用户创建一个文件,则文件的默认访问权限为 -rw-rw-rw- ,创建目录的默认权限 drwxrwxrwx ,而umask值则表明了需要从默认权限中去掉哪些权限来成为最终的默认权限值。当我们想改变创建文件和目录时的默认访问权限,则可以通过umask命令来实现。

2022-10-27 12:13:49 2796

原创 冒泡排序入门详解

大一上学期我们就都接触了冒泡排序,但很多人并不是很了解或者说掌握的很彻底,在这里我将从以下几个方面来给大家详细讲解冒泡排序的算法:概念思想核心算法===============================1.概念“冒泡排序”就是把小的元素往前调或者把大的元素往后调。比较是相邻的两个元素比较,交换也发生在这两个元素之间。所以,如果两个元素相等,是不会再交换的;如果两个相等的元素没...

2020-04-04 21:59:03 394

原创 计算机组成原理--多模块交叉存储器

计算机组成原理--多模块交叉存储器 深度分析存储器的模块化组织1、顺序方式2、交叉方式存储器的模块化组织一个由若干模块组成的主存储器 是线性编址的。这些地址在各个模块中有两种安排方式:1、顺序方式 2、交叉方式多模块交叉存储器1、顺序方式顺序方式 特点:(优点)某个模块进行存取时,其它模块不工作,某一模块出现故障时,其它模块可以照常工作,通过增添模块来扩充存储器容量比较方便,(缺...

2019-12-21 14:08:34 17150 4

转载 Tomcat服务器下载、安装、配置环境变量教程(超详细)

原文链接:https://blog.csdn.net/qq_40881680/article/details/83582484

2019-09-08 10:18:17 199

转载 JavaWeb的项目环境配置与软件安装(JDK+Tomcat+Eclipse+Mysql)

原文地址:https://www.jianshu.com/p/15e604d415a0这是去年六月做软件工程的期末课程设计的时候写的一个教程了,不知不觉,距离上一次碰java也过去快一年了。唉~最近的课程又需要用到java了,所以把这篇教程翻了出来。操作系统:win10 64bit一、JDK的安装与配置1、从ORACLE官网上下载JDK。下载链接我下载的是jdk-8u131-window...

2019-09-04 21:59:52 842

转载 Java中接口作用深度理解

原文:https://blog.csdn.net/whandwho/article/details/80247521关于Java中接口作用的深入理解。这是个很容易遇到的问题吧。一、 接口的存在也是为了弥补类无法多继承的缺点假设一个情况,父类–Animal 子类–Dog、Cat 、People、Sheep、Tiger、Lion。假设在 Animal 中都存在 eat()这个公有的方法。但是 ...

2019-06-01 11:59:48 528

原创 ISCC(web)暴力破解

web2暴力破解题目地址:http://39.100.83.188:8002发现这是一个已经给了用户名 只需要破解三位数字密码即可有验证码需要通过验证码随便输入一个密码 将验证码输入进去通过burp抓包然后爆破如下(输入完之后先不要点击submit)此时,打开burp,设置好代理(这里不懂的自己查一下burp使用教程,里边有详细介绍)然后点击submit你会看到burp...

2019-05-23 23:31:02 661

原创 ISCC(web)

web4地址:<?php error_reporting(0); include("flag.php"); $hashed_key = 'ddbafb4eb89e218701472d3f6c087fdf7119dfdd560f9d1fcbe7482b0feea05a'; $parsed = parse_url($_SERVER['REQUEST_URI']); /*理解p...

2019-05-22 20:08:52 524 2

原创 Java编写一个公司员工类

编写一个公司员工类1、数据成员:员工员、姓名、薪水、部门。2、方法:(1)利用构造方法设置信息。单参,只传递员工号,则员工姓名:无名氏,薪水:0,部门:未定。双参,传递员工号,姓名,则员工薪水为1000,部门:后勤。4参,传递员工号、姓名、部门、薪水。无参,则均为空值(2)显示信息class Staff{ String sno,name,department; ...

2019-05-14 17:12:08 8801 1

原创 SQL-server2012使用T-SQL语句对数据库、模式、表、视图、约束、触发器、变量、函数的相关操作

模式的创建模式定义语句如下:CREATE SCHEMA<模式名>AUTHORIZTION<用户名>;注意:如果没有指定<模式名>,则<模式名>隐含为<用户名>。要创建模式时,调用该命令的用户必须拥有数据库管理员权限,或者获得了数据库管理员授予的 CREATE SCHEMA 的权限。例如:为用户WANG定义一个学生-课程模式S-...

2019-05-13 17:52:09 4806

原创 JAVA内部类、外部类创建与访问控制管理

JAVA内部类、外部类创建与控制访问一、 创建静态、非静态内部类 内部类的优缺点、内部类的使用格式。对于成员内部类,必须先产生外部类的实例化对象,才能产生内部类的实例化对象。而静 态内部类不用产生外部类的实例化对象即可产生内部类的实例化对象。 创建静态内部类对象的一般形式为: 外部类类名.内部类类名 xxx ...

2019-05-08 22:32:14 281 1

浅谈全量微调和PEFT高效微调(LoRA)

浅谈全量微调和PEFT高效微调(LoRA)

2024-07-15

通俗理解RLHF(人类反馈强化学习)

通俗理解RLHF(人类反馈强化学习)

2024-07-14

07浅谈大语言模型可调节参数tempreture

07浅谈大语言模型可调节参数tempreture

2024-07-07

日常好用对比工具,用于留存方便日后使用

日常好用对比工具,用于留存方便日后使用

2024-07-05

日常使用脚本总结汇总,作为存档

日常使用脚本总结汇总,作为存档

2024-06-18

notepad++安装包+typora安装包

notepad++安装包+typora安装包,免费使用

2024-05-27

typora自定义格式文件

typora自定义格式文件

2024-05-27

DBCP驱动包、hibernate所有jar包、JSON所有的jar等超详细合集.zip

最全的最详细的DBCP数据库连接池技术驱动、hibernate所有jar包、JSON所有的jar等。

2021-08-22

基于Android的仿微信朋友圈的实现.app

一个简单的仿微信的朋友圈的APP。可以实现的简单的发布动态、二级评论、点赞功能。需要的可以进行下载

2021-08-15

(毕设)基于Android的学生在线学习平台(移动端+服务器端+数据库)

博主毕业时自己开发的基于Android的学生在线学习APP,是一个相当完整的系统,该系统开发了移动端和服务器端两个系统。内附系统完整的源代码、开发运行环境说明、系统文档、数据库等等。此外压缩包中还包含博主在平时练习的小项目。有需要的可以进行下载。

2021-08-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除