自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(86)
  • 收藏
  • 关注

原创 大模型训练基础之混合精度计算

在训练 1.5B 参数量的 GPT-2 模型时,使用 FP16 精度大致需要 21GB 的显存。这是一个比较精确的估算,实际占用可能会因实现细节有所不同。: 用于缩放梯度,以防止在 FP16 运算中出现的梯度下溢(数值过小导致的精度损失)问题。它通过动态调整缩放因子,确保梯度在反向传播中有足够的数值范围。选择最合适的精度(如上图所示),从而优化性能。混合精度能够保证模型准确性的情况下使训练更快。在前向传播后,你会得到一个损失值,然后使用。对这个损失值进行缩放,并计算梯度。但是同样的半精度存在的问题。

2024-08-20 13:36:56 328

原创 19_axios入门到进阶

/assign接收两个对象参数,可以将后面一个的属性值,赋值给前面同名属性值 Object.assign(message,response.data)异步函数中,普通函数是不会等待的;语法上promise是一个对象,可以获取异步操作的消息,promise提供统一的API,各种异步操作都可以用同样的方法进行处理。Promise创造的异步函数如果直接return,默认是resolved状态,return结果就是成功状态的返回值。// 内部的大括号用于设置内部请求参数 url,请求方式,请求参数等。

2024-06-13 09:32:09 818

原创 18_Vue3路由机制

Vue3路由机制router1 路由简介:路由就是根据不同的 URL 地址展示不同的内容或页面。通俗理解:路由就像是一个地图,我们要去不同的地方,需要通过不同的路线进行导航。2 路由的作用单页应用程序(SPA)中,路由可以实现不同视图之间的无刷新切换,提升用户体验;路由还可以实现页面的认证和权限控制,保护用户的隐私和安全;路由还可以利用浏览器的前进与后退,帮助用户更好地回到之前访问过的页面。2 路由入门案例1 案例需求分析​2 创建项目和导入路由依赖npm

2024-06-13 09:28:30 336

原创 17_Vue高级监听器&生命周期&Vue组件&组件通信

Vue.js中的watch、reactive和watchEffect为开发者提供了强大的工具来监听和管理响应式数据的变化。通过理解每个API的独特之处和适用场景,可以更有效地构建和管理Vue应用的状态,从而提升用户体验和开发效率。

2024-06-08 09:17:55 933

原创 16_ Vue.js高级指南:条件渲染、列表渲染与数据双向绑定

Vue.js通过提供如v-if、v-for和v-model等强大的指令,使得状态管理、列表渲染和表单处理变得异常简单和高效。掌握这些工具不仅可以提高你的开发效率,还可以帮助你构建更加动态、响应迅速的Web应用。通过不断实践和探索,你会更加熟悉Vue的哲学和工作流,从而更自如地创建丰富的前端体验。

2024-06-08 09:14:09 666

原创 15_Vue3核心概念与实践

Vue3 是一个渐进式的 JavaScript 框架,用于构建用户界面。它基于标准 HTML、CSS 和 JavaScript 构建,并提供声明式渲染和响应性两大核心功能。Vite 是 Vue 项目的脚手架工具,具有快速开发和运行的特点。Vue 文件(.vue)是一种单文件组件,包含模板、脚本和样式标签。Vue3 支持全局、组件内和样式标签内的 CSS 导入方式。Vue3 使用 ref 和 reactive 函数处理响应式数据,并支持 setup 语法糖简化组件定义。Vue 提供插值表达式、文本渲染、属性渲

2024-06-07 07:38:49 585

原创 14_Node.js和NPM入门指南

Node.js定义与特点:Node.js 是一个允许在服务器端运行JavaScript 的开源、跨平台环境,使用事件驱动、非阻塞I/O模型,适合处理高并发请求。具有单线程设计、轻量级、模块化和跨平台的特性。安装与使用:通过官网下载安装包进行安装,之后通过命令行使用node命令执行JavaScript 文件。NPM定义与作用:NPM 是Node.js 的包管理工具,用于管理项目的依赖和库。配

2024-06-07 07:33:51 780

原创 13_前端工程化_ES6

前端工程化是使用软件工程的方法来单独解决前端的开发流程中的问题,其主要目的为了提高效率和降低成本。前后端分离(前端代码工程化独立出来形成一个单独的app)1.开发分离2.部署分离3.服务器分离本次技术栈。

2024-06-06 08:03:55 995

原创 12_JavaWebAjax

注意:本次开发传参仅传入username,但是会设置一个密码,这个密码必须不为空,因为后续代码逻辑会送入MD5校验,为空报错;Ajax的原理,通过js技术向后端发送请求,通过响应来进行判断是否 进行页面跳转,是否生成数据展示到dom树中。writeJson是一个静态方法,因此这个工具包,调的不是类,是静态方法;前后端需要保持一致,就很麻烦,后端代码进行修改了,那么前端也需要跟着改;后端程序员撰写响应体的 class ,后续使用,直接new对象,将我们业务数据封装进去即可。​ 统一的格式是前后端商量好的。

2024-06-06 08:02:02 975

原创 11_JavaWeb监听器

例如attributeAdded就监听this.getContext().setAttribute()这个方法的操作。监听接口中可以重写相关方法,一旦被监听的对象执行了某项操作,tomcat后台就会进行响应,监听到;web中定义八个监听器接口作为监听器的规范,这八个接口按照不同的标准可以形成不同的分类。实现方法是contextInitialized、contextDestroyed。一般来说监听的东西五花八门,用的时候查即可;监听Servlet1的构建以及销毁。应用域监听接口以及api。

2024-06-05 08:03:45 271

原创 10_JavaWeb过滤器

关于路径的配置过滤器可以url-pattern或者直接写url-name都可。下面写法是通过url-pattern配置 批Servlet匹配;3.过滤 doFilter (多次)生活举例: 公司前台,停车场安保,地铁验票闸机。1.构造 constorct 默认重写。java中过滤仅仅是对请求做出过滤。4.销毁 destory。过滤器开发中应用的场景。2.初始化 init。

2024-06-05 08:02:13 504 1

原创 09_JavaWeb会话

域对象: 一些用于存储数据和传递数据的对象,传递数据不同的范围,我们称之为不同的域,不同的域对象代表不同的域,共享数据的范围也不同请求域会话域应用域整个服务器的应用域有且仅有一个。

2024-06-04 13:14:37 2784

原创 08_MVC架构模式

Model 模型层,具体功能如下:View 视图层,具体功能如下:Controller 控制层,具体功能如下案例:张三网络购物买10本 《^JAVA。

2024-06-04 13:11:44 513

原创 Servlet跳转404(解决)

3.关于配置信息Application context是你 WEB工程模块的名称,如果对此模块进行修改了,那么你 的Server也要做一些务必的修改。2.页面跳转,url栏输入的是web.xml中的url-pattern内容,请仔细检查。查看Project Structure,检查你的JDK版本不要选错版本;上面的URL地址要 写WEB模块修改后的 APP名;1.解决无法跳转的404问题(最根本,最重要)

2024-05-28 21:31:06 538 1

原创 07_Servlet

Servlet (server applet) 是运行在服务端(tomcat)的Java小程序,是sun公司提供一套定义动态资源规范;从代码层面上来讲Servlet就是一个接口用来接收、处理客户端请求、响应给浏览器的动态资源。在整个Web应用中,Servlet主要负责接收处理请求、协同调度功能以及响应数据。我们可以把Servlet称为Web应用中的控制器不是所有的JAVA类都能用于处理客户端请求,能处理客户端请求并做出响应的一套技术标准就是Servlet。

2024-05-27 21:47:51 1246

原创 06_Tomcat

创建resources放置配置相关文件,使其于src文件分开,便于管理,并且对其进行标记,这样可以最终可以一起去编译。先准备一个空项目 workspace for IDEA作为所有app的父项目,未来所有的app全部作为模块放到当前文件夹下。idea并没有将构建的app直接部署到tomcat中,而是创造副本,将app部署到副本中。此处的demo01-web01-war-exploded就是可以发布的app。此时,Java代码往src写,css,js,html代码往web放即可。专门应用于WEB应用软件;

2024-05-27 21:30:31 1106

原创 05_XML Dom4j

1.创建SAXReader对象2. 解析XML获取Document对象: 需要传入要解析的XML文件的字节输入流3. 获取文档的根标签4. 获取标签的子标签//获取所有子标签//获取指定标签名的子标签List sonElementList = rootElement.elements("标签名");5. 获取标签体内的文本6. 获取标签的某个属性的值。

2024-05-27 21:21:40 448

原创 04_前端三大件JS

1.js如何声明函数?function 函数名(){}2.js函数如何和点击按钮绑定到一起?按钮有一个属性叫做 onclick 单机行为ondbclick 双击行为3.如何弹窗提示?可以在js函数中定义alert()函数,也就是经典的弹窗提示js创建对象第一种方式2.{属性名:属性值,...,...,函数名:function(){}}--><script>// 1.创建一个对象// 2.给对象创建属性person.gae// 3.给对象添加方法。

2024-05-27 08:58:09 787

原创 03_前端三大件CSS

且div1被fixed到页面上,随着滚动条拖拽,div1的位始终不变。第一个div进行浮动设置后,轻轻松松往右进行漂浮。关于盒子的容量:加上边界 像素计算为102*102。绝对定位会随着浏览器边缘进行变化,我将浏览器缩小。盒子模型介绍的是如何调节div块之间的距离缝隙等。若选择器功能进行覆盖,那么后发生的为真实发生的。需求:我想让我的div块出现在指定的位置上。需求:我想让三个div盒子出现在同一行。fixed相对定位,其原始位置会被侵占。直接指定某个标签的样式,和上述一样。距离边缘位置距离不变。

2024-05-25 21:38:33 560

原创 02_前端三大件HTML

表单项目标签一定要定义name属性,该属性用于明确提交时的参数名表单项还需要定义value属性,该属性用于明确提交时的实参的;span 行内元素 自己不会独占一行的元素 行内元素的宽高等等,很多都是不生效的。div 块元素 自己独占一行的元素 块元素的宽高等等往往都是生效的。使用rowspan(span有占用的意思,占用行,也就是向下扩充)思路:让body的 某一行的结尾单元格向下扩充,占用其他单元格。表格的设计样式有点多,为了简化,有方便的写法。页面堆砌多个框的设计方式为页面布局的设计。

2024-05-25 21:34:14 1267

原创 01_尚硅谷JavaWeb最新版笔记

尚硅谷Javaweb最新版笔记,进攻参考。

2024-05-25 21:24:44 302

原创 本地部署Whisper实现语言转文字

非常适合转录英语。要转录包含非英语语音的音频文件,您可以使用以下选项指定语言。修改本地代码,将sample修改为,需要转录的录音,接入代理;借用huggingface的速度,速度取决于网速。进入huggingface网址,往下拉。以管理员身份运行PowerShell。环境windows10 64位。安装成功打入choco。

2024-05-25 08:45:44 1037

原创 Muse论文精读

我们介绍了Muse,一个文本到图像的Transformer模型,它实现了最先进的图像生成性能,同时比扩散或自回归模型更有效。Muse是在离散标记空间中的掩码建模任务上进行训练的:给定从预训练的大型语言模型(LLM)中提取的文本嵌入,Muse被训练来预测随机掩码图像标记。与Imagen和dall - e2等像素空间扩散模型相比,Muse由于使用离散令牌和需要更少的采样迭代而显着提高了效率;与自回归模型(如Parti)相比,Muse由于使用并行解码而效率更高。

2024-05-15 08:10:26 860

原创 深度学习UNet网络

之后进行1024 到1024的中间层 实现起来也是进行两次卷积padding==1。UNet是一种分类网络架构,输入一张图片,网络进行分类是目标物体还是背景像素?上采样的过程上采样的过程需要进行转置卷积操作+xconv+copy操作。之后进行两个卷积操作,3*3的卷积核,只不过通道数发生改变其他不变。其次就是在进行复原的时候,我们要将高像素的特征进行赋值过来。每一次上采样,都是一个普通的转置卷积层和两个卷积层构成。此图上采样都是运用两次卷积操作,然后通道降维。接下来是上采样的过程,其本质也是一种反卷积。

2024-05-12 22:27:57 535

原创 pytorch单机多卡训练_数据并行DataParallel

单卡多级的模型训练,即并行训练,可分为数据并行和模型并行两种.数据并行是指,多张 GPUs 使用相同的模型副本,但采用不同 batch 的数据进行训练.模型并行是指,多张 GPUs 使用同一 batch 的数据,分别训练模型的不同部分.

2024-05-12 21:06:44 1551

原创 scala速通(精简版)

1.声明变量时,类型可以省略2.类型定义后就不能修改言3.变量声明必须有初始值4.变量,常量分别用var,val声明修饰。

2024-05-08 21:17:01 1000 3

原创 27_Scala功能函数

num => {0} else {1API使用groupby,传参传入的是一个函数对象类型传入指定标记,标记没有指定写法。

2024-05-08 21:15:01 543

原创 26_Scala集合常用API汇总

类比tail同理,init也可以迭代操作list_las.inits.inits //逐步的往前获取元素作者认为元素是一个一个添加的,所以真个集合来说,当最后一个元素进行添加操作,前面所有的元素相对于最终的集合为初始(init)集合;//此处这样理解学习语言时候,跟着作者思路思考是一种非常有效的学习方法;scala作者设计的方法有些是根据单词意思设计,有些是根据逻辑设计。

2024-05-07 14:08:59 2151

原创 25_Scala集合Tuple

Tuple3[Int,String,Boolean] 元组类型,3表示元素个数,后面[]装泛型–关于数据类型 Tuple3[Int,String,Boolean]等价于(Int,String,Boolean)–最大Tuple22 元素个数最多22个 函数式编程参数个数最多也是22个–Tuple集合限制是数据的个数,不限制数据的类型;//1.元组定义。

2024-05-07 14:05:44 555 1

原创 24_Scala集合Map

创建kv键值对 && kv键值对的表达。–创建immutable map。–创建mutable map。–默认immutable。–概念和Java一致。

2024-05-07 14:03:54 361

原创 23_Scala集合Set

Set是特质,不能直接构建,默认是不可变集合。–没有insert,append操作。–无序,数据不可重复集合。–需要根据包名进行区分。

2024-05-07 14:03:03 446

原创 22_Scala集合Seq

也就是将java.util.HashMap[String,String]起别名为JavaHashMap。scala中Seq是一个特质trait,无法直接构建对象,所以底层采用的是List集合。此类运算符都是表示集合从:端进行+操作。由于底层关系,上述两种写法都可以。起别名关键字type。

2024-05-07 14:02:27 597

原创 21_Scala集合_可变数组ArrayBuffer

Java中的remove操作和ArrayBuffer操作不同。–感觉优点类似于Java的ArrayList。–请注意下面的mutable。–同不可变数组Array。

2024-05-06 12:52:54 1011 1

原创 20_Scala集合_不可变数组Array

不可变数组Array,没有增删,所有的增删操作使用修改 替代。

2024-05-06 12:52:00 430

原创 19_Scala集合概述

原始数据:处理数据时,一般要从数据源获取数据,但是数据源的数据一般不能被改变,如果必须要改变,也是创建新的数据。3.Map 存储无序,存储KV键值对,KEY不重复,V可重复;StringBuilder可变字符串,很多方法就是改变其自身内容。1.Seq 存储有序数据可重复 类比 List。函数式编程语言更侧重集合本身提供的哪些功能;String不可变字符传,创建新的字符串。2.Set 存储无序数据不可重复。可变不可变集合区分 --> 根据包。scala与Java有所不同。不可变集合 & 可变集合。

2024-05-06 12:51:08 378 1

原创 18_Scala面向对象编程trait

trait Run{特质中的方法是抽象方法(模板)

2024-05-05 15:59:52 914

原创 17_Scala面向对象高阶功能

–和Java一样,权限protected , public.父类定义子类用 , 仅单继承(防止钻石问题歧义)–创建子类实例,scala会先加载父类构造器 得到person后执行子类构造器,得到stu–构造对象时,父类对象优于子类对象。且每创建一个实例,父类会初始化一次传值方式如上述两种封装就是将数据和数据操作放在一起3.抽象和Java一致,抽象方法就是被子类重写的,因此不需要定义方法体;3.2子类继承抽象类scala中抽象属性–抽象类中所有属性都可以不初始化值;–如果初始化值,var类型在子类

2024-05-05 11:49:53 971

原创 16_Scala面向对象编程_函数

反编译以后得到的是静态代码块直接实例化对象且仅有一份,私有化Instance方法,创建一个公共的本类型的私有化对象;类{}包的是函数体,甚至可以直接println,和Java类中五大成分不同。伴生对象中放的一般都是静态方法或属性或工具类,访问的话直接 类名.方法即可。如果给类传递任何参数,scala会默认抹杀掉任何构造方法仅保留一份构造方法,与类的声明一致;为了避免此情况,请尽可能将类放的远一点,以至于先定义 变量,后实例化对象赋值;一旦私有化,子类无法进行访问,原因是无法显示的调用父类构造器。

2024-05-05 11:48:12 1041

原创 15_Scala面向对象编程_访问权限

小结:同包下仅有public,private[指定当前包]等可以访问属性值。创建EMP类在User类隔壁,创建User实例,进行访问其属性;3.1在14_Scala访问权限隔壁创建包_14DemoTest。3.3写入下面代码,精确导入包User。小结:同类任何属性都可this访问。测试不同包下子类 权限使用情况。3.2创建Access对象。测试使用不同包下属性;

2024-05-05 11:44:39 558

原创 14_Scala面向对象编程_属性

​ --Java有Bean开发规范,为了和其他框架相集成,scala提供了一个注解,解决Bean规范的问题。scala由于初始化变量必须赋值,为了解决此问题可以采用下划线赋值,表示系统默认赋值 ,–此方法定义时 必须提供数据类型;–但是此方法局限于变量,而非常量。类的属性可以直接进行赋值操作;

2024-05-04 22:04:44 798 1

Tomcat Servlet阶段性总结思维导图

Tomcat Servlet阶段性总结思维导图

2024-05-28

Maven学习思维导图

1.免费提供,知识共享。 2.Maven思维导图,从基础到进阶全套流程。 3.适用人群,新手小白,大佬复习。 4.学习方法:小白看着思维导图从上至下,看我的Maven1 - 7系列文章,大佬直接拿着思维导图进行复习。 5.哪里不懂,评论区直接问,私信我,作者都在。

2024-04-23

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除