自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(81)
  • 问答 (1)
  • 收藏
  • 关注

原创 Stable diffusion(四)

因为自己练出的Lora实在太丑,愤而不写了。不如用别人的。

2024-03-24 10:50:28 619

原创 Stable diffusion(二)

底模:不同的数据集训练出来的模型效果不同。有的是卡通风、有的是现实风。可以类比于GPT,用什么文案训练,对于改文案的语言通用能力就越强。VAE:用于将图片压缩到潜在空间的组件,这里没有出现。采样器:用于调整迭代次数和迭代数的组合组件。不同的策略,不同结果有些时候,会选择词向量/图向量的倒数第二层来作为输入。CFG Scale:Classifier-Free Guidance scale,控制了提示词的参数。通常设置在7~9附近。图像生成种子/Seed:-1代表使用随机数。

2024-03-10 21:58:50 1043

原创 Stable diffusion(一)

Stable diffusion 原理解读名词解释正向扩散(Fixed Forward Diffusion Process):反向扩散(Generative Reverse Denoising Process)VAE(Variational AutoEncoder):一个用于压缩图片的神经网络,按照我的理解,通过这个模组的图片/文本,将被映射更加精确的向量。Latent Space(潜变量空间):被VAE压缩/升维后的向量。Unet:一个用来预测噪声的图像分割模型CLIP:Tokenize

2024-03-10 12:18:30 340

原创 Git学习之旅

在进入字节实习之后,发现很多很基础的东西都没搞懂。准备五月中旬或者五月底去上班,现在开始准备这些东西,希望进入公司能快速上手业务。

2023-03-12 21:46:34 383 2

原创 重学Attention

注意力机制对比RNN主要解决了RNN无法并行,并且不能解决长序列依赖问题所以为什么设计Q K V这三个矩阵 一边来是让 K == V的首先通过Q 和 K点击计算Attention矩阵,这个矩阵表明的是V上每一个特征与Q的相关程度,相关程度高的,权重就大一点,相关程度低的权重就低一点自注意力的Q K V来来源相同自注意力的创新性在这里就完美的体现出来了,同一句话,哪些词对making的作用就体现出来了对吧。

2023-01-21 19:53:07 738

原创 词向量与语言模型

本篇博客是对于的归纳先来了解一下什么是预训练预训练的概念开始存在于图片领域如果有一个比较大的模型,训练了各式各样的图片,他的约浅层拥有一个越通用的特征。而深层拥有比较特殊的特征。浅层的特征可以通用,深层的特征不能通用。因此诞生了两种使用这种浅层参数的方法,分别是。

2023-01-21 18:58:50 864

原创 一些场景题

1/21/21/2。

2022-11-07 00:23:05 280

原创 查漏补缺第一弹

驱蚊器翁无

2022-10-25 00:49:19 481

原创 SQL学习分享

因为B+树的非叶子节点只用于存储索引,所以B+树的索引能更多,因而B+树可以比B树更加矮胖,查询底层节点I/O次数可以更少。事务A:看到事务B修改后的数据,然而这个事务B回滚了,事务A看到的数据就是脏数据,基于这个脏数据做数据加工就会出现问题。不可重复读:事务A在执行过程中,事务B提交了,那事务A两次查询的数据可能不一致,这就导致了不可重复度的问题。B+Tree 是一种多叉树,叶子节点才存放数据,非叶子节点只存放索引,而且每个节点里的数据是按主键顺序存放的。众所周知,mysql底层用的是B+树做索引的。

2022-09-23 12:55:59 514

原创 设计模式学习分享

优点:单例模式可以保证内存里只有一个实例,减少了内存的开销。缺点:单例模式一般没有接口,扩展困难。如果要扩展,则除了修改原来的代码,没有第二种途径,违背开闭原则。开闭原则:对于扩展时支持的,对于修改(尤其是修改源代码)是封闭的。

2022-09-23 10:27:57 120

原创 Spring学习分享

问题描述:Spring在启动的时候要初始化对象。而A依赖B的同时,B也依赖A。- 最后发布就绪事件ApplicationReadyEvent,标志着SpringBoot可以处理就收的请求了(running())解决方法:懒加载,在Spring中,有被用到才加载被称为懒加载。- 启动一个计时器,来记录springboot启动所花费的时间。- 执行run方法的时候主要执行这样几个动作。- 初始化一个监听器,去监听run方法的执行。- 初始化Arugument和环境变量。- 监听器表明启动完成,计时器关闭。

2022-09-22 22:05:35 186

原创 java学习分享

本文是为了秋招准备,主要以点和面的形式进行复习。(小知识用点,多一点的将以面的形式展示)。

2022-09-22 16:21:46 928

原创 Thrift/RPC学习分享

一个完整RPC调用链路。

2022-09-20 14:42:34 1222

原创 MQ学习总结

消费顺序RocketMq是如何保证顺序消费的。在生产端保证消息只能传送到一个队列中去。可以通过hash一致性算法等(比如一个订单编号的消息,通过hash一致性算法发到一个队列上去)在消费者端,保证在消费这个消息的时候,通过加分布式锁和本地锁保证同时只有一条线程去消费一个队列上的数据RocketMq的负载均衡机制:RocketMq的负载均衡机制一般只在client端保持,分为发送消息的负载均衡和消费消息的负载均衡。发送端的负载均衡。

2022-09-20 14:24:42 395

原创 动态规划学习总结

动态规划学习总结01背包二维数组表示01背包。这个很好理解 public static void testweightbagproblem(int[] weight,int[] value,int bagsize){ int dp_x = weight.length;// weight.length表示的是有几个物品对吗。weight+1是把0这个情况包含进去的 int dp_y = bagsize+1;//y表示0-bagsize,也是把0这个情况包含进去了

2022-08-22 22:47:45 124

原创 计算机网络八股文复习

学习

2022-08-18 09:34:43 906

原创 CAP和BASE和Raft算法

CAPCAP的三个字母分别代表Consistency(一致性):同时访问一个最新的副本数据Availability(可用性):非故障节点在合理时间返回合理相应Partition Tolerance(分区容错性):分布式网络的一部分出现问题,依旧能够对外提供服务现在定义只能支持CP或者AP架构,CA架构不能支持。CP可能在银行比较吃香为什么CA不能支持,you say why?当节点出现故障,理论上要终止读写功能,因为要保证一致性,这个时候可用性A就不能保证了。Base理论核心思想是CAP理

2022-03-19 19:14:46 421

原创 Mysql的复习

Mysql的复习Mysql数据库的引擎Mysq的引擎分为MyISAM和InnoDB1. 如果要保证高性能的话,还是InnoDB更好。2. MyISAM最大的却显示崩溃后无法安全恢复3. InnoDB支持支持行级别锁,而MyISAM只能支持表级别的锁。4. InnoDB支持事务,而MyISAM不支持事务。5. InooDB支持MVCC,而MyISAM不支持浅谈一下MVCCMVCC是多版本并发控制。当有很多线程访问数据的时候,如果读的操作比写的操作多很多,那么还是严格加锁,那么并发程度就会很低

2022-03-19 09:35:45 837

原创 排序算法汇总

排序算法汇总1. 插入排序思路:假定第一个元素组成的序列是有序的,后面的元素不断往这个有序的序列中插入 public static void insertSort(int[] arr){ for(int i = 1;i<arr.length;i++){ int index = i -1; int current = arr[i]; while(index >=0 && curre

2022-03-17 14:41:47 1056

原创 字节面经(已成功了)

第一面(感觉没有第二面了,歪日)3.10 1h双方自我介绍,面试官(人很好,温和有耐心面对我这种蠢逼也没有表现得他觉得我很蠢。)先介绍了一下他的部门负责的内容。大体上就是广告主投放广告上有一些金钱上的来往,负责处理这一块业务。然后问了我第一个问题:Q:我来实习是抱着什么样的目标来实习的,比如说是想要一份实习经历,对他这个部门负责的内容感不感兴趣啥的。A:我研一准备走大数据方向,就是haddop,spark这种,所以对数据这方面很感兴趣,以后可能想走后端和大数据一起学习这样的部门。他回复:这个部门

2022-03-15 22:42:55 2800

原创 回溯算法复习总结

敲响警钟之回溯算法真的很重要ballball了看看他首先要明白所谓的回溯算法其实本质上就是递归的衍生,其实就是dfs看一下回溯算法的模板void backtracking(参数待定){ if(设置终止条件){ //设置所谓的终止条件,就是设置一个条件,当判断已经到达叶子结点之后应该进行如何的操作. xx.add(); return; } for(){ //这个for也是经典,会在这里遍历剩余集合的节点,有什么节点我们可以看着来 }}77.组合...

2022-03-14 21:03:10 2582

原创 Mybatis

Mybatis常见面试题总结#{} 和 ${}的区别是什么#{}是在xml文件中的占位符${}是properties文件中的占位符mysql其实就封装了很多jdbc的操作,与JDBC比少了很多代码。xml映射文件中除了常见的select|insert|update|delete标签外还有那些标签<resultmap<sql通常一个xml映射文件都会写一个Dao接口阈值对应,这个Dao接口的工作原理是什么。参数不同的方法能重载吗。这个Dao接口也就是Mapper接口

2022-03-10 09:29:39 68

原创 Redis

Redis什么是RedisRedis是一个用C语言开发的数据库,不过它是运行在内存上的,所以读写很快。Redis的应用场景分布式锁消息队列缓存它的竞争对手Memcached两者都给予内存两者都有过期策略两者的性能都比较高Redis支持更复杂的数据类型 list、set、zset、hash、bimapRedis有灾难恢复机制Redis是单线程的数据类型Stringset key valueget keyexistsstrlendell

2022-03-09 16:00:58 360

原创 Java复习总结

面向过程和面向对象我个人觉得是这样:面向过程是程序员设定好了程序执行的步骤,计算机去一条一条执行。而面向对象是程序员先做一个对象出来,然后告诉对象做什么。区别:面向对象的效率低一点,但是代码维护容易,可读性高面向过程的效率高一点,但是代码维护不易,可读性低Java的语言特点继承封装多态(存在的条件是继承,重写。子类重写了父类的方法线程安全面向对象编译解释共存JDK、JVM、JREJRE = 运行环境JDK是一个开发环境+运行环境JVM帮助Java实现跨平台JAVA和C

2022-03-08 17:19:22 235

原创 Spring复习

IOC AOPIOC 控制反转,这个是一个思想,Spring中使用依赖注入来完成思想:把控制对象的权利交给程序员原本是在main函数中 new一个对象在Spring中,是声明一个对象,然后通过IOC容器把,这个对象赋值,我们通过配置文件控制IOC容器AOP切面变成。我的理解就是功能增强,相当于包装,在不改动原有功能的情况下,给他套上新的功能,常见的Cglib和JDK动态代理Beanbean表示的是被IOC管理的对象通过配置文件来管理<bean id="..." class="...

2022-03-04 21:38:54 290

原创 数据库复习总结(一)

数据库复习总结基本概念元祖:元组就是一行码:就是属性,对应一列候选码:能唯一标识实体的主码:主键,唯一标识一个元祖,不能为空,一个表只能有一个主键。外码:外检,一个关系中的某一个属性是其他关系中的主键使用外键就可以使用级联操作减少代码量。ER图一般使用ER图来厘清数据库的关系。数据库范式1NF(第一范式)属性不能再被分割了2NF(第二范式)简单来说,对于一个用一个主键在这个属性中只能对应一个值在2NF的基础上 3NF 不能存在其他的依赖关系,只能有主键依赖关系drop del

2022-03-04 20:33:48 508

原创 Kafka学习笔记

Kafka学习笔记安装省略linux下面的安装就简单的尼玛离谱zooker.config改一下开放一下kafka的端口就okKafka运作的方法论首先要明白什么是消息队列。信息的传递一定有发送方和接收方发送方和接收方如果同步接受消息会带来很多不便,比如,发送方和接收方不一定同时有空,如果能有一个中间的人,存也在这个人里面存,出也是这个人出,那就方便很多了。消息中间件应运而生。消息队列有很多模式点对点模式点对点的特点:一个producer产生的消息只被一个consumer消费消

2022-01-24 13:04:19 1355

原创 操作系统复习总结

操作系统复习总结什么是os从用户的角度看呢,os是用户和硬件系统的借口。从资源管理角度看,os是资源的管理者。从虚拟机角度看,os是一组命令os到底是干啥的os是程序的集合,管理资源(处理器资源,存储器资源,文件管理,内存管理等等)操作系统的四大特性并发性:(多个事件在同一个时间间隔内发生)共享:(互斥共享和同时共享):临界资源只允许一个进程在这段时间访问,和多个进程可以同时访问。虚拟:把一个物理实体,变成若干个逻辑实体。异步:进程的推进顺序是不可预知的。因为竞争资源的存

2022-01-18 16:16:21 1317

原创 双指针技巧总结

双指针大体有两个种。一种是前后双指针:头尾开始遍历一种是快慢双指针:一前一后27 移除元素 public int removeElement(int[] nums, int val) { int left = 0; for(int right = 0;right < nums.length;right++){ if(nums[right] != val) nums[left++] = nums[right]; }

2022-01-17 15:51:48 335

原创 刷题的一个小总结

刷题的一个小总结前言:多刷刷题,其实很多题目看似类型不同,实则都是用一个方法解决的。我举个例子,很多字符串的题目本质上和数组的题目有什么区别呢。本质上还是考察对于边界,对于顺序,交换这些问题。数组总结解决数组问题的方法二分法:应用在有序数组中,且这个有序数组没有重复值。双指针(这个方法真的应用很广泛!):用一句话概括双指针法:通过两个指针:快指针和慢指针,在一个for循环下面完成两个for循环的工作。可以说慢指针和快指针可以解决很多问题!滑动窗口:数组的另外一个思想:它的精妙之处在于,根据当前

2022-01-14 10:26:36 110

原创 哈希表刷题总结

哈希表刷题总结基础知识哈希表提供了一个操作。fun(element) = index。它提供了一个操作,使得可以直接通过元素本身查找到唯一的索引。哈希表解决的问题。一般哈希表都是用来快速判断一个元素是否出现在集合里。哈希函数就是做这个映射的。通过HashCode(element) % tablesize 得出Index。但是不好的哈希函数,或者相对于元素数量,表太小会带来哈希碰撞。这个时候可以用线性探测法(就是再通过一个函数映射到其他位置),或者拉链法(List这个形式)242 有效的字母异位词

2022-01-13 16:13:15 189

原创 链表刷题总结

链表刷题总结总结就是,给我好好用头结点!!!虚拟头结点十分,肥肠之关键。203 移除链表元素 以这道题为例,我们来看看头结点是如何使用的在没有使用头结点的情况下 public ListNode removeElements(ListNode head, int val) { while (head != null && head.val == val) head = head.next; ListNode cur = head;

2022-01-10 21:29:17 257

原创 数组刷题总结

二分查找最基础的二分查找 public int search(int[] nums, int target) { int m = 0; int n = nums.length - 1; while(m <= n){ int middle = (n+m) / 2; if(nums[middle] == target) return middle; if(nums[middl

2022-01-10 13:07:56 221

原创 二叉树刷题总结

二叉树刷题总结(一)二叉树的基础满二叉树,二叉树节点满足,2的N次方-1的树完全二叉树,除了最底层节点可能没填满外,其余每层节点数都达到最大值,并且最下面一层的节点都集中在该层最左边的若干位置。二叉搜索树左子树不空,则左子树的每一个节点小于根节点右子树不空,则右子树的每一个节点大于根节点左子树与右子树都满足二叉搜索树的概念平衡二叉搜索树:在二叉搜索树的技术上,增加一条,左子树右子树高度差不超过1。二叉树的定义public class TreeNode { int val

2022-01-08 20:10:56 884

原创 计算机网络(计算机网络真的比我想的重要太多了)

计算机网络OSI TCP/IP各层的机构和功能OSI七层协议TCP/IP四层协议这种的五层协议应用层:通过应用进程交互来完成特定的网络应用,不同的网络应用有很多比如HTTP协议,SMTP协议等。HTTP协议提供了一种发布和接受HTML的方法DNS域名协议运输层:运输层的主要任务就是负责向两台主机进程之间的通信提供通用的数据传输服务。常见的TCP与UDP就是发生在这一层的是重点问题网络层:在计算机网络中,会经过很多个数据链路,选择合适的节点,选择合适的数据链路,就是网络

2022-01-04 21:35:20 797

原创 Java基础

基础部分面向对象和面向过程的差别面向过程:面向过程的性能比面向对象的性能高(参考C与Java的区别)。面向对象:代码可读性高,容易维护,容易扩展。Java语言的特点多态封装面向对象线程安全网络编程比较方便(面向业务端)可靠性安全性编译与解释共存JDK、JRE、JVM在我的视角JVM就是帮助实现跨平台的,Java的字节码虚拟机JDK是开发者工具,拥有JRE拥有的一切JRE是Java的运行环境Java和C++的区别面向对象Java没有指针,C++有指针,相对来说说Ja

2022-01-04 20:58:32 230

原创 为了小论文之跟着李沐学AI(二十一)

学习一下数据的预处理d2l.DATA_HUB['fra-eng'] = (d2l.DATA_URL + 'fra-eng.zip', '94646ad1522d915e7b0f9296181140edcf86a4f5')#@savedef read_data_nmt(): """载入“英语-法语”数据集。""" data_dir = d2l.download_extract('fra-eng') with open(os.

2021-11-20 16:46:10 843

原创 为了小论文之跟着李沐学AI(二十)

Encoder和Decoder其实现在发现其实LSTM,GRU就是一个Encoder和Decoder的例子。我们把最后的全链接层想象成解码前,前面的RNN网络想象成编码器。是不是有那味儿了。class Encoder(nn.Module): """编码器-解码器结构的基本编码器接口。""" def __init__(self, **kwargs): super(Encoder, self).__init__(**kwargs) def forward(self,

2021-11-19 21:50:01 3185

转载 为了小论文之Embedding

Embedding李沐老师没有Embdding相关的,我来补充一下8https://www.jianshu.com/p/63e7acc5e890 主要还是参考这一篇文章,写的真的太好了。我直接照着打,顺便加深理解torch.nn.Embedding(num_embeddings, embedding_dim, padding_idx=None,max_norm=None, norm_type=2.0, scale_grad_by_freq=False, sparse=False, _weigh

2021-11-19 20:16:59 390

原创 为了小论文之跟着李沐学AI(十九)

GRU原理说白了就是,控制,什么时候当前信息比较重要而历史信息不重要,什么时候当前信息不重要历史信息不重要,LSTM GRU都是这么一个套路,没什么好说的门GRU中有两个门,重置门和更新门。说是门,那是比较硬的说法, 本质上他们是一个(0-1)的向量,十用的是sigmod函数,是比较软的其实说来说去还是对隐藏状态动手脚这四个公式写出来就完事了具体怎么写def gru(inputs, state, params): W_xz, W_hz, b_z, W_xr, W_hr, b_r,

2021-11-19 15:34:57 503

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除