idiotyi-CSDN博客

llama-factory支持json格式文件，自定义数据集中每条数据格式如下：“prompt”: “介绍一下苹果”,“response”: “苹果公司（Apple Inc.），是一家美国跨国科技公司，总部位于加利福尼亚州库比蒂诺。"demo": {demo是映射后使用的数据集别名，file_name是数据集路径，file_sha1不是必需的，但是可以缓存预处理后的数据集，避免二次训练时重新预处理，sha1的生成可以通过终端运行shasum -a 1 filename（linux命令）

2024-08-08 16:22:08 704

原创【大模型】提示工程基础学习

即自动地为通过输出示例指定的任务生成指令：通过直接推理或基于语义相似性的递归过程生成几个候选指令，用目标模型执行它们，并根据计算出的评估分数选择最合适的指令。RAG 会接受输入并检索出一组相关/支撑的文档，并给出文档的来源（例如维基百科）。这些文档作为上下文和输入的原始提示词组合，送给文本生成器得到最终的输出。接下来是第二阶段的答案推断，它利用生成的理性信息。通过构建特定的提示语句，引导模型从已有的知识库中提取、整合并生成新的、有用的知识内容。手动添加的方式效果更好，但零样本的CoT更方便。

2024-07-09 11:27:52 575

原创【大模型】Vllm基础学习

vllm是一个大语言模型高速推理框架，旨在提高大模型的服务效率。优势是内存管理，实现的核心是pageattetion算法。仅在gpu上加速，不在cpu加速。

2024-06-26 16:21:21 690

原创【Linux】pycharm&git相关操作

在个人的github页面上点击【settings】->【developer settings】->【personal access tokens】-> 【tokens】->【generate new tokens】【vcs】-> 【checkout from version control】->【git】，输入http远程仓库地址，地址可以在github界面获取。pycharm界面【settings】 -> 【version control】 -> 【github】，使用github的账号密码登录。

2024-06-16 12:57:03 1286

原创【文献阅读】LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS

adapter-based的方法通常是利用一个MLP或者一个prefix-based方法，导致模型不允许长序列的输入。不同于adapter-based的方法，LORA是针对原始模型训练的。LORA微调时，我们可以通过设置r来达到恢复全量微调的效果。因为LORA在适应过程中不要求对权重矩阵的累积梯度更新具有完整的秩。这个缩放可以减小当r改变时，我们重新微调参数的需要。对于不同的下游任务，只用计算BA和其变化量的差值就可以了。对于A采用一个随机的高斯初始化，对于B采用0初始化。

2024-06-07 10:27:59 878

原创【大数据与云计算】虚拟机安装Linux

使用Linux系统对大数据学习必不可少，本文主要介绍虚拟机安装linux的流程。

2024-04-13 23:36:35 971

原创【springboot开发】Gradle VS Maven

AntMavenGradlegradle使用了Groovy作为配置文件，相较于maven的pom文件更加灵活Gradle和Maven都支持并行的项目构建和依赖解析。但是gradle的三个特点让gradle可以跑的比maven快上一点：增量构建构建缓存Gradle守护进程Gradle非常灵活，并且基于脚本。自定义构建将很容易在Gradle上完成。Gradle功能更强大。但是，有时候一个中小型的项目不需要它提供的大多数功能，则Maven可能就是最佳选择。

2024-04-10 11:53:04 1380

原创【springboot开发】PO、DTO等对象的基本概念

java是面向对象的，java开发中由于多层开发结构，涉及到各种类别的实体类。

2024-04-10 09:52:51 330

原创【springboot开发】MVC和SSM

关于MVC和SSM基本内容的梳理，以及两者之间的关系。

2024-04-10 00:10:40 1162

原创【Springboot开发】后端代码基础框架

主要介绍最基础的springboot开发架构。

2024-04-09 23:50:06 1026

原创【算法学习】高级班九

思路：设置一个窗口L到R，当还欠字符时，即all不为0时，R往右扩，更新欠债表{a,b,c}，当all为0时，记录此时index=L时，字符串长度，把L往右移，更新欠债表。思路：二维双向链表。每个词频构建一个桶，桶和桶之间双向链表，相同词频的数据放一个桶，并且桶内部还是双向链表。因为从H出发都不能走完一圈，H到尾部的点的油量一定>=0,那么H尾部的点的油不够走完一圈。要求时间复杂度O(1)，则不能遍历，也不能有序表（O（logN））从A出发，发现H是良好出发点，那么往后只用看点是否能接上H的头即可。

2023-08-11 22:09:04 211

原创【算法学习】高级班八

（1）i在from，则还在把1到i-1挪到to的步骤。（2）i在to，则在把i+1到L挪到to的状态。（3）i在other，-1，不存在。

2023-08-10 16:36:05 108

原创【算法学习】高级班七

沿着左孩子的右分支，（10，12，16）都小于18，因此他们的左孩子一定也小于18，但20大于18，因此舍弃这个分支。由公式可以依次类推下一个数字应该去的下标，但是有可能一组数字构成一个循环，而与别的数字不相交，即依次类推这样的做法最后得到了多个环。比如（2，6）和（3，6）有重复部分，不需要重复计算，dp[2][6] = dp[2][4]+dp[3][6]补充：如何做到一个数组的两部分交换位置，空间复杂度O（1）。（3）用上面的方法调整那8个数，然后剩下的重复步骤1到3。（1）求最接近的k，k=8。

2023-08-10 10:20:05 105

原创【算法学习】高级班六

从右上角开始往回推，发现0到7范围的答案来自1到7，说明index=10的位置等于index=0，依此类推。a. 先搞定i前面的字符，然后添一个和i一样的，即dp[i][j]=dp[i+1][j]+1。b. 先搞定j后面的字符，然后添一个和j一样的，即dp[i][j]=dp[i][j-1]+1。c. 若i=j，则dp[i][j]=dp[i+1][j-1]dp[i][j]表示i到j范围到底有多少种保留方案。画勾的可以两两配对一条船了，画叉的进一步分析。左边的叉可以两个一组，右边的只能一个一条船。

2023-08-08 19:21:25 90

原创【算法学习】高级班五

假设没有括号，设置一个int num和一个栈，遇到数字置num，遇到符号，把num和符号一起压栈，num清空。可以发现，如果没有缓存，（6，6）和（7，6）都需要多次计算。9=576，把576和下一个+一起压栈。或\时，栈中弹出两个元素做乘除，然后再压栈。如num=9且遇到+时，栈顶是。

2023-08-08 15:54:40 58

原创【算法学习】高级班4

解题思路：拿的时候让异或和变为0，那么下一个人不管怎么拿异或和都不是0，先手每次都可以让异或和重新为0。即谁先导致异或和=0出现，谁就会一直赢。将每个位置数组替换表达：如（2，5，6）变成（2，add, 6）和（5，del，6）使用两个有序表map1（统计最大高度和出现次数），map2（统计坐标位置和最大高度）最后map2中的就是轮廓线。

2023-08-06 11:15:08 55

原创【算法学习】高级班1

当kth<s时，第k大的数只可能出现在短数组或长数组的前k个数里面，因此求前k个数的上中位数就行了。求上中位数的方法是通过确定两个数组的中位数进行优化的。对于i位置，最优划分意味着一定是离i最近的能实现xor等于0的位置进行划分，假设划分k到i，若k不是最近的，中间还存在一个L，那么k到L和L到i可以形成两个划分。shorts[kth-l - 1]>=longs[l-1]代表longs中的所有数字在shorts可能是第k大的数字前面。k<短的数组长度时，答案位于两个数组的前k个数字中。

2023-08-06 09:58:28 56

原创【算法学习】中级班9

设一个二维dq数组，dp[i][j]表示str1[0…i]编辑成str[0…去掉天数增加，钱没有增加的。

2023-08-02 18:33:37 63

原创【算法学习】中级班8

贪心：对于任意.位置，如果i+1是x，则i位置放灯，若i+1是.则放i+1位置。使用hash表记录中序数组中每个数字的位置，不再需要遍历找find数字。4. 最长递增子序列问题。法二：O（logN）

2023-08-02 11:30:27 67

原创【算法学习】中级班六

解释：组成三角形要求x+y<=z，即最大的边长度大于等于其他两条边，对于任意i位置，只要i-2和i-1位置相加不大于i位置，则前面也肯定不大于，因此只要使f(i)=f(i-1)+f(i-2)事实上就是斐波那契数列，设F（i）表示长度为i时的达标字符串数，由定义知道，i位置的数字只能是1，则F(i) = F(i-1)+F(i-2)有序表：先按难度由小到大排，难度一样按照报酬由大到小。即求木棍中斐波那契数有哪些，就是可以保留的木棍。

2023-08-01 13:40:54 60

原创【算法学习】中级班五

6. 咖啡杯问题：arr代表冲咖啡的几台机器分别需要的时间，N代表喝咖啡的人数，a和b分别代表洗咖啡杯的时间和自然挥发干净的时间（要么一个个洗干净，要么自然变干净，前者只能串行后者可以并行）。当全局的max在左边时，右边最大值一定>=arr[N-1]，那么max|max左-max右|是划分在arr[N-1]处；设计一个小根堆，里面的每一个元素是一个二维的：（咖啡机空闲时间，咖啡机泡咖啡的时间），按照二维数字和组织小根堆。p2表示如果当前被子直接晾干，完成所有杯子清洗所需的时间。2的倍数但不是4的倍数b个；

2023-07-27 21:09:45 68

空空如也

空空如也