自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(87)
  • 收藏
  • 关注

原创 llm-universe | 五. 系统评估与优化

在构建LLM应用程序时,会经历以下流程:①少样本调整Prompt②Bad Case定向优化;③模型性能与开发成本的权衡2.评估方法在具体的大模型应用开发中,我们可以找到 Bad Cases,并不断针对性优化 Prompt 或检索架构来解决 Bad Cases,从而优化系统的表现。发现Bad Case并将每个Bad Case加入验证集。针对性调整对应的Prompt并检索架构。每次优化后重新验证整个验证集,确保原有Good Case不受影响。

2024-07-02 21:56:59 591

原创 llm-universe | 四. 构建RAG应用

Streamlit 是一种快速便捷的方法,可以直接在*Python 中通过友好的 Web 界面演示机器学习模型*。Streamlit 提供了一组简单而强大的基础模块,用于构建数据应用程序:st.write():这是最基本的模块之一,用于在应用程序中呈现文本、图像、表格等内容。st.title()、st.header()、st.subheader():这些模块用于添加标题、子标题和分组标题,以组织应用程序的布局。

2024-06-26 22:21:05 637

原创 llm-universe | 三. 搭建知识库

因此,在构建向量知识库的过程中,往往需要对文档进行分割,将单个文档按长度或者按固定的规则分割成若干个 chunk,然后将每个 chunk 转化为词向量,存储到向量数据库中。1.词向量比文字更适合检索。词向量中包含了原文本的语义信息,可以通过计算问题与数据库中数据的点积、余弦距离、欧几里得距离等指标,直接获取问题与数据在语义层面上的相似度;在检索时,我们会以 chunk 作为检索的元单位,也就是每一次检索到 k 个 chunk 作为模型可以参考来回答用户问题的知识,这个 k 是我们可以自由设定的。

2024-06-25 01:08:24 829

原创 llm-universe | 二. 使用 LLM API 开发应用

具体来说,在使用 ChatGPT API 时,你可以设置两种 Prompt:一种是 System Prompt,该种 Prompt 内容会在整个会话过程中持久地影响模型的回复,且相比于普通 Prompt 具有更高的重要性;Temperature 一般取值在 0~1 之间,当取值较低接近 0 时,预测的随机性会较低,产生更保守、可预测的文本,不太可能生成意想不到或不寻常的词。当取值较高接近 1 时,预测的随机性会较高,所有词被选择的可能性更大,会产生更有创意、多样化的文本,更有可能生成不寻常或意想不到的词。

2024-06-18 22:06:50 614

原创 llm-universe | 一. LLM 理论知识

大型语言模型(LLM)相较于传统的语言模型具有更强大的能力,然而在某些情况下,它们仍可能无法提供准确的答案。检索增强生成(RAG, Retrieval-Augmented Generation)。该架构巧妙地整合了从庞大知识库中检索到的相关信息,并以此为基础,指导大型语言模型生成更为精准的答案,从而显著提升了回答的准确性与深度。LangChain 框架是一个开源工具,充分利用了大型语言模型的强大能力,以便开发各种下游应用。它的目标是为各种大型语言模型应用提供通用接口,从而简化应用程序的开发流程。

2024-06-18 21:28:37 1262

原创 Llama3 | 六. Llama 3 能力评测(OpenCompass版)

Llama 3 近期重磅发布,发布了 8B 和 70B 参数量的模型,opencompass团队对 Llama 3 进行了评测!书生·浦语和机智流社区同学投稿了 OpenCompass 评测 Llama 3,欢迎 Star。

2024-05-19 20:38:57 464

原创 Llama3 | 四. LMDeploy 高效部署

安装lmdeploy最新版。

2024-05-19 20:22:19 1207

原创 Lama3 | 五.Llama 3 Agent 能力体验与微调

Lagent 的 Web Demo 来直观体验一下 Llama3 模型在 ReAct 范式下的智能体能力。我们让它使用 ArxivSearch 工具来搜索 InternLM2 的技术报告。

2024-05-19 20:01:10 511

原创 Llama 3 | 三.Llama 3 图片理解能力微调([XTuner](https://github.com/internLM/xtuner)+LLaVA 版)

问题2:What is the equipment in the image?问题1:Describe this image.30%的A100不够用,加上offload。训练报错,先安装deepspeed,重试。InternStudio软连接。

2024-05-18 00:42:16 330

原创 LLama3 | 二. Llama 3 微调个人小助手认知(XTuner版)

此时 Llama3 拥有了他是 SmartFlowAI 打造的人工智能助手的认知。

2024-05-18 00:29:01 320 1

原创 LLama3 | 一. 本地 Web Demo 部署

课程文档:Llama3-Tutorial/docs/hello_world.md at main · SmartFlowAI/Llama3-Tutorial · GitHub。

2024-05-18 00:27:08 408

原创 swin transformer 论文阅读

提出一个新的transformer,swin transfomer,可做为视觉领域一个通用的骨干网络。1.尺度问题,eg:街景场景,车、人有不同的尺寸2.图像分辨率太大:特征图、图像patch、图片画成小窗口窗口内做自注意力机制提出,特征通过移动窗口方式获得优点:1.更大效率,序列长度降低2.移动操作,相邻窗口可以交互。上下层之间,全局建模能力。层级式结构好处:提供各尺度特征信息;自注意力在小窗口计算,计算复杂度随图像大小线性增长。

2024-04-28 14:38:19 1095

原创 ps常用命令

ps常见命令

2024-04-10 23:18:34 207

原创 VIT论文阅读

vit论文阅读

2024-04-10 23:16:35 912

原创 三. Git分支管理

选择要保留的代码,然后再把>>>>>, ======, <<<<<<这些提示行给去掉。如果在运行了git merge之后又进行了一些人为的改动,那么在abort之后,所进行的改动也会被回滚掉。文件进行了修改,当我们将issue102分支融合到主分支上时就会发生冲突。在当前分支进行的工作合并到主分支上,我们需要切回需要合并到的分支上再进合并。当冲突所导致的改动量很大时,可以选择放弃该次的合并。git branch, 来查看现有的分支或创建新的分支。当我们需要推送本地分支到远程时,需要指定具体的本地分支。

2024-04-01 11:44:37 357

原创 二. Git基础命令

该命令将创建一个名为 .git 的子目录,这个子目录含有初始化的 Git 仓库中所有的必须文件,这些文件是 Git 仓库的骨干。可以通过 git add 命令来指定所需的文件来进行追踪,然后执行 git commit :克隆仓库的命令是 git clone 。 比如,要克隆 Git 的链接库 libgit2,可以用下面的命令:如果你想在克隆远程仓库的时候,自定义本地仓库的名字,你可以通过额外的参数指定新的目录名:2. 记录每次更新到仓库2.1 检查当前文件状态git status 命令查看哪些文

2024-04-01 11:14:21 1801

原创 一.Git环境

当我们安装好Git后,还需要在Git bash或者terminal进行一些相关设置,以下设置仅需设置一次即可。除此之外,Git还有很多设置,包括常用编辑器等,大家可以键入以下命令查看自己的设置并进行修改。

2024-03-30 22:51:13 523

原创 Transformer论文阅读

​ 主流序列转录模型使用rnn或cnn,使用encoder和decoder,在好的模型中通常也会使用注意力机制。本文提出一个简单的架构,仅仅依赖注意力机制,并行度更好,训练更快。在机器翻译上结果很好。

2024-03-30 22:42:21 1052

原创 docker、docker-compose安装

如果直接用apt来安装docker,不会是最新版的,所以参考官方文档来安装最新版的docker(https://docs.docker.com/install/linux/docker-ce/ubuntu/)$(-cs。

2024-03-28 21:55:41 693

原创 Linux下opencv环境配置

(1)更新下环境(2)安装编译器和构建工具等,若已安装,跳过即可(3)安装各种依赖库安装依赖库libjasper1 和 libjasper-dev时,若报错E:Unable to locate package libjasper-dev ,可以命令行执行以下命令,然后再安装依赖库 libjasper1 libjasper-dev可以在,也可以使用GitHub,这里选择git clone方式,下载的opencv文件夹在home目录下。

2024-03-28 21:53:10 1224

原创 vscode c++环境配置

如果你想更多地控制 C/C++ 扩展,你可以创建一个 c_cpp_properties.json 文件,它允许你更改设置,例如编译器的路径、包含路径、C++ 标准(默认为 C++17),等等。当然也可以在Explorer视图中新建文件,将下面代码复制进去,手动生成tasks.json,教程后面的配置文件也均可这样生成。在.vscode下创建tasks.json文件,它的作用是告诉 VS Code 如何构建(编译)程序,将调用 g++编译器从源代码创建一个可执行文件。将自动生成launch.json文件。

2024-03-27 21:02:39 1428

原创 Milvus+ATTU环境搭建

下载安装单机版milvus向量数据库 https://milvus.io/docs/install_standalone-docker.md。

2024-03-27 20:57:25 964

原创 算法记录 | Day60 单调栈

这道题和接雨水是呼应的,接雨水找的是两边第一个大于它高度的柱子,这道题是找两边第一个小于它高度的下标。这就导致在这题中单调栈的顺序是从大到小的。

2023-05-13 22:32:56 244 1

原创 算法记录 | Day59 单调栈

【代码】算法记录 | Day59 单调栈。

2023-05-12 13:25:59 419

原创 算法记录 | Day58 单调栈

思路:1.首先,将答案数组ans全部赋值为 0。然后遍历数组每个位置元素。2.如果栈为空,则将当前元素的下标入栈。3.如果栈不为空,且当前数字大于栈顶元素对应数字,则栈顶元素出栈,并计算下标差。4.此时当前元素就是栈顶元素的下一个更高值,将其下标差存入答案数组ans中保存起来,判断栈顶元素。5.直到当前数字小于或等于栈顶元素,则停止出栈,将当前元素下标入栈。6.最后输出答案数组ans。

2023-05-11 22:16:10 358

原创 算法记录 | Day57 动态规划

确定dp数组(dp table)以及下标的含义确定递推公式dp数组如何初始化确定遍历顺序举例推导dp数组。

2023-05-10 23:36:15 581

原创 算法记录 | Day56 动态规划

思路:dp[i][j]:以i-1为结尾的字符串word1,和以j-1位结尾的字符串word2,想要达到相等,所需要删除元素的最少次数2.递推公式:3.初始化:从递推公式中,可以看出来,dp[i][0]和dp[0][j]是一定要初始化的。dp[i][0]:word2为空字符串,以i-1为结尾的字符串word1要删除多少个元素,才能和word2相同呢,很明显。。4.确定遍历顺序从递推公式和中可以看出dp[i][j]都是根据左上方和正上方推出来的。从上到下,从左到右5.举例推导dp数组。

2023-05-09 17:33:39 632

原创 算法记录 | Day55 动态规划

思路:dp[i][j]dp[i][j]。dp[i][j]3.dp数组如何初始化:从递推公式可以看出dp[i][j]都是依赖于和,所以dp[0][0]和dp[i][0]是一定要初始化的。4.遍历顺序同理从递推公式可以看出dp[i][j]都是依赖于和[j - 1],那么遍历顺序也应该是从上到下,从左到右如图所示:5.举例推导dp数组。

2023-05-08 22:28:49 369

原创 算法记录 | Day53 动态规划

思路:本题和区别在于这里不要求是连续的了,但要有相对顺序,即:“ace” 是 “abcde” 的子序列,但 “aec” 不是 “abcde” 的子序列。1.确定dp数组(dp table)以及下标的含义dp[i][j]:长度为[0, i - 1]的字符串text1与长度为[0, j - 1]的字符串text2的最长公共子序列为dp[i][j]2.确定dp数组(dp table)以及下标的含义dp[i][j]

2023-05-07 18:34:43 470

原创 算法记录 | Day52 动态规划

思路:1.dp[i]的定义:以 nums[i] 结尾的最长递增子序列长度。2.状态转移方程:位置i的最长升序子序列等于j从0到i-1各个位置的最长升序子序列 + 1 的最大值。。3.初始化:每一个i,对应的dp[i](即最长递增子序列)起始大小至少都是14.遍历顺序:dp[i] 是有0到i-1各个位置的最长递增子序列 推导而来,那么遍历i一定是从。,那么是从前到后,还是从后到前遍历都无所谓,只要吧 0 到 i-1 的元素都遍历了就行了。所以默认习惯从前向后遍历。5.举例推导dp数组。

2023-05-05 21:06:42 365

原创 算法记录 | Day51 动态规划

思路:dp[i][j],表示为:第i天第j种情况()下,所获取的最大利润。在买入状态中,今日买入和之前买入的状态其实可以看做是股票的持有状态,可以将其合并为一种状态。在卖出状态中,昨天卖出和之前卖出的状态其实可以看做是无股票并度过了冷冻期状态,可以将其合并为一种状态。3.初始化:可以很明显看出第一天不做任何操作就是,第一次买入就是。第一次卖出的话,可以视作为没有盈利(当天买卖,价格没有变化),即。第二次买入的话,就是。同理第二次卖出就是。

2023-05-04 19:54:44 379

原创 算法记录 | Day50 动态规划

思路:1.确定dp数组以及下标的含义最多可完成两笔交易意味着总共有三种情况:买卖一次,买卖两次,不买卖。所以我们可以定义状态dp[i][j],表示为:第i天第j种情况()下,所获取的最大利润。2.确定递推公式3.dp数组如何初始化:第0天做第一次买入的操作,第一次卖出的话,可以视作为没有盈利(当天买卖,价格没有变化),即。第二次买入的话,就是。同理第二次卖出就是。4.确定遍历顺序从递归公式其实已经可以看出,一定是从前向后遍历,因为dp[i],依靠dp[i - 1]的数值。

2023-05-04 18:05:53 591

原创 算法记录 | Day49 动态规划

状态方程dpi0表示第i天交易完后,手上没有股票时的最大利润,dpi1表示第i天交易完后,手上持有股票时的最大利润。​dpi0maxdpi−10dpi−11pricesi])dpi1maxdpi−11−pricesi])​如果第i天不持有股票即dp[i] [0], 也可以由两个状态推出来。

2023-05-03 00:04:15 477

原创 算法记录 | 48 动态规划

思路:i间房屋的最后一个房子是nums[i−1]。如果房屋数大于等于 2 间,则偷窃第 i−1 间房屋的时候,就有两种状态:偷窃第 i−1 间房屋,那么第 i-2 间房屋就不能偷窃了,偷窃的最高金额为:前 i−2 间房屋的最高总金额 + 第 i−1 间房屋的金额,即 dp[i]=dp[i−2]+nums[i-1];不偷窃第 i−1 间房屋,那么第 i−2 间房屋可以偷窃,偷窃的最高金额为:前 i−1 间房屋的最高总金额,即 dp[i]=dp[i−1]。

2023-05-02 00:19:33 918

原创 算法记录 | Day46 动态规划

确定dp数组(dp table)以及下标的含义确定递推公式dp数组如何初始化确定遍历顺序举例推导dp数组。

2023-04-30 00:44:37 717

原创 算法记录 | Day45 动态规划

1阶,2阶,… m阶就是物品,楼顶就是背包。每一阶可以重复使用,例如跳了1阶,还可以继续跳1阶。问跳到楼顶有几种方法其实就是问装满背包有几种方法。1.确定dp数组以及下标的含义:dp[i]:爬到有i个台阶的楼顶,有dp[i]种方法。2.确定递推公式:dp[i] += dp[i - j]dp[i]有几种来源,dp[i - 1],dp[i - 2],dp[i - 3] 等等,即:dp[i - j]3.dp数组如何初始化:dp[0]=1。

2023-04-29 00:29:57 776

原创 算法记录 | Day44 动态规划

有N件物品和一个最多能背重量为W的背包。第i件物品的重量是weight[i],得到的价值是value[i]。,求解将哪些物品装入背包里物品价值总和最大。。完全背包的物品是可以添加多次的,所以要从小到大去遍历。

2023-04-28 00:02:56 476

原创 算法记录 | Day43 动态规划

思路:本题其实就是尽量让石头分成重量相同的两堆,相撞之后剩下的石头最小,。本题物品的重量为stones[i],物品的价值也为stones[i]。对应着01背包里的物品重量weight[i]和 物品价值value[i]。1.确定dp数组以及下标的含义:dp[j]将石头放入载重上限为 j 的背包中可以获得的最大价值。3.dp数组如何初始化:01背包,一维dp初始化,dp[0] =0。

2023-04-26 23:24:13 387

原创 算法记录 | Day42 动态规划

有n件物品和一个最多能背重量为w 的背包。第i件物品的重量是weight[i],得到的价值是value[i]。,求解将哪些物品装入背包里物品价值总和最大。**0-1 背包问题的特点:**每种物品有且仅有 1 件,可以选择不放入背包,也可以选择放入背包。

2023-04-25 23:21:06 328

原创 算法训练 | Day41动态规划

思路:确定dp数组(dp table)以及下标的含义:dp[i]:分拆数字i,可以得到的最大乘积为dp[i]。确定递推公式:dp[i] = max(dp[i], max((i - j) * j, dp[i - j] * j))可以想 dp[i]最大乘积是怎么得到的呢?其实可以从1遍历j,然后有两种渠道得到dp[i].一个是j * (i - j) 直接相乘。一个是j * dp[i - j],相当于是拆分(i - j)。dp数组如何初始化:dp[0] dp[1] 不应该初始化,没有意义的数值。

2023-04-24 22:37:42 430

python小游戏, 游戏玩法(游戏中的游戏帮助未能实现): 1.创建存档:只能采用英文输入法输入存档 2.删除存档:在查看存

游戏玩法(游戏中的游戏帮助未能实现): 1.创建存档:只能采用英文输入法输入存档 2.删除存档:在查看存档处鼠标右键单击要删除的存档,点击确定后删除 3.攻击:没有打开宝箱、商店等情况下,鼠标点击有效区域(背包区域不算)进行攻击,攻击时需要装备武器 4.连续点击两次物品查看物品详情,装备的使用也在此页面 5.装有武器的情况下可以使用滚轮切换武器 6.物品移动可以根据物品详情界面点击进行移动,也可以通过直接拖动进行移动(拖动仅限于背包和宝箱) 7.与楼梯、宝箱、NPC、商人的交互:与要交互的对象接触时按下空格键进行交互 8.开门:靠近要打开的门并用鼠标左键点击门,有钥匙的情况下会消耗钥匙开门 9.角色移动使用w、a、s、d四个键

2024-03-31

labelme标签工具 exe格式

labelme标签工具 exe格式

2024-03-30

prompt-to-prompt-main

prompt-to-prompt-main

2024-03-29

stable-diffusion-webui-master

stable-diffusion-webui-master

2024-03-29

yolov8 pyqt6可视化界面

yolov8 pyqt6可视化界面,实现语言分割、目标检测 、关键点检测

2024-03-22

efficientunet

efficientunet

2024-02-20

Vary-toy-main

Vary-toy-main

2024-02-20

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除