自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(36)
  • 收藏
  • 关注

原创 【书生大模型实战营(暑假场)】进阶任务六 MindSearch CPU-only 版部署

MindSearch 部署到Github Codespace 和 Hugging Face Space。

2024-08-29 02:32:43 1012

原创 【书生大模型实战营(暑假场)】进阶任务五 茴香豆:企业级知识库问答工具

茴香豆是由书生·浦语团队开发的一款开源、专门针对国内企业级使用场景设计并优化的知识问答工具。在基础 RAG 课程中我们了解到,RAG 可以有效的帮助提高 LLM 知识检索的相关性、实时性,同时避免 LLM 训练带来的巨大成本。在实际的生产和生活环境需求,对 RAG 系统的开发、部署和调优的挑战更大,如需要解决群应答、能够无关问题拒答、多渠道应答、更高的安全性挑战。因此,根据大量国内用户的实际需求,总结出了三阶段Pipeline的茴香豆知识问答助手架构,帮助企业级用户可以快速上手安装部署。

2024-08-28 22:47:22 745

原创 【书生大模型实战营(暑假场)】进阶任务四 InternVL 多模态模型部署微调实践

InternVL 是一种用于多模态任务的深度学习模型,旨在处理和理解多种类型的数据输入,如图像和文本。它结合了视觉和语言模型,能够执行复杂的跨模态任务,比如图文匹配、图像描述生成等。通过整合视觉特征和语言信息,InternVL 可以在多模态领域取得更好的表现InternVL的 vision模块是一个微调过的 ViT,LLM 模块是一个 InternLM 的模型。对于视觉模块来说,它的特殊之处在 Dynamic High Resolution 动态高分辨率。

2024-08-28 05:24:16 728

原创 【书生大模型实战营(暑假场)】进阶任务三 LMDeploy 量化部署实践闯关任务

和。

2024-08-27 23:19:43 996

原创 【书生大模型实战营(暑假场)】进阶任务二 Lagent 自定义你的 Agent 智能体

Lagent动作。继承 BaseAction 类实现简单工具的 run 方法;或者实现工具包内每个子工具的功能简单工具的 run 方法可选被 tool_api 装饰;工具包内每个子工具的功能都需要被 tool_api 装饰下面实现一个调用 MagicMaker API 的 Agent 动作/工具以完成文生图的功能。

2024-08-22 23:56:31 800

原创 【书生大模型实战营(暑假场)】基础任务五 OpenCompass 评测 InternLM-1.8B 实践

由于 OpenCompass 默认并行启动评估过程,我们可以在第一次运行时以 --debug 模式启动评估,并检查是否存在问题。在 --debug 模式下,任务将按顺序执行,并实时打印输出。下面将使用 OpenCompass 的基础用法进行 InternLM2-Chat-1.8B 在 C-Eval 基准任务上的评测,更多评测技巧可以查看。CompassBench 闭源评测集含有多种客观评测问题,以选择题和填空题形式考察,范围涵盖:语言,知识,推理,数学,代码,智能体等。这是整个工作流的起点。

2024-08-19 03:02:42 824

原创 【书生大模型实战营(暑假场)】基础任务四 XTuner微调个人小助手认知

在我们的输入的这个命令中,我们的 CONFIG 对应的是上面搜索到的 internlm2_chat_1_8b_qlora_alpaca_e3 ,而 SAVE_PATH 则是当前目录 .。:指定了用于训练的模型和分词器的具体类型及其配置,包括预训练模型的路径和是否启用特定功能(如可变长度注意力),这是模型训练的核心组成部分。全量微调的模型(full fine-tuning)直接修改原模型的权重,并没有微调一个新的 Adapter,不需要进行模型整合的。三个路径即可实现快速的模型合并。

2024-08-16 05:54:53 991

原创 【书生大模型实战营(暑假场)】基础任务四 InternLM+LlamaIndex RAG 实践

LlamaIndex是一个开源的索引|和搜索库,提供高效、可扩展的文本索引|和检索功能。他是一个开源的为LLM设计的索引和搜索库,并非专门为RAG设计,但可以帮助构建有效的数据库,从而更好地构建 LLM应用。

2024-08-15 03:43:56 818

原创 【书生大模型实战营(暑假场)】入门任务二 Git 关卡

本任务将基于开发机实现,重点在于熟悉Git操作。首先要了解 Git操作的常见四部曲,即:舔 Add,提 Commit,拉 Pull,推 Push,关于这些指令的作用,可以参考本关卡的教程部分,具有非常精炼的介绍。添(Add)命令:git add 或 git add .作用:将修改过的文件添加到本地暂存区(StagingArea)。这一步是准备阶段,你可以选择性地添加文件,决定哪些修改应该被包括在即将进行的提交中。提(Commit)命令:git commit -m ‘描述信息’

2024-08-14 23:29:03 1071

原创 【书生大模型实战营(暑假场)】基础任务三 浦语提示词工程实践

提示工程也可帮助我们构建数据飞轮,即 “好产品 —> 更多的用户和数据 —> 更好的模型质量 ——> 好产品” 的良性迭代。由于服务需要持续运行,需要将进程维持在后台,所以这里使用我们上一节安装的 tmux软件创建新的命令窗口。此时,服务启动完成,我们可以按 Ctrl+B 进入tmux的控制模式,然后按D退出窗口连接,更多操作。:近期相关研究发现,LLM在对比浮点数字时表现不佳,经验证,internlm2-chat-1.8b。注意,当我们想再次进入运行模型服务的端口时,再次输入以下指令即可。

2024-08-13 00:55:09 742

原创 【书生大模型实战营(暑假场)】基础任务一 书生大模型全链路开源体系

层面,书生开源了总共 30+模态,7700+数据集,180TB 的数据,涉及图像,视频,token语料,音频,3D模型等,并且提供了配套的检索,下载,标注,采集工具。方面,LMDeploy提供了推理接口,量化,引擎,服务等多种功能,可以实现高效推理,可靠量化,卓越的兼容性,便携的服务,有状态推理等功能,同时支持多种 LLM和 VLM;可以对问题进行分解和规划,模拟人脑的思维路径,去实现搜索,生成,整合,反馈,是一种非常有趣的设计;可以感受到书生浦语一路走来,发展,成长的不易,祝书生浦语越来越好!

2024-08-11 00:59:51 840

原创 【书生大模型实战营(暑假场)】入门任务三 Python 关卡

简单来说,“debug”就是能再程序中设置中断点并支持一行一行地运行代码,观测程序中变量的变化,然后找出并修正代码中的错误。其中,最常用的就是按钮 1,即是一种单步调试方法,每次点击debug面板的按钮 1,代码将运行到下一个断点,但并不执行该断点的这行代码。进入 debug 模式后,我们可以看到变量区,这是我们 debug 的依据。在关键拓展安装完成后,我们发现,开发机侧的 python文件行号左侧已经可以打断点,即出现了“红点”,而这个“红点”在不安装 python拓展时是没有的!

2024-08-04 19:55:57 950

原创 【书生大模型实战营(暑假场)】基础任务二 8G 显存玩转书生大模型 Demo

本任务将基于开发机实现,重点在于熟悉Git操作。首先要了解 Git操作的常见四部曲,即:舔 Add,提 Commit,拉 Pull,推 Push,关于这些指令的作用,可以参考本关卡的教程部分,具有非常精炼的介绍。添(Addgit add 或git add .作用:将修改过的文件添加到本地暂存区(Staging Area)。这一步是准备阶段,你可以选择性地添加文件,决定哪些修改应该被包括在即将进行的提交中。提(Commit)git commit -m '描述信息'

2024-08-04 17:51:03 760

原创 【书生大模型实战营(暑假场)】入门任务一 Linux+InternStudio 关卡

应根据实际开发机的端口号进行配置,正确配置后,可以在本机访问开发机运行的应用。这样做的意义是,有时开发机不具备完整依赖去支持特定应用的运行,比如 Web-UI,通过端口映射可以借助本机的 Web-UI 去显示开发机的 Web 应用。端口映射可以将外网端口映射到内网端口,实现内外网通信,从而可以从外网访问内网服务和应用。在本机的终端中输入以下指令进行端口映射。

2024-07-29 12:13:50 348

原创 大模型技术方向夏令营1期-对话分角色要素提取挑战赛

这个夏令营不简单 #AI夏令营 #Datawhale #夏令营。#AI夏令营 #Datawhale #夏令营。一、 baseline。

2024-07-02 23:55:57 250

原创 从经典学习 NLP:小白到大白:1. Word Tokenization

由于chinese本身的character,也就是汉字,具有丰富的意义,研究表明,chinese NLP 中,以 character 作为 input 会比 words 更好。基于 subword,任何 unknow words 都可以由某些 subwords units 序列构成,比如 lower,可以由 low 和 -er 这两个 subwords 组成,或者,如果有必要,可以视为由 -l, -o,-w, -e, -r 等一系列 letter 构成。是 BPE algorithm 的参数。

2024-03-01 22:08:16 986

原创 2 因果推断中的偏差

简练的说,也就是EY∣T1−EY∣T0ATTATEEY∣T1−EY∣T0ATTATE即观测到的实验组和对照组之间的结果的差距便是平均因果效应!因为此时除干预本身之外,实验组和对照组在其他因素上没有任何区别,也就是不存在偏差,那么所有我们观测到的两组之间的差异都只能归因于干预。

2024-01-26 23:50:22 906 1

原创 解读可解释人工智能

可解释人工智能指的是使AI模型的功能对人类更加透明和可理解的方法和技术。与通常作为“黑匣子”运行、决策过程不明确的传统AI系统不同,可解释AI旨在使这些系统的逻辑、结果和操作变得清晰和易于理解。这种透明度不仅仅是打开AI模型的引擎盖;它是关于使洞察力对非专家用户易于访问和理解。可解释人工智能位于技术与透明度的交汇处,对于揭示人工智能的复杂机制起着至关重要的作用。通过培养对AI系统更深入的理解和信任,XAI不仅增强了这些系统的功能,还确保它们与伦理和社会价值观相一致。

2024-01-26 23:25:08 387 1

原创 五大自然语言处理技术里程碑浅析

随着深度学习和大数据技术的进步,自然语言处理取得了显著的进步。人们正在研究如何使计算机更好地理解和生成人类语言,以及如何应用NLP技术改善搜索引擎、语音助手、机器翻译等领域。而自然语言处理的研究与业界发展中具有五大里程碑式的技术:词嵌入,循环神经网络,Transformer,注意力机制,大语言模型。

2024-01-25 00:04:31 1461

原创 28. 找出字符串中第一个匹配项的下标 (Python3)

参考:

2024-01-25 00:01:39 398

原创 389. 找不同 (Python3)

参考:

2024-01-25 00:01:12 336

原创 浅析Python字符串相关操作

字符串是Python中一种基础数据类型,几乎用于数据处理、机器学习、Web开发等多种领域。为更好的理解和掌握字符串,在这里对python的主要字符串操作进行简单的分析与总结。

2024-01-24 21:22:12 767 1

原创 1768. 交替合并字符串 (Python3)

Problem: 1768. 交替合并字符串文章目录思路解题方法Code思路和21. 合并两个有序链表在思路上具有一定的相似性;学会创建dummy变量方便合并。解题方法创建dummy变量作为合并的基础;在循环中利用合适的字符串操作方法交替合并;实现两种方法,区别在于循环语句条件:一种选择在某个字符串迭代结束后变停止循环,将另一字符串的剩余内容直接合并;一种选择在循环中实现所有字符的合并。Codeclass Solution: def mergeAlternately(

2024-01-24 21:13:00 517 1

原创 283. 移动零 (Python3)

参考:

2024-01-24 18:56:38 382 1

原创 21. 合并两个有序链表 (Python3)

参考:

2024-01-24 01:15:46 577 1

原创 206.反转链表 (Python3)

参考:206. 反转链表(双指针,清晰图解)

2024-01-23 21:49:16 402 1

原创 142. 环形链表 II(Python3)

链表本身读写困难,因此通过遍历先存入散列表;在循环中判断是否有环,并返回环的入口节点。参考:反转链表【基础算法精讲 06】环形链表 II(双指针,清晰图解)有一定技巧的数学思考,重点关注:第一次相遇慢指针未走过一个环长;第二次相遇一定发生在环的入口处。

2024-01-23 20:39:50 568 1

原创 141. 环形链表 (Python3)

第一次自己写出来,开心,总体还是非常直观的思路;在遍历中将读写麻烦的链表复制进入散列表;在遍历中判断当前访问节点是否已经访问过。参考:一文搞定常见的链表问题 (欢迎交流)一个视频讲透快慢指针:环形链表II【基础算法精讲 07】环形链表的判断环形链表以set数据结构作为散列表,存储访问过的节点;循环遍历链表,记录访问过的节点;在循环中判断当前节点是否已记录在散列表中,如果有,则为环状链表。一快一慢两个指针,慢指针一次走1,快指针一次走2;以相对速度考虑,如果有环,则一定会相遇;注意循环条件,判断条件的设计。

2024-01-23 13:05:58 343 1

原创 160. 相交链表(python3)

参考:哈希表:https://leetcode.cn/problems/intersection-of-two-linked-lists/solutions/811625/xiang-jiao-lian-biao-by-leetcode-solutio-a8jn/?envType=study-plan-v2&envId=top-100-liked双指针:https://leetcode.cn/problems/intersection-of-two-linked-lists/solutions/12624/

2024-01-21 00:56:38 887 1

原创 1 因果推断潜在结果框架

这也引出了事实(factual)与反事实(counterfactual)的概念,那些真实发生的潜在结果称为事实潜在结果(factual potential outcome),相对而言未真实发生的结果变为反事实潜在结果(counter factual potential outcome)。因果推断的一个重要基本认识是:针对某一个对象/单元,我们总是只能观测到其接受干预或不接受干预两种情况之一。但是,考虑到因果推断的重要基本认识,即针对某一个对象/单元,我们总是只能观测到其接受干预或不接受干预两种情况之一。

2024-01-20 16:46:55 1398

原创 如何在指定的conda虚拟环境中启动Juptyter

有时我们期望在特定环境下启动 Jupyter Notebook,以确保我们的开发环境使用我们所期望的 Python解释器以及库。:现在,便可以在启动的 Jupyter中创建或打开已有的notebook,并使用第一步里激活的conda虚拟环境中的Python解释器和库进行愉快的开发了。:首先,需要在想要运行Jupyter Notebook的conda环境中激活目标虚拟环境。总结一下,每次希望在特定conda虚拟环境中工作时,都必须首先激活该环境,然后在该环境中启动Jupyter。

2024-01-20 00:03:41 1574 1

原创 49. 字母异位词分组 (Python3)

参考:https://leetcode.cn/problems/group-anagrams/solutions/2099578/lai-zi-bei-da-suan-fa-ke-de-leetcodeti-j-wfdh/?envType=study-plan-v2&envId=top-100-likedhttps://leetcode.cn/problems/group-anagrams/solutions/520469/zi-mu-yi-wei-ci-fen-zu-by-leetcode-solut-g

2024-01-19 23:47:46 372 1

原创 128. 最长连续序列 (Python3)

参考:https://leetcode.cn/problems/longest-consecutive-sequence/solutions/276931/zui-chang-lian-xu-xu-lie-by-leetcode-solution/?envType=study-plan-v2&envId=top-100-likedhttps://leetcode.cn/problems/longest-consecutive-sequence/solutions/2362995/javapython3cha

2024-01-19 22:00:49 1861

原创 234.回文链表 (Python3)

参考:以下内容为 GPT 对 解释:In Python, is a common way to create a reversed copy of a list. This slice notation is a powerful feature in Python for list manipulation. Let’s break it down: is your list.The inside the square brackets is the slicing operator, and it

2024-01-19 21:57:04 474

原创 1. 两数之和 (Python3)

参考:https://leetcode.cn/problems/two-sum/solutions/2326193/dong-hua-cong-liang-shu-zhi-he-zhong-wo-0yvmjhttps://leetcode.cn/problems/two-sum/solution/dong-hua-cong-liang-shu-zhi-he-zhong-wo-0yvmj/灵神:“很多涉及到「两个变量」的题目,都可以枚举其中一个变量,把它当成常量看待,从而转换成「一个变量」的问题。代码实现时,

2024-01-19 21:47:33 367

原创 Anaconda介绍及常用命令总结

Anaconda的安装及基本概念Anaconda中通过conda进行python包的管理Anaconda中通过conda进行虚拟环境的管理为形成良好的编程习惯,为每一个项目单独创建一个虚拟环境对开发来说至关重要。这一习惯即使对非数据data项目(如Web App)也能十分有效的帮助管理开发环境。

2023-03-15 10:58:53 1535 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除