自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(78)
  • 收藏
  • 关注

原创 Datawhale Happy-LLM 202509 第4次作业

第二个注意力层是一个多头注意力层,该层将使用第一个注意力层的输出作为 query,使用 Encoder 的输出作为 key 和 value,来计算注意力分数。最后,再经过前馈神经网络,搭建一个 Decoder 块。残差连接,即下一层的输入不仅是上一层的输出,还包括上一层的输入。完成上述 Encoder、Decoder 的搭建,就完成了 Transformer 的核心部分,接下来将 Encoder、Decoder 拼接起来再加入 Embedding 层就可以搭建出完整的 Transformer 模型啦。

2025-09-21 08:44:41 340

原创 Datawhale 理工科-大模型入门实训课程 202509 第2次作业

课后作业。

2025-09-21 01:12:12 461

原创 conda激活虚拟环境

在项目目录下,推荐使用前面配置好的 Miniconda 来创建 Python 虚拟环境。如果严格安装上述流程当前应该在项目根目录,进入code目录安装依赖库。

2025-09-19 15:16:38 190

原创 Datawhale Happy-LLM 202509 第3次作业

例如,当我们有一篇新闻报道,我们想要找到这个报道的时间,那么,我们的 Query 可以是类似于“时间”、“日期”一类的向量(为了便于理解,此处使用文本来表示,但其实际是稠密的向量),Key 和 Value 会是整个文本。通过对 Query 和 Key 进行运算我们可以得到一个权重,这个权重其实反映了从 Query 出发,对文本每一个 token 应该分布的注意力相对大小。而在自然语言处理领域,我们往往也可以通过将重点注意力集中在一个或几个 token,从而取得更高效高质的计算效果。究竟什么是注意力机制?

2025-09-19 11:31:19 218

原创 如何下载huggingface的文件

在运行Python脚本之前,在命令提示符中使用。右键点击"此电脑"或"我的电脑",选择"属性"在"系统变量"部分,点击"新建"在PowerShell中,使用。# 然后继续您的代码...点击"确定"保存所有更改。# 其余代码保持不变。点击"高级系统设置"点击"环境变量"按钮。

2025-09-19 10:19:15 346

原创 在vscode中,在powershell 下,如何进入子目录?

在VS Code的PowerShell终端中切换目录很简单。这样可以确保PowerShell正确地将整个带空格的路径名识别为一个参数。在PowerShell中处理带空格的路径时,:如果你在文件管理器复制了文件夹路径,可以直接在终端中。如果你希望每次在VS Code中新建终端时,它都自动在。这是最方便快捷的方式,终端会自动切换到该目录。这样,终端就会在当前活动文件所在的目录中打开了。:如表格中所述,在文件资源管理器中。,确认你是否进入了正确的地方。在切换目录后,你可以使用。

2025-09-19 09:08:43 249

原创 datawhale RAG技术全栈指南 202509 第2次作业

环节,

2025-09-19 08:58:38 162

原创 datawhale玩转通义四大新模型 202509 第2次作业

阿黑表情凶狠(龇牙、瞪眼)/ 开心(咧嘴大笑、摇尾巴幅度夸张),舌头收回 / 位置怪异,耳朵下垂 / 弯折,背景有杂物(如地毯纹路、家具边角),毛发粗糙无光泽 / 结块,光影怪异(面部一半亮一半暗、有明显阴影断层),对话框字体过大 / 过小、颜色异常(如红色、蓝色),画面模糊(边缘锯齿状、细节模糊),特写范围过大(包含身体大部分),眼睛无神(瞳孔过小、无反光)。漫画风格,狗是黑贝品种,背是黑色,腿的内部是棕色,嘴是棕色,耳朵里面是棕色,耳朵是立着的。正向 Prompt​。正向 Prompt​。

2025-09-18 11:14:04 277

原创 Datawhale 理工科-大模型入门实训课程 202509 第1次作业

CodeWithGPU | 能复现才是好算法。

2025-09-17 22:44:44 296

原创 Datawhale Happy-LLM 202509 第1、2次作业

文本摘要(Text Summarization)是 NLP 中的一个重要任务,目的是生成一段简洁准确的摘要,来概括原文的主要内容。根据生成方式的不同,文本摘要可以分为两大类:抽取式摘要(Extractive Summarization)和生成式摘要(Abstractive Summarization)。抽取式摘要:抽取式摘要通过直接从原文中选取关键句子或短语来组成摘要。优点是摘要中的信息完全来自原文,因此准确性较高。然而,由于仅仅是原文中句子的拼接,有时候生成的摘要可能不够流畅。

2025-09-17 13:29:33 589

原创 什么是 Conda 环境?

记住这个简单的规则:python 脚本名.py这样就能确保使用正确环境的 Python 了!进入环境conda activate 环境名直接使用python 脚本名.py(不要写完整路径!检查确认:用确认用的是环境的Python就像你在计算机教室里,直接说"用电脑"就会用教室的电脑,而不会特意说"用主大门的那台电脑"。你现在明白了吗?记住:在环境里就直接用python,不要写完整路径!你第一次运行是成功的,因为你使用了正确的命令。

2025-09-17 11:01:58 659

原创 datawhale RAG技术全栈指南 202509 第1次作业

根据用户之前的路径,项目在E:\Datawhale\All in rag 202509\code(注意:用户之前显示的是E:\Datawhale\All in rag 202509\code,但之前提到下载到all-in-rag文件夹,可能解压后目录名不同,请用户根据实际情况进入正确的项目目录)我们只需要在创建并激活环境后,进入项目目录(即当前目录,因为用户已经在项目目录下)安装依赖即可。但是,请注意,用户之前是通过下载ZIP的方式获取的代码,所以我们需要先进入项目目录,然后激活环境,再安装依赖。

2025-09-16 10:38:35 1561

原创 datawhale玩转通义四大新模型 202509 第1次作业

通义千问3-30B-A3B 既融合了思考模型,也融合了非思考模式,是千问3的重大创新。帮我用P5.js写一个浪漫烟花的粒子特效,鼠标点击触发爆炸,烟花用爱心形状的。A3B: 推理时激活的参数量是30亿。thinking: 深度思考推理模型。instruct:日常指令遵循。点击琴键听不到声音,请加上声音。leetcode刷题:第10题。30B:模型总参数量300亿。

2025-09-14 23:10:38 332

原创 Datawhale AI 夏令营 让AI读懂财报PDF(多模态RAG)202508

跨模态检索与关联 (Cross-Modal Retrieval)、大语言模型(LLM)的应用与推理 (LLM Application & Reasoning)多模态信息处理 (Multimodal Information Processing)、向量化与检索技术 (Embeddings & Retrieval)通义千问Qwen大模型官方仓库 (含多模态VL模型):https://github.com/QwenLM/Qwen-VL。构建一个先进的智能问答系统,以应对真实世界中复杂的、图文混排的信息环境。

2025-08-06 09:32:26 402

原创 Datawhale AI数据分析 作业3

比特币市场作为全球首个且最知名的加密货币市场,以其高度的波动性、全球化的交易网络以及去中心化的特性而著称。自2009年比特币诞生以来,在市场情绪、政策变化、技术进步等多重因素共同作用下,它经历了频繁的大幅价格波动,这些波动不仅体现了投资者对比特币价值的认知变化,同时也映射出全球经济环境和技术发展的脉络。这种“疯狂”的市场行为提供了一个极佳的实验场,可以帮助我们更深入地理解金融市场中的风险管理和投资策略。

2025-07-26 10:44:33 322

原创 Datawhale 大学生心理健康agent 笔记 20250725

应用价值(40分):从作品完整度、商业模式可行性、市场竞争里及用户价值创造、行业影响力及品牌塑造等方面来评价。学~还可以组队~ 我们教程中给大家写了 Gradio、SQLite、Camel-AI的快速入门文档。新手建议:Gradio+SQLite+Camel-AI 老道的开发者建议选择自己擅长的技术栈。需要考虑应用价值,包括商业模式可行性,这个是应用价值评分点之一,占40分。前端:界面带来的视觉感受,交互设计:登录、回答的等待时间……前端:界面带来的视觉感受,交互设计:登录、回答的等待时间……

2025-07-25 21:11:17 218

原创 Datawhale AI数据分析 作业2

加载文件,并显示前5行数据以及各列的数据类型和非空值数量,检查是否存在缺失值。处理缺失值是数据预处理的重要一步。和,它们都是。

2025-07-24 20:28:24 657

原创 Datawhale AI 夏令营 202507:让AI学会数学推理

科大讯飞AI大赛(模型蒸馏) - Datawhale。

2025-07-22 14:20:38 109

原创 Datawhale AI数据分析 作业

一、 贷款批准预测数据集。

2025-07-19 23:41:33 984

原创 Datawhale 20250716 Coze 剪映

通关秘籍 https://www.datawhale.cn/learn/content/190/4351。

2025-07-15 13:02:47 351

原创 Datawhale AI数据分析 笔记

知识点:什么是提示词(Prompt)?在人工智能(AI)领域,"提示词"是一个关键概念,它指的是输入给AI模型的文本或指令,用于引导模型生成特定的输出。按照如下两个要素进行组合的:指标(讲清楚表格构成和一些重要指标的含义)要求(做什么样的分析、画什么样的图)提示词进化路线:表格中有3张表格sheet,1.sheet是1群的统计数据,2.sheet是2群的统计数据,number.sheet是1.sheet和2.sheet数字列对应的兴趣点,其中兴趣点对应兴趣数字列。

2025-07-15 09:31:45 990

原创 如何在vscode中配置环境

编辑jsonc复制},同级放定义服务端口、卷挂载等。表格方案适用场景隔离级别首次耗时一键复现venv/conda纯 Python进程级秒级全栈/系统依赖容器级分钟级✅根据项目复杂度选其一即可。复制分享venv 和conda 是并列关系吗?用了一个就不用另外一个了?复制不是并列,也不完全互斥,它们处在不同层级,可以二选一,也可以混用。定位不同•venv只解决“同一台机器里不同 Python 项目用不同第三方库”的问题。•conda(严格说是conda-env。

2025-07-13 12:01:53 1015

原创 Datawhale AI夏令营2025:动手开发MCP Server

3. 测试:Dify, cherrystudio, trea觉得咋样?2. 我要把MCP功能写明白,输入啥,输出啥?从输入到输出怎么做?1.首先告诉大模型,大模型需要怎么做就能把我的mcp用明白。使用示例 * 模块解耦 *文档清晰 接口规范。参数说明 数据价值。结构化文档 标准化设计。基础版-功能升级-持续迭代。为什么是Gradio?MCP渐进式开发策略。

2025-07-11 17:40:36 200

原创 Datawhale 网络爬虫技术入门第3次笔记

【代码】Datawhale 网络爬虫技术入门第3次笔记。

2025-06-25 01:10:33 163

原创 Datawhale 网络爬虫技术入门第2次笔记

正则表达式(Regular Expression),⼀种使⽤表达式的⽅式对字符串进⾏匹配的语法规则。正则的语法:使⽤元字符进⾏排列组合来匹配字符串。在线测试正则表达式:在线正则表达式测试OSCHINA.NET在线工具,ostools为开发设计人员提供在线工具,提供jsbin在线 CSS、JS 调试,在线 Java API文档,在线 PHP API文档,在线 Node.js API文档,Less CSS编译器,MarkDown编译器等其他在线工具元字符:具有固定含义的特殊符号。

2025-06-19 21:09:14 975

原创 Datawhale YOLO Master 第1次笔记

课程链接 https://github.com/datawhalechina/yolo-master。:用你的游戏本就能跑,1080Ti是入门,3060就是顶配,妈妈再也不用担心我的显卡冒烟。:PyTorch版源码自带"防脱发"注释,连数据加载器都写着"这里可以加缓存哦~":从640x640输入尺寸到Neck网络结构,改配置比换手机壳还方便。:GitHub星标项目能绕地球两圈,B站教学视频多到需要开2倍速。

2025-06-17 23:29:38 240

原创 datawhale Dify动手实践教程 第1次笔记

注册 https://cloud.dify.ai/apps。

2025-06-17 22:40:28 220

原创 Datawhale 网络爬虫技术入门第1次笔记 2025.06

网站管理员可以在网站域名的根目录下放一个robots.txt的文本文件,里面可以指定不同的网络爬虫能访问的页面和禁止访问的页面。网络爬虫在采集这个网站之前,首先获取到这个文件,然后解析到其中的规则,最后根据规则来采集网站的数据。例如:指定规则适用的爬虫类型:User-agent: * 表示规则对所有爬虫生效(* 是通配符)。可以针对不同爬虫设置不同规则(如百度爬虫 Baiduspider、必应爬虫 Bingbot)。

2025-06-16 22:09:32 787

原创 Datawhale 5月llm-universe 第6次笔记

llm-universe/docs/C6/案例1:个人知识库助手.md at main · datawhalechina/llm-universe · GitHub

2025-05-26 01:23:47 212

原创 Datawhale PyPOTS时间序列5月第6次笔记

设置模型的运行设备为cpu, 如果你有gpu设备可以设置为cuda# 组装训练集# 组装验证集# 组装测试集。

2025-05-26 00:52:37 217

原创 Datawhale 5月llm-universe 第5次笔记

【代码】Datawhale 5月llm-universe 第5次笔记。

2025-05-24 02:18:23 101

原创 Datawhale 5月llm-universe 第4次笔记

第四章 构建RAG应用。

2025-05-21 23:51:59 875

原创 Datawhale PyPOTS时间序列5月第5次笔记

自定义时序数据集的预处理与插补。

2025-05-21 11:28:55 782 1

原创 Datawhale PyPOTS时间序列5月第4次笔记

端到端学习:使用一个模型直接接受包含缺失值的数据。

2025-05-20 12:36:14 160

原创 Datawhale PyPOTS时间序列5月第3次笔记

【代码】Datawhale PyPOTS时间序列5月第3次笔记。

2025-05-17 23:04:18 763

原创 Datawhale 5月llm-universe 第3次笔记

环境为vscode+智谱。

2025-05-17 13:42:29 989

原创 Datawhale PyPOTS时间序列5月第2次笔记

Task02. 搭建开发环境并运行、理解时序插补工作流在 VS Code 里运行的话,建议直接用终端输入:bash。

2025-05-16 01:32:13 609

原创 Datawhale 5月llm-universe 第2次笔记

打开 VSCode 的终端(快捷键:`Ctrl + ``)输入:nginx。

2025-05-15 23:46:14 670

原创 Datawhale FastAPI Web框架5月第1次笔记

首先我们要确保自己的python版本是3.10。FastAPI Web框架。第一个fastapi程序。

2025-05-14 01:12:50 268

原创 Datawhale PyPOTS时间序列5月第1次笔记

PyPOTS 是一个专为处理部分观测时间序列(Partially-Observed Time Series, 简称 POTS)而设计的开源 Python 工具箱。在现实世界中,由于传感器故障、通信错误或其他不可预见的原因,时间序列数据中常常存在缺失值。这些缺失值会影响数据分析和建模的准确性。PyPOTS 的目标是为工程师和研究人员提供一个便捷的工具,使他们能够专注于核心问题,而无需过多担心数据中的缺失部分。

2025-05-13 23:39:49 916

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除