自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 蓝桥杯备战日记(BFS广度搜索)2.15(穿越雷区 )

对于bfs,我们可以解决两个问题,1.从a出发是否存在到达b的路径 2.从a出发到达b的最短路径其中,一可以用dfs,二数据量小时也可以用dfs,不过最好是bfs ,bfs就是一层层的访问,层序遍历,而且树有节点,图没有节点,还包括在无向图中搜索从起始节点到目标节点的路径。代码随想录给v给定一个由 1(陆地)和 0(水)组成的矩阵,你需要计算岛屿的数量。岛屿由水平方向或垂直方向上相邻的陆地连接而成,并且四周都是水域。你可以假设矩阵外均被水包围。

2025-10-05 13:07:38 976

原创 多模态RAG图文问答--看懂图片,读懂文字并关联思考的ai助手

然后我跟着这个来配置了一下 pip install -U "magic-pdf[full]" -i https://mirrors.aliyun.com/pypi/simple 参考https://mineru.site/%E7%96%91%E9%9A%BE%E6%9D%82%E7%97%87/2025/05/22/1fa9e6fa-6062-8065-82db-cc0cf9818496。工具,从LLM返回的可能混杂着其他文本的输出中,稳定地提取出JSON对象,并整理成最终的答案格式。

2025-08-09 22:27:13 871

原创 python的面向对象编程(小白版)

比如说,我们要把大象装进冰箱里,有些人不知道怎么把它放进去,那么我们就需要告诉他,打开冰箱,把大象装进去,关上冰箱。实现封装就是用类来描述一个对象,当然,封装的作用性除了提高复用性以外,还确保了能隐藏内部细节,这就要提到我们的属性,对于c/c++,它分为公共属性(pubic),保护属性(protected),私有属性(private)以及默认。而self是指实例方法中指代实例本身,必须做类方法的第一个参数,当然,其他名字也是可以的,这只是约定俗成的习惯。类是对象的模板,对象是类的具体实现。

2025-07-17 22:16:26 367

原创 DataWhale AI 训练营

提示词工程是通过精心设计输入提示(prompt)来引导大模型生成预期输出的技术。就像与高智商但缺乏常识的助手沟通,需要明确、结构化的表达方式。对于中文TF-IDF我们常用jieba库执行,也是所给baseline所给的。TF(t,d)=文档 d 的总词数词 t 在文档 d 中的出现次数​。IDF(t)=log(包含词 t 的文档数+1语料库总文档数​。同时捕捉左右上下文,动态调整词向量不过计算力要求很强。:衡量一个词在整个语料库中的稀有程度。:衡量一个词在单篇文档中的出现频率。TF-IDF由两部分组成、、

2025-07-16 21:00:55 170

原创 DataWhale AI 夏令营 task2

根据task2教程里的优化,我这次主要也是优化的文本聚类,当然,文本聚类需要基础与商品识别和情感分析,所以我这次的分数也不是特别高,但是对于一个小白来说,第一次优化了这个代码以后还是开心的,主要讲讲自己一些很白的踩坑经历。这里主要是进行了一个遍历,选择分数最高的作为这个聚类个数,难到我的主要是这个embeddings,最后是通过外部模型处理。本次主要是转化可量化的商业洞察信息。K-Means 是一种。

2025-07-13 19:01:39 218

原创 蓝桥杯备战日记国赛python 括号与字母(零基础看懂代码)

Counter是一个字典的子类 ,计数可哈希对象,也就是自动计算一个字符出现在总字符串中的数量,并以字典的形式返回,其中代码中的是建立的一个空对象,这里有一个误区很重要,即使他允许访问不存在的键并自动初始化为零,纠结了很久。然后是 if else 判断,这里主要是判断当前字符到底是什么,如果是左括号,就会进行递归,直到遇到右括号,确定他们两个匹配上,这是一个不断递归不断深入的过程,当遇到左括号会将里面的判定为子字符串。接下来 Q行,每行包含一个小写字母 ci和一个整数 xi 表示一组询问,用一个空格分隔。

2025-06-13 19:52:21 270

原创 蓝桥杯备战日记(双bfs)马与象

小蓝有一个大小为 N×N 的棋盘(棋子可以走的位置有(N+1)×(N+1) 个),棋盘上只有两个棋子:一个马和一个象,他们的行动规则是:马走日,马可以走到一个日字形状的对角;象飞田,象可以走到一个田字形状的对角,即斜着走两格(注意无需遵守象棋中的蹩马腿、塞象眼的规则)。这里又加了一个参数作为判定日还是马,比我一开始想写两个函数聪明很多,主要是这个结尾如何判断两个不同步,就是枚举每一个点,看两个在这个点碰上的时候各走了多少步,bfs函数依旧是模板,注意直接改就不用建vis数组了,稍微优化了一下这里。

2025-06-11 22:10:05 320

原创 蓝桥杯备战日记(双指针法)2.13(奇怪的数列)

从 X 星截获一份电码,是一些数字,如下:13111331131321131113122113⋯⋯YY 博士经彻夜研究,发现了规律:第一行的数字随便是什么,以后每一行都是对上一行"读出来"比如第 2 行,是对第 1 行的描述,意思是:1 个 1,1 个 3,所以是:1113第 3 行,意思是:3 个 1,1 个 3,所以是:3113请你编写一个程序,可以从初始数字开始,连续进行这样的变换。

2025-02-13 21:11:28 161

原创 蓝桥杯备战日记(零基础看懂代码)2.11班级活动

这时我们需要知道,我们要如何变化,我们先优先将高于两个的变成与那些一个一样的,剩余的则同时改变为两个额外一样的,但是问题出来了,高于两个的不一定比一个多啊,所以这里我们需要加一个判定,如果高于两个的少于一个的,那么前面一样,剩余的一个的就改为两两配对,若高于两个的为a,一个的为b,式子将会变为a+(b-a)//2。此处主要是使用了字典的计数,这是统计中重要的一环,通过遍历列表,将其作为键,而每次遍历时加一作为其值,不过注意一点是需要先拓展出其所需的长度,当然,也可以使用coutner方法,但均是殊途同归。

2025-02-11 20:52:06 294

原创 递归和快排和二分查找

快排算是递归的一种运用吧,将其不断二分,比它小的放在左边,比它大的放在右边,但是python其实有sort和sorted。递归最常解决的是斐波那契数列,写个斐波那契数列(阶乘)下一步就会想到双指针了,可惜双指针数量较多,单开一篇。写个二分查找,二分查找是先排序,在有序数组里。二分查找最重要的是取得区间带不带等号。有了快排总会想到二分查找。分为基本情况和递归情况。

2025-02-04 18:06:11 219

原创 蓝桥杯备战日记(暴力破解)(2)11.19(一点基础看懂代码)

然后就是和上文一样的三层for循环用所有的因数来判断,于是我们有了一个新的想法,因为同样的数字不同组合也算情况,所以能知道,每一个h,w,l,都该是n的因数,那么n的因数有多少呢,此时就来到我们的重点,如何分解因数,当然你可能说依旧for循环,这样的时间复杂度是o(n),很显然达不到我们的标准,蓝桥杯多数需要你学会的方法为平方根法,这从昨天的软件赛模拟讲解也同样讲出,所以必须要学会。while和if的嵌套,如果i能被n整除,说明他是n的因数,第二个if用来去重,如果i**2为n,列表中将会有一个重合。

2024-11-19 21:59:08 1099

原创 蓝桥杯备战日记(暴力破解)11.18(一点基础看懂代码)

思路:从输入开始,首先我们用一个循环来接受n行的数据,大于六十的数加入cnt1中,大于八十五的加入cnt2中,再用cnt1和2比上n乘上一百,四舍五入后得到答案并加上百分号。round,同上的四舍五入,如果确定均会超过两位小数,那么内部的round(,2)已经满足题意。输入的第一行包含一个整数 n (1≤n≤104)n (1≤n≤104),表示考试人数。接下来 nn 行,每行包含一个 0 至 100 的整数,表示一个学生的得分。接下来 n 行,每行包含一个 0 至 100 的整数,表示一个学生的得分。

2024-11-18 20:46:12 681

原创 python学习日记(关于取整)

math.trunc()(负数同样会变大,直接舍弃小数部分)字节青训营中的小f的代币永久取整计划,小e的射击训练用到了。向上取整,即math.ceil(数组或式子)int()(负数会变大,直接舍弃小数部分)math,floor()(负数变小)取整主要分两种,向上取整和向下取整。

2024-11-13 20:49:56 267

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除