自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(83)
  • 收藏
  • 关注

原创 林轩田机器学习基石——笔记1.2 Learn to Answer Yes/No(如何进行学习)

本节课主要介绍了线性感知机模型,以及解决这类感知机分类问题的简单算法:PLA。我们详细证明了对于线性可分问题,PLA可以停下来并实现完全正确分类。对于不是线性可分的问题,可以使用PLA的修正算法Pocket Algorithm来解决。

2024-08-03 16:33:00 706

原创 林轩田机器学习基石——笔记1.1 The Learning Problem

这是一个很典型的机器学习的例子,我们需要根据D,通过A,在H中选择最好的h,得到g,接近目标函数f,也就是根据先验知识建立是否给用户发放信用卡的模型。我们不知道f:x->y(target function),但是通过learn algorithm进行大量data的学习,进行一些假设来得到一个g:x->y,其中g ≈ f。对于人类来说,我们通过观察来学习事物和技巧,然而,对于机器学习,我们通过从数据的经验累积和计算来获取skill。从未知规律的数据中,通过学习算法去挖掘,让最终的 g 接近 f。

2024-08-03 16:28:40 610

原创 [‘column‘]和[:,‘column‘]的区别

之前,关于numpy和pandas的操作一直不熟悉,对于获取数据中的行,列一直混淆。df['column']是 Pandas DataFrame 切片的常用语法,用于选择名为column的单个列。它返回一个 Pandas Series 对象。这种语法是不正确的,Pandas 不支持这种索引方式。如果试图在lociloc。

2024-05-25 21:31:37 472

原创 P9425 [蓝桥杯 2023 国 B] AB 路线——BFS(三维)

通过题目可以很明显看出是一个求在二维坐标上最短路问题,可以用BFS和DFS进行,这个题多一个条件就是要,要先走k个A,然后走k个B。如果当前的 cnt 值 < k 且扩展后状态坐标上的字母不等于扩展前的,那么当前状态不合法。如果当前的 cnt 值为 k 且扩展后状态坐标上的字母等于扩展前的,那么当前状态不合法。因此,使用一般的BFS不能解决问题,一般的BFS。因为有 k 这个条件,因此我们在BFS中,BFS 拓展时,判断一个状态的正确性,最优解的点不一定是在BFS中第一次到达的点。1.判断坐标有没有出界。

2024-05-25 21:31:03 313

原创 Hadoop复习(上)

系统启动,读取fsimage和edis至内存,形成内存元数据meta data, client向NameNode发起数据增删查请求,NameNode在接受请求后在内存元数据中执行操作,并返回结果给client,如果是增删操作,则同时记录数据操作日志edits。Container启动后,用于执行用户的作业Application,并向ApplicationMaster汇报进度,ApplicationMaster负责整个Application中的Container的生命周期管理。客户端:Client。

2024-05-14 20:57:51 828 1

原创 图像数据预处理——openCV

其中,y0,x0 是初始索引位置 ,y1,x1 是对角索引位置。使用cv2读取图像时,就可以选择读取彩色图像还是灰度图像。函数用于对图像进行缩放和偏移,从而实现对比度增强和亮度调整。是OpenCV中用于对图像进行线性缩放和偏移的函数。#输出图像与输入图像具有相同的大小和类型。将图像大小调整为 (256, 256)# 显示原始图像和增强后的图像。

2024-05-14 17:57:51 566

原创 P8802 [蓝桥杯 2022 国 B] 出差——最短路问题(SPFA)

最短路问题在这里,比较推荐SPFA算法。算法参考以上链接。

2024-05-13 21:26:48 323

原创 机器学习中表格数据预处理

当数据(x)按照最小值中心化后,再按极差(最大值 - 最小值)缩放,数据移动了最小值个单位,并且会被收敛到[0,1]之间,而这个过程,就叫做数据归一化(Normalization,又称Min-Max Scaling)。如果要分训练集和测试集,则对训练集进行fit,即求 min(x) 和 max(x) ,对训练接和测试集进行transform,即二者都使用训练集的 min(x) 和 max(x) 进行归一化。这样的变化,让算法能够彻底领悟,原来三个取值是没有可计算性质的,是“有你就没有我”的不等概念。

2024-05-13 20:16:28 1045 1

原创 机器学习:葡萄酒品质预测

用下面模型复杂度和泛化误差的关系这张图来看,限制max depth,是让模型变得简单,把模型向左推,而模型整体的准确率下降了,即整体的泛化误差上升了,表明此时我们的模型处在泛化误差最低点的左边(一般来说过拟合才正常,但此时是一个欠拟合的状态)。为了方便,我将数据集中的标签重新映射为从0开始的数,然后进行模型的训练和预测。在这个阶段,我采用了多种机器学习算法,然后对不同算法模型的准确率结果进行了比较,通过交叉验证的结果来评估不同模型之间的性能和优劣,最后选用性能较好的模型进行调参处理,以求增加模型的性能。

2024-05-11 20:47:37 2960 3

原创 [蓝桥杯 2021 国 ABC] 123(java)——前缀和,思维

且。

2024-05-11 17:15:14 550

原创 计算系数——二项式+组合数(数学)

我第一个想法就是通过公式①直接计算阶乘然后相除得出结果。直接算就好,只是需要注意取余和爆int。太大了可以用快速幂求解。

2024-04-29 09:51:23 285

原创 信息奥赛一本通:搭配购买——并查集+动态规划(简单)

Joe觉得云朵很美,决定去山上的商店买一些云朵。商店里有n朵云,云朵被编号为1,2,…,n,并且每朵云都有一个价值。但是商店老板跟他说,一些云朵要搭配来买才好,所以买一朵云则与这朵云有搭配的云都要买。但是Joe的钱有限,所以他希望买的价值越多越好。第1行n,m,w,表示n朵云,m个搭配,Joe有w的钱。第2~n+1行,每行ci,di表示i朵云的价钱和价值。第n+2~n+1+m行,每行ui,vi,表示买ui就必须买vi,同理,如果买vi就必须买ui。一行,表示可以获得的最大价值。5 3 10。

2024-04-29 09:46:24 304

原创 吃水果——组合、动态规划

题目要求n个小朋友中恰好有k个小朋友拿到的水果和左边的不一样,那说明另外n-k-1(除去k个和最左边的那个)个小朋友的水果要和左边的相同。集合:从前 i 个小朋友中选择,恰好有 j 个小朋友的水果和左边相邻的小朋友的水果不相同的所有方案。我们选择2~k 部分的最左边的小朋友(第一部分不算入k个里面)即选择了k个小朋友,可以保证,满足第二点,其中 m 表示第一部分小朋友可以随意选择,其余部分不能选择与前一个相同的水果,即。

2024-04-27 17:33:08 522 1

原创 题目 3114: 信息学奥赛一本通T1347-格子游戏——并查集

以后m行,每行首先有两个数字(x, y),代表了画线的起点坐标,接着用空格隔开一个字符,假如字符是"D ",则是向下连一条边,如果是"R "就是向右连一条边。(起始的时候没有边,每个点都作为一个集合,加边即将两个点加入到一个集合中,其中可能有点已经在某个集合中,所以是将两边的集合进行合并)(图论的相关做法,例如dfs,bfs...因为题目需求,找第几步的时候结束,因此会非常耗时间,一步就要遍历一遍(我乱说的))Alice和Bob玩了一个古老的游戏:首先画一个n × n的点阵(下图n = 3)

2024-04-27 17:30:06 894

原创 奶酪——并查集,BFS,DFS(NOIP2017提高组)

目录题目思路并查集代码(java)BFS(DFS同理)代码(C++) 这个题目意思是有很多个球分布在一个三维空间内,如果这些球相切或者相交都可以互相到达,我们需要判断能否通过这些球从底部到达顶部。可以抽象为,所有的球构成了一个图,球即是图中的点,相切或者相交说明两点之间有线。因此我们可以想到,将所有的点组成一个集合,只需要判断这个集合能否到达底部和顶部。 因此可以使用并查集来组成集合。 最主要的是这个题n只有1000,因此暴力做也没问题。 我们判断每两

2024-04-18 19:32:41 346 2

原创 DNS服务器的管理与配置

对于存在多个域名服务器的区域,必须选择一台主域名服务器(master),保存并管理整个区域的信息,其他服务器称为辅助域名服务器(slave)。域名空间的每个域的名字通过域名进行表示。因为域名服务器接收到查询请求后,如果该服务器没有相应的DNS信息,则会询问根区域中的根域名服务器进行迭代查询直到返回结果,所以根区域作用非常重要,不建议手写根区域文件。BIND的主配置文件是named.conf,存放在/etc目录下,主要是用来声明域名服务器的Cache文件、正反向解析区域文件的名称及放置位置。

2024-04-18 11:29:10 2706 1

原创 病毒溯源——DFS,动态规划(树形DP)

(比如:a 有子节点 b,c,d,分别对应长度c(b)=c(c)>c(d),此时 b 和 c 都可以取,我们只需要判断这两个子节点谁小就取谁)ps:这个子节点谁小就取谁困扰了我,后来发现是因为树中不会存在两个相同的数,因此就不需要担心,如果两个子节点相同怎么办。(比如:a 有子节点 b,c,d,分别对应长度c(b)>c(c)>c(d),说明我们只需要取b这个子节点);,因此,我们递归求出子节点的最大长度,就可以求出根节点的最大长度。使用一个数组son[],记录当前点对应最大长度的子节点。

2024-04-08 17:45:34 346

原创 转圈游戏——快速幂

但的范围是,而总的移动次数是。时间复杂度是在,因此是一定不能硬算的,肯定会超时。那么该如何快速求解。

2024-04-08 17:34:46 534

原创 Linux——软件管理

使用源代码安装软件的优点获得最新的软件版本,及时修复bug根据用户需要,灵活定制软件功能应用场合举例安装较新版本的应用程序时(自由软件的最新版本大都以源码的形式最先发布)当前安装的程序无法满足需要时(编译安装可由用户自行修改、定制功能)需要为应用程序添加新的功能时(用户可以重新配置、自由修改源代码,加入新的功能)Tarball 封包: .tar.gz 和 .tar.bz2 格式居多 软件素材参考:http://sourceforge.net确认源代码编译环境。

2024-04-02 10:28:34 1145

原创 2024/4/1打卡保险箱(十四届蓝桥杯)—— 动态规划,贪心

进位就是向上加,超过10需要进位;-1 是因为上一位进位,这一位可以少加一个1;+1是因为上一位退位,这一位要多加一个1。+1 是因为上一位进位,这一位要多减一个1;-1是因为上一位退位,这一位可以少减一个1。但是,写完之后发现,好像写成了贪心的方式,每次都只取当前所有可能的最优解,然后进行计算。只考虑两种情况,一是不进位也不退位,二是退位(因为进位必会在还没加到10时就到y)也考虑两种情况,一是不进位也不退位,二是进位(因为退位必会在还没减到0时就到y),不能保证是不进位不退位还是进位或者退位是最优解。

2024-04-02 10:26:59 2565

原创 Linux——进程管理

前台和后台运行作业作业可以在前台,也可以在后台运行,在同时间只能有一个作业在前台运行。程序只是一个静态的指令集合,不占系统的运行资源:而进程是一个随时都可能发生变化的、动态的、使用系统运行资源的程序。多任务是指Linux可以同时执行几个任务,它可以在还未执行完一个任务时又执行另一项任务。进程:程序的动态执行过程;为了完成这些任务,系统上同时运行着多个进程,正在执行的一个或多个相关进程称为一个作业。进程:在CPU及内存中运行的程序代码 是动态执行的代码 父、子进程:每个进程可以创建一个或多个进程。

2024-04-01 14:31:19 988

原创 2024/4/1打卡 翻转——思维题

小蓝用黑白棋的 n 个棋子排成了一行,他在脑海里想象出了一个长度为 n 的 01 串 T,他发现如果把黑棋当做 1,白棋当做 0,这一行棋子也是一个长度为 n 的 01 串 S。后面 2D 行每行包含一个 01 串,每两行为一组数据,第 2i−1 行为第 i 组数据的 Ti,第 2i 行为第 i 组数据的 Si,Si 和 Ti 长度均为 ni。然后,题目要求我们将 S 串转换为 T 串,且求最少的次数,那么我们每个值最多就只能翻转一次。最重要的是,可以从头枚举的原因,我觉得是因为,ps:用java要超时。

2024-04-01 09:43:10 540

原创 Linux——逻辑卷(LVM)管理

逻辑卷管理器(Logical Volume Manager),最早应用在IBM AIX系统上。它的主要作用是动态分配磁盘分区及调整磁盘分区大小,并且可以让多个分区或者物理硬盘作为一个逻辑卷(相当于一个逻辑硬盘)来使用。这种机制可以让磁盘分区容量划分变得很灵活。

2024-03-30 16:21:04 2012

原创 2024/3/29打卡 填充——贪心

一个题目当寻找答案的过程中有大约 2的指数级( 2^n)个方案的时候,可以考虑用贪心和动态规划问题(其实,我现在还不知道什么时候用 dfs 和 动态规划,希望有大佬教教我)。当有多个方案指向最优解的时候,我们可以将一个大的问题划分为多个子问题,并使用动态规划来计算每个子问题的最优解,然后将这些最优解组合起来得到原问题的最优解。当只有一条最优方案的时候,我们就用贪心,每步都使用最优策略来寻找解。例如二分,每次取中间值,判断目标值和中间值的位置,然后判断取左边还是右边,但是保证目标值在所求区间范围内。

2024-03-30 15:20:31 621

原创 2024/3/27打卡更小的数(十四届蓝桥杯)——区间DP

我们先枚举每个小区间,然后向大区间递增,大区间是否可以翻转满足要求,1.看是否右端点<左端点,2.如果右端点=左端点,看它比它小的一个区间是否可以翻转,可以,那么这个区间就可以。题目说求数组某个区间中的数进行翻转,由于区间选择多,首先想到DP问题。看了别人的讲解后,恍然大悟。无法判定区间是否翻转后满足要求。,即反转后的值小于翻转前的值。区间中的区间进行翻转是与。,当进行状态计算的时候,中传递过来,意思就是。

2024-03-28 12:25:00 488

原创 Linux——磁盘与文件系统管理

1、指一种特定的文件格式。1.创建要作为swap分区的文件:增加1GB大小的交换分区,则命令写法如下,其中的count等于想要的块的数量(bs*count=文件大小)。建立文件系统的过程,就是用相应格式化工具格式化分区的过程,这个过程和在windows系统中格式化某个分区为NTFS分区的过程类似。在Linux系统中使用某个磁盘空间的根目录与其中的所有文件,就必须将该文件系统挂载到根文件系统的某个目录中。在各分区上用户可以分别建立文件系统,在使用时,用户感觉到每个分区就好像是一张“独立的大磁盘”一般。

2024-03-28 11:04:02 1231

原创 Linux——用户和组管理

Linux基于用户身份对资源访问进行控制超级用户root普通用户程序用户组帐号:基本组(私有组)附加组(公共组)UID和GID:UID(User Identity,用户标识号)GID(Group Identify,组标识号)

2024-03-27 10:14:10 1189

原创 2024/3/27打卡接龙数列——动态规划(线性DP/最长上升子序列)

然后我就写代码了,时间复杂度是O(n^2),只能过一半的数据。(ps:我以为是01背包问题,但是状态表示出来又不是,没想到是最长上升子序列问题)思考,每个数都有选或不选的两种选项(选:可以接龙前面;不选:自己本身作为一个接龙数列)。可以想到是 动态规划问题。因此如果到第 i 个数,我们只需要找 以 i 的左边第一个数结尾的接龙数列的最大长度以及数的位置。因为 N 的范围是100000,因此要保证在O(nlogn)范围内。后面发现是最长上升子序列的问题,因为。有些乱 ,看注释就懂了。

2024-03-27 10:12:54 501

原创 2024/3/23打卡数组分割(第14届蓝桥杯)——二项式+快速幂

我们可以在集合中找到偶数的个数,记为,奇数的个数记为。那么我们只需要在个偶数中选取全是偶数的方案(剩下的元素和也一定是偶数)。那么我们可以选取 0 个,1 个,2 个... r 个。相当于那么就可以使用二项式定理因此。

2024-03-26 11:37:47 586

原创 Linux——Shell基本命令

VMware16+红帽。

2024-03-25 19:18:47 1177

原创 redis常用五大数据类型

与set相似,但是是有序的。集合中的每个成员都关联了一个评分,这个评分被用来按照最低分到最高分的方式排序集合中的成员。集合成员是唯一的,但评分可以重复。该类型就是元素的二维坐标,在地图上就是经纬度。redis基于该类型,提供了经纬度设置,查询,范围查询,距离查询,经纬度hash等常见操作。有效的经度从-180度到180度。有效的纬度从-85.05112878度到85.05112878度。是一个string类型的field和value的映射表,类似Java中的map。为给定的key设置过期时间(秒)

2024-03-20 23:05:36 776

原创 2024/3/19打卡三国游戏(14届蓝桥杯省赛)——贪心+枚举

这个思路主要就是贪心(太菜了,证明不了),最后选择事件就是对三种情况所有计算出的剩余兵力的枚举,最多选择多少个可以满足条件。游戏有 n 个可能会发生的事件,每个事件之间相互独立且最多只会发生一次,当第 i 个事件发生时会分别让 X,Y,Z 增加 Ai,Bi,Ci。注意,蓝桥杯官方给出的关于 Ai,Bi,Ci 的数据范围是 1≤Ai,Bi,Ci≤10^9,但是这与给出的输入样例相矛盾,因此予以纠正。意思是,每个国家都可以随意挑选事件,之间相互独立,没有制约,只是都在追求让自己国家的兵力更多。

2024-03-20 09:00:00 1130

原创 2024/3/17打卡带分数(第四节蓝桥杯)——全排列dfs

注意特征:带分数中,数字 1∼9 分别出现且只出现一次(不包含 0)。输出输入数字用数码 1∼9 不重复不遗漏地组成带分数表示的全部种数。可以理解为0~9 如何排列 划分可以满足上述条件。验证枚举出来的三个数是否满足题干条件,若满足则计数。,对每个排列好的数通过二重循环来划分成三部分 ,组成。问题求 不重不漏使用 0~9 中的数组成。类似这样的带分数,100 有 11 种表示法。对 0~9进行全排列。

2024-03-18 09:00:00 466

原创 全排列——dfs(剪枝/回溯)

我们可以假设我们有一个 n 的长度的空格,我们对每个位置进行选取序列中的值进行枚举,枚举到第 i 个空位时,前 i-1 个值被使用过的值标记成不可使用。枚举完一次后,向前回溯。回溯法:我们定义递归函数表示当前排列为,下一个待填入的位置是第个位置(下标从 0 开始)。那么整个递归函数分为两个情况:如果,说明我们已经填完了 n 个位置,找到了一个可行的解,我们将放入答案数组中,递归结束。如果,我们要考虑第个位置填哪个数。

2024-03-17 17:20:16 729

原创 2024/3/16打卡全球变暖(第九届蓝桥杯)——dfs/bfs

其中”上下左右”四个方向上连在一起的一片陆地组成一座岛屿,例如上图就有 2 座岛屿。由于全球变暖导致了海面上升,科学家预测未来几十年,岛屿边缘一个像素的范围会被海水淹没。具体来说如果一块陆地像素与海洋相邻(上下左右四个相邻像素中有海洋),它就会被淹没。请你计算:依照科学家的预测,照片中有多少岛屿会被完全淹没。第一行包含一个整数N。以下 N 行 N 列,包含一个由字符”#”和”.”构成的 N×N 字符矩阵,代表一张海域照片,”#”表示陆地,”.”表示海洋。

2024-03-17 09:00:00 495

原创 2024/3/14打卡k倍区间(8届蓝桥杯)——前缀和+优化***

给定一个长度为 N 的数列,A1,A2,…AN,如果其中一段连续的子序列 Ai,Ai+1,…Aj 之和是 K 的倍数,我们就称这个区间 [i,j] 是 K 倍区间。你能求出数列中总共有多少个 K 倍区间吗?第一行包含两个整数 N 和 K。以下 N 行每行包含一个整数 Ai。输出一个整数,代表 K 倍区间的数目。6。

2024-03-14 12:27:16 547

原创 2024/3/14打卡棋子(14届蓝桥杯)——差分

标准差分模板。

2024-03-14 12:21:10 682

原创 2024/3/13打卡壁画——思维!!!+前缀和***

使用 × 表示被摧毁, √ 表示被作画。那么每天的过程就是 √ × √ × √ × √ × ...那么至少有块可以被用来作画。那如果 n 是奇数,在每天作画和摧毁交替中使用过的墙壁总个数一直是保持偶数的。那么最后一块墙壁一定是被用来作画的,作完画后,没有墙壁可以被摧毁。因此,能够被作画的墙壁的个数为。那么最后的形式一定是,中间连续一段被作画,两边的墙壁全被毁掉了。

2024-03-13 15:26:37 1050

原创 2024/3/11打卡分巧克力(第8届蓝桥杯省赛)——二分

儿童节那天有 K 位小朋友到小明家做客。小明拿出了珍藏的巧克力招待小朋友们。小明一共有 N 块巧克力,其中第 i 块是 Hi×Wi 的方格组成的长方形。为了公平起见,小明需要从这 N 块巧克力中切出 K 块巧克力分给小朋友们。例如一块 6×5 的巧克力可以切出 6 块 2×2 的巧克力或者 2 块 3×3 的巧克力。当然小朋友们都希望得到的巧克力尽可能大,你能帮小明计算出最大的边长是多少么?

2024-03-13 10:45:51 485

原创 2024/3/11打卡管道(14届蓝桥杯省赛)——二分+区间合并

有一根长度为 len 的横向的管道,该管道按照单位长度分为 len 段,每一段的中央有一个可开关的阀门和一个检测水流的传感器。对于所有评测用例,1≤n≤10^5,1≤Si,len≤10^9,1≤Li≤len,Li−1<Li。输入的第一行包含两个整数 n,len,用一个空格分隔,分别表示会打开的阀门数和管道长度。对于 70%70% 的评测用例,n≤5000,Si,len≤10^5;对于 30%30% 的评测用例,n≤200,Si,len≤3000;时刻的,一定满足要求,故具有单调性,此时可以想到。

2024-03-11 19:13:10 1604

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除