- 博客(64)
- 收藏
- 关注
原创 ACM训练题:摆花
花的摆放是按顺序且同种在一块,这可以递推。设dp[i][j]表示前i种花总共摆放j个的方案数。遍历第i种花可能的摆放个数k,有递推公式:dp[i][j]+=dp[i-1][j-k]。唯一的坑点是这个j要从0开始。
2024-02-14 17:05:12
177
原创 ACM训练题:互不侵犯
具体算法:dp[i][j][k]表示第i行,前i行有j个棋子,第i行的棋子情况。第一行初始化一下,符合条件的设为1.然后循环枚举出第i行,m总数的棋子,j的前一行状态,k的这一行状态,验证是否相邻,是否总数超过。一看数据范围,如果是枚举所有的棋盘情况,2^K,肯定超了,自然是要一行一行递推,而相邻这个情况用位运算会比较方便,所以用状压dp。
2024-02-14 13:59:35
323
原创 2024年微信公众号链接爬取
这样就可以通过正则表达式找到所有的link,再将\替换掉,即可得到所有文章的链接,具体爬取文章哪些内容,html格式各不相同。这是具体公众号文章信息,它需要的就是fakeid,其中token是你自己公众号独有的。通过输入(或文件导入)公众号名称,即可爬取该公众号所有历史文章。打开后发现有搜索结果的fakeid,这是每个公众号的标识。通过公众号官方网站调用API,打开开发者工具后发现有。其中header和cookie按照自己浏览器填写即可。
2024-02-07 18:21:10
295
原创 ACM训练题:Division
题意是给你N,打印出所有相除等于N的五位数(包含前导零),可以枚举后五位,计算量是10!,然后乘N,一起检验10个数是否都出现。比较奇葩的是这个格式,在每一个N结果输出前加一个\n。
2024-02-05 20:05:20
245
原创 ACM训练题:Raising Modulo Numbers
主要意思就是上面的式子,求幂的和的模,求幂自然是快速幂,这里都带上模,求和的模也可以分开取模。
2024-02-05 15:18:53
235
原创 ACM训练题:Strange Integers
由于有对称性,可以先将数组排序。考虑最小的数选不选,一定选,因为如果不选最小的数也能达到最大的答案,那么换成最小的数一定不亏。接下来就遍历,遇到比上一个大k或以上的就选,因为如果你不选一定不赚。题意是给n个数,找出最多的数,使两两之差大于等于k。
2024-02-05 11:12:10
134
原创 ACM训练题:Fadi and LCM
如果a,b含有相同质因数,如果a中含质因数c的数量小于b,那么a去除所有c,显然lcm不变,这样将a、b中所有不必要的质因数去除后,显然a、b已经没有公共的质因数,于是a、b互质,要取max(a,b)最小,可以交换a、b中的质因数,这样可以找到最小的一对。首先LCM(a,b)=X,说明a*b>=X,当且仅当a,b互质时相等,题意要让a,b都尽可能小,最好让a*b=X,即a,b互质。于是可以遍历sqrt(X),比较互质的因数即可。
2024-02-05 00:13:29
277
原创 ACM训练题:曲线
这题只需要注意一个点,就是所有二次函数的二次系数都是大于0的,这说明这是个下凸函数,而且最小值旁边都是单调的,对于求区间凸函数极值问题,套三分模板即可。需要注意的是exp需要到1e-8级别,要不然可能会寄。
2024-02-04 17:58:36
203
原创 ACM训练题:0-1MST
如果给你的是不超过10^5的‘零边’,只需要求连通块-1即可,但这里要求‘一边’不超过10^5,当n很大时,很明显‘零边’是非常多的,可以考虑找到一个根节点,这个节点连通的‘零边’最多。很明显,这个节点的‘一边’最少,且=n-1-m/n,那么这些就可以构成一个联通块,剩下n-(n-1-m/n)=m/n+1个点,对这些点枚举每一条边,用并查集维护联通块,最后返回连通块-1.时间复杂度为O(m+n)。有m条边的边权为1,其余的都为0。问你这张图的最小生成树的权值。
2024-02-03 21:26:56
882
原创 ACM训练题:跳石头
看到让最小值最大,大概率是二分答案,先用二分假设一个答案,然后遍历数组看答案是否符合,再决定二分的方向。有个小小的坑,就是把终点也要算进去,不然寄了。
2024-02-03 15:26:22
154
原创 adb脚本操作
用荣耀80手机测试@echo off) else () else (num!if!sum!LSS!num!if!sum!GTR -1 (cnt!now acc:!acc!>>log.txtcnt!now acc:!acc!>>log.txtpause。
2024-02-01 21:38:00
681
原创 吉大计网笔记
Baud是波特,是码元传输速率的单位,1波特为每秒传送1个码元,单位是码元/秒。ARP:网络层协议,如果ARP高速缓存没有目的地址的IP映射,就使用发送ARP请求分组(广播,MAC地址为全F),收到请求分组后,回应ARP响应分组(单播)总长度:占16位,以1B为单位,最大为2^16-1B,但以太网最大传送单元(MTU)为1500B,IP数据报封装成帧时,总长度不超过MTU。查找路由时,可能得到多个匹配结果,应当从匹配结果中选择具有最长网络前缀的路由,因为网络前缀越长,其地址块越小,路由就越具体。
2024-02-01 12:20:31
1153
原创 基于飞浆NLP的BERT-finetuning新闻文本分类
最后损失函数收敛在0.2或0.1左右比较正常,四舍五入差不多90准确率,当然如果你解冻更多参数,自然可以更加精确,看运行环境的配置了,建议不要使用免费平台配置,否则比乌龟还慢。ps:注意最后的f.write('\n'),否则除第一次,每次打印少一行,很坑。ps:如果只保留classifier用来训练,效果欠佳。
2023-11-07 14:33:27
496
原创 百度飞浆ResNet50大模型微调实现十二种猫图像分类
要求很简单,给train和test集,训练模型实现图像分类。这里使用的是残差连接模型,这个平台有预训练好的模型,可以直接拿来主义。训练十几个迭代,每个批次60左右,准确率达到90%以上。
2023-10-09 20:44:13
1034
原创 蓄水池算法
假设有一组数据流元素有 N 个(事先不知道 N 具体值),我们希望选择 n 个样本(N >= n),使用怎样的策略进行抽样可以使得数据流中每个元素被选择的概率恰为 n / N结论:创建大小为n的容器,先把,然后第i个(从n+1开始)有,随机和n个已保留的元素之一交换,有1-n/i的概率舍弃。
2023-10-02 10:20:09
162
原创 jieba库分词并生成词云
将停用词文件和数据导入,对数据进行分词后,使用wordcloud去除停用词,加载中文字体,设置清晰度,得到词云。注意如果有一些无意义词汇占比太大,可手动在stopword文件中添加停用词。
2023-09-19 10:07:10
171
原创 爬取任意百度贴吧评论(可直接Copy)
爬取的评论在D:/res/info.txt中,注意控制访问频率,不要把time.sleep()删了,要不然ip会被被临时封了,也可能被验证码疯狂骚扰,如果你有ip代理池那随意了。代码拿去就可以用,输入你要爬的贴吧名就行了。看贴吧有多少页,range范围改为多少。
2023-09-19 09:56:27
495
2
原创 Python爬取斗罗大陆樱花动漫全集
③正则查找要用非贪婪模式,还有记得加上time.sleep()和timeout,以及user-agent要随机取(参考源码),要不然会有connection aborted,被反爬。由第一个包含第二个index.m3u8的地址,ctrl+f在源代码中一查index,果然有,不过/前总有个\,这个用replace替换为空。④查看每一集的url的不同点,最后利用线程池一次性爬好几集(这里爬了1-10集),只要你内存够(F12打开Fetch/XHR,看到m3u8,ts,一眼顶真,打开index.m3u8。
2023-08-22 11:53:41
4323
原创 蓝桥杯2018年第九届真题-版本分支
题目描述小明负责维护公司一个奇怪的项目。这个项目的代码一直在不断分支(branch)但是从未发生过合并(merge)。现在这个项目的代码一共有N个版本,编号1~N,其中1号版本是最初的版本。除了1号版本之外,其他版本的代码都恰好有一个直接的父版本;即这N个版本形成了一棵以1为根的树形结构。如下图就是一个可能的版本树:1/ \2 3| / \5 4 6现在小明需要经常检查版本x是不是版本y的祖先版本。你能帮助小明吗?
2023-06-09 14:06:01
233
原创 [蓝桥杯 2018 国 B] 矩阵求和
小明突然冒出一个奇怪的想法,他想知道这张表中所有元素的和。一行一个数,表示所有元素的和。又(i/gcd(i,j))*(j/gcd(i,j))=1,上式化为。对于 100\%100% 的数据,n\le 10^7n≤107。对于 30\%30% 的数据,n\le 1000n≤1000。对于 60\%60% 的数据,n\le 10^6n≤106。存在 10\%10% 的数据,n = 10^5n=105。枚举最大公约数d,∑d∑∑(gcd(i,j)²==d)把d替换成d²,∑d²∑∑(gcd(i,j)==d)
2023-06-09 11:00:39
471
1
原创 [蓝桥杯 2014 国 B] 生物芯片
解题思路:设一个数x的因数的个数为d(x),显然x要操作d(x)-1次,当d(x)为奇数,灯为暗,否则为亮。而因数个数一般都是偶数,除非这个数是平方数。显然,只需要求l和r之间的平方数个数就好了。
2023-06-06 20:15:45
116
原创 [蓝桥杯 2013 国 B] 格子刷油漆
其实还有一个注意点,如果右边(左边也类似)列数大于2,可以先跳到右边,再跳到左下方,再跳到右边(两种方案),再终点不固定。解题思路: 一眼顶真,鉴定为动态规划。先考虑从第一行某个位置进入(第二行对称,直接乘二)。①直接向下走,然后跳到右边,有两种情况(右和右上),之后就是已任何点为终点的路径数。①不能直接向下走,选左边或右边开始,且必须终点固定,返回后到另一边,终点不固定。②直接跳到右边,有两种情况,然后终点固定(否则不能填满),这也需要维护个数组。
2023-06-06 13:23:12
67
原创 [蓝桥杯 2013 省 A] 大臣的旅费
题目给了一个树,要求树的直径,可以用树状dp求,也可以用两次dfs,我选择简单的(),先选一个节点求离其最远的点,再以这个点求最远距离即可。
2023-06-05 20:38:06
35
原创 蓝桥杯2013年第四届真题-高僧斗法
这实际上是阶梯Nim问题,移动一个和尚,相当于把一堆石子一部分移入相邻堆,必胜态是奇数堆的石子异或和非零,相应的必败态为异或和为零,遍历找出使对手必败态的最小位置即可。
2023-06-05 20:34:33
33
原创 蓝桥杯2013年第四届真题-买不到的数目
已知a、b可以组合出,当i可以被组合出时,i+a、i+b也可以被组合出,遍历个1e7个数,一秒足够了。直接套结论的话,答案是a*b-(a+b)。其实不会数论也没关系(我也不会),直接暴力(
2023-06-05 11:23:50
41
原创 P4513 小白逛公园
小新为了省事,每次遛狗的时候都会事先规定一个范围,小白只可以选择第 aa 个和第 bb 个公园之间(包括 a, ba,b 两个公园)选择连续的一些公园玩。对于 100\%100% 的数据,1 \le n \le 5 \times 10^51≤n≤5×105,1 \le m \le 10^51≤m≤105,所有打分都是绝对值不超过 10001000 的整数。小白每出去玩一次,都对应输出一行,只包含一个整数,表示小白可以选出的公园得分和的最大值。接下来 nn 行,每行一个整数,依次给出小白开始时对公园的打分。
2023-05-21 18:37:15
112
原创 P8796 [蓝桥杯 2022 国 AC] 替换字符
一看到区间修改,直接开一个线段树维护每个区间字符的变化,用数组mp[26]记录,mp[i]=j表示字符i最终变成j。
2023-05-18 15:15:12
126
原创 蓝桥杯十三届省赛-统计子矩阵
利用二维前缀和,如果暴力枚举子矩阵的坐标,时间复杂度O((N*M)^2),注意当一处边长确定后,矩阵数字和随着另一边单调不减,可以维护一个窗口,里面数字和不超过k,时间复杂度O(N^2*M)
2023-05-15 17:21:41
40
原创 蓝桥杯十二届国赛-和与乘积
第二个优化:预处理一个数组pre1[N],pre1[i]表示i以前连续1的个数(与i相连),遇到1就直接跳过pre1[i]个距离,使sum增加,如果sum之前小于mul,增加后大于等于mul,说明有一个解。可以发现如果数组中1得个数很少,第一个优化会很顺利,但当1个数很多时,最坏时间复杂度仍是O(n^2),原因在于1的重复运算。可以想到一个数乘x和加x,只有当x等于1时,加法比乘法加得多。当从后向前遍历时,如果前面都是1,乘积依然比和大,直接返回。
2023-05-15 12:12:37
110
1
原创 并查集基操与求联通分量应用
查找+路径压缩结合+按秩合并利用并查集求图的连通分量(典中典)https://leetcode.cn/problems/number-of-islands/https://leetcode.cn/problems/number-of-provinces/
2022-06-25 08:20:14
218
吉林大学Linux课件PPT
2024-02-02
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人