自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

原创 机试学习笔记08 -- 栈的应用、优先队列的应用

一、栈的应用c++的栈#include<bits/stdc++.h>using namespace std;stack<int> S;int main(){ S.push(1); S.push(10); S.push(7); while(!S.empty()){ cout << S.top() << endl; S.pop(); } return 0;}c语言的栈//栈和队列都可以用数组模拟实现 #include

2021-07-08 09:49:08 142

原创 机试学习笔记07 -- 斐波那契数列、素数判定、素数筛选、二分快速幂、分解素因数、常见数学公式总结、规律神器OEIS、高精度问题

一、斐波那契数列注意90项大概就会超出int范围如果项数太大取模的话,可以参考之前的做法。如果给你一个数列:a(1) = 1, a(n+1) = 1 + 1/a(n)。那么它的通项公式为:a(n) = fib(n+1) / fib(n)。#include<bits/stdc++.h>using namespace std;int f[10005] = {0};int main(){ int n; cin >> n; f[0] = 1, f[1] = 1;

2021-07-04 23:00:28 513

原创 机试学习笔记06 -- 同余模定理、最大公约数、最小公倍数、递归

一、同余模定理1 以下三条定理等价:(1) a 和 b 是模 d 同余的.(2) 存在某个整数 n ,使得 a = b + nd .(3) d 整除 a - b .2 存在以下应用(a+b)%c=(a%c+b%c)%c;(a-b)%c=(a%c-b%c)%c;(ab)%c=(a%cb%c)%c;即相加取模等于取模相加再取模,注意里面没括号,且不适用于除法。先把乘法取模,再把加法取模#include<bits/stdc++.h>using namespace std;

2021-07-03 19:22:01 310

原创 机试学习笔记05 -- 查找、贪心、链表问题

一、查找问题1 顺序查找直接for循环一个个去查,但时间复杂度太大2 排序+二分最好用于已经排序好的#include <bits/stdc++.h> using namespace std; int a[10005]; int main(){ int n,x; scanf("%d", &n);//输入n个数 for (int i = 1; i <= n; i++) { scanf("%d", &am

2021-06-30 22:55:58 127 3

原创 自然语言处理笔记03 -- HMM

HMM模型介绍由隐状态序列,生成可观测状态的过程。两个基本假设:第t个隐状态只和前一时刻的t-1隐状态相关,与其他时刻的隐状态无关。在任意时刻t的观测值只依赖于当前时刻的隐状态值,和其他时刻的隐状态无关。HMM模型参数转移概率:t时刻的隐状态qi转移到t+1时刻的隐状态qj的概率。发射概率:t时刻由隐状态qj生成观测状态vk的结果。初始隐状态概率:自然语言序列中第一个字o1的实体标记是qi的概率。HMM模型的学习算法有了最佳参数,如何使用参数解决序列标注?(前向传播)

2021-06-06 21:57:25 168 1

原创 自然语言处理笔记02 -- Bert模型解读和实战

位置嵌入的含义位置嵌入不仅仅是反应了时间序列信息,而且从直观上来看,将位置嵌入和其转置做点积,其结果如下。即距离较近的字之间的相关性要大于距离较远字。所以其建立了时间维度上 的关联性。语言模型的定义和BERT如何预训练语言模型语言模型定义:什么是语言模型, 其实用一个公式就可以表示 ????(????1,…,????????) , 假设我们有一句话, ????1到???????? 是这句话里的 ???? 个字, 而语言模型就是求的是这句话出现的概率是多少.预训练方式1:Masked LM就

2021-06-05 21:42:29 585

原创 自然语言处理笔记01 -- transformer模型

预训练语言模型 – ENCODER位置编码使得每个句子,在其每个字的字嵌入维度上,根据维度的不同,将相邻的奇数和偶数维度组合,使得每个组合的编码周期逐渐增大,这样的纹理特性可以使模型学习到句子的时序信息。自注意力机制得到Q,K,V并切分成多头:首先将上一步得到的每个句子的位置嵌入和最初每个句子的字嵌入相加,然后将得到的结果分别做三个线性变换(变换矩阵都为字嵌入大小的方阵),得到Q,K,V。然后将每个变换的结果均按字嵌入维度切分,加入新的维度。用切分后的Q和切分后K的转置相乘,得到结果的某行为

2021-06-05 18:57:33 202

原创 机试学习笔记04 -- 字符串与排序问题

一、字符串问题1 统计字符个数有空格,不能用scanf,要用gets,且gets遇到回车结束。#include<bits/stdc++.h>using namespace std;char s[5];char t[100];//空格不能用scanf!gets遇到回车结束 int main(){ while(1){ gets(s); if(s[0] == '#') break; gets(t); int ls = strlen(s); int lt =

2021-06-03 09:28:03 107

原创 机器学习笔记03 -- GBDT回归、二分类、多分类问题

一、GBDT回归1 偏差方差,过拟合欠拟合偏差bias:是用所有可能的训练数据集训练出的所有模型的输出的平均值与真实模型的输出值之间的差异。方差Variance:是不同的训练数据集训练出的模型输出值之间的差异。想要结果偏差小,就要让模型复杂,参数多,但这样模型的学习能力会过强,导致方差大,在测试集上表现差,表现为过拟合。想要结果方差小,就要让模型简单,参数少,但这样会导致模型学习能力弱,导致偏差大,即表现为欠拟合。对于Bagging,投票输出或取均值输出可以减小方差,所以基模型可以取偏差小的,复

2021-06-01 17:58:11 908

原创 机试学习笔记03 --排版问题与日期问题

1 排版类问题1.1 字符菱形+变体右下直角三角:先空格,再字符。#include<bits/stdc++.h>using namespace std;int main(){ int n; scanf("%d", &n); for(int i = 1; i <= n; ++i){ for(int j = 1; j <= n - i; ++j){ printf(" "); } for(int j = 1; j <= i; ++j)

2021-06-01 13:51:26 106

原创 机器学习笔记02 -- XGBoost、 LightGBM

1.XGBoost2. Light GBM基于Histogram的决策树算法离散化每个特征的数据为K个bins,统计每个bins中的data数目,再寻找最优的分割点。优点:1. 内存为1/8。2.计算代价变小(由feature个变为K个)尽管分割变粗糙,但由于决策树是弱模型,所以不太重要,反而可以减少过拟合。可以采用直方图加速,用父节点的直方图和兄弟节点的直方图相减,就是该叶子的直方图带深度限制的Leaf-wise算法决策树不是按level生长,这样相同的对待了每一层的叶子,但很多叶子其实分

2021-05-30 20:47:53 364

原创 机器学习笔记01 -- 决策树、随机森林、AdaBoost

一、决策树1 决策树的优化:剪枝1.1 预剪枝:每个节点在进行划分时进行估计,看该节点进行划分前后是否可以带来泛化能力上的提升,如果不能,则直接标记为叶子节点。1.2 后剪枝:生成完整的决策树后,再自下而上去评估每个非叶子节点的划分是否带来了泛化能力的提升,如果不能,则将该节点的子树替换为叶子节点。要用验证集数据来判断。2 属性划分纯度变化的计算方法2.1 信息增益 – ID3X:样本类别;A:一种特征x:一种类别;a:A特征划分后的一个分支熵:事件X发生概率p(x)的倒数取对数信息

2021-05-30 13:30:14 237

原创 机试学习笔记02 -- 简单模拟与进制转换

1. 多组输入问题–补充上篇#include <bits/stdc++.h>using namespace std;int main(){ int a, b; while(scanf("%d%d", &a, &b) != EOF){ scanf("%d%d", &a, &b) printf("%d\n", a + b); } return 0;}2. 简单模拟理解题目意思,直接模拟计算计算1-n的和:#include

2021-05-29 22:10:52 162

原创 机试学习笔记01 --梦的开始

1. 输入输出输入带空格scanf()不行,用gets()scanf(”%d“)不会读取回车,但gets()会遇到回车结束,所以中间要用getchar()吃掉回车scanf("%c")会读取回车为一个字符,scanf("%s")不会读取回车,会丢掉,故二维地图输入不能用%c输出进制转换%x 小写16进制输出%X 大写16进制输出%o 八进制输出输出增加前置0%02d 2表示宽度,0表示0补充输出保留小数%.2lf 2表示保留两位小数long long%lld 1e-18 ~ 1e

2021-05-29 14:00:26 143 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除