- 博客(309)
- 收藏
- 关注
原创 集成学习(bagging/boosting/stacking)BERT,Adaboost
集成学习是集合多个弱监督模型,通过一定的结合策略,得到一个更好更全面的强监督模型的过程.潜在的思想是即使某一个弱分类器得到了错误的预测,其他的弱分类器也可以将错误纠正回来
2023-03-01 20:43:09 611 1
原创 聚类分析--基本原理、方法(Kmeans,层次聚类)
聚类分析就是将研究对象根据一些特征指标,把比较相似的研究对象,按一定的方式归为同类。
2023-02-09 22:16:38 14637 2
原创 算法工程师需要学习的基础
应该早点系统地了解算法工程师需要学习的东西的,B站上的up主:梁唐讲的很好,大家可以去看一下,只截了一部分图做一个记录。
2022-12-28 22:05:48 181
原创 秋招---SQL学习
2.可能用到覆盖索引,减少回表,提高查询效率(啥意思,覆盖索引、回表查询?还有一种情况可能会用or,比如要查询某个字段等于好几个值。也可以改写成union all形式。在sql中,整型数据有以上四种类型。1.节省资源、减少网络开销。√:用union all。
2022-12-08 22:37:47 421
原创 求某个数开几次方根(二分法、数值分析、运筹学、牛顿法和拟牛顿法)
今天面试了一家公司,面试官很厉害,随机出题,考得我头都大了,还是自己太菜了,以前学的东西不会学以致用,都忘了,面试的时候很丢人,以后还是要继续学习啊,虽然马上要毕业了,但本专业的知识是立足之本,专业知识都不牢,别人怎么相信你在其他地方做的好?立下flag,以后每天要回顾一个专业知识点!逼近
2022-12-07 22:08:36 438
原创 1124面试复盘总结--hive
hive是基于hadoop的数据仓库它适用于什么场景提出的/适用于什么场景提供什么功能怎么查询,查询的内部转化流程缺点是什么。
2022-11-24 22:00:48 2216
原创 笔记本电脑+第二块显示屏如何双屏操作
买了个戴尔的vga转换器,用来连接实验室的显示屏,然后并不知道如何操作,我的目的是:在自己的主电脑上写东西,需要第二块显示屏给我固定我需要参考的资料,我对着写。
2022-11-20 15:26:06 3562
原创 Hive提供的服务
hive是基于Hadoop构建的一套数据仓库分析系统,它提供了丰富的SQL查询方式来分析存储在Hadoop分布式文件系统中的数据:可以将结构化的数据文件映射为一张数据库表,并提供完整的SQL查询功能;可以将SQL语句转换为MapReduce任务运行,通过自己的SQL查询分析需要的内容,这套SQL简称Hive SQL,使不熟悉mapreduce的用户可以很方便地利用SQL语言查询、汇总和分析数据。
2022-11-19 16:47:24 340
原创 VScode退出全屏
好家伙,我就随便点着玩,然后退出不了了,网上说按F11就行,我按半天了,只能调亮度,无了个大语,结果我这个猪脑子,按F类型的键得+Fn,就在Ctrl旁边,我半天都没看见,气死了o(╥﹏╥)o。
2022-11-14 21:23:23 1054 1
原创 VScode退出全屏
好家伙,我就随便点着玩,然后退出不了了,网上说按F11就行,我按半天了,只能调亮度,无了个大语,结果我这个猪脑子,按F类型的键得+Fn,就在Ctrl旁边,我半天都没看见,气死了o(╥﹏╥)o。
2022-11-14 16:31:21 563
原创 容斥问题的一个例题[银行行测]
上午做gf银行的行测题,有一道集合有关的题目,想了两分钟居然没想出来,我都听课了,居然还有我没见过的题目类型??结果,好家伙,下午听我刘哥的课,讲了道几乎一模一样的,呜呜呜,原来知识点在例题里,赶紧记录一下。
2022-10-28 18:38:50 391
原创 时间序列之单位根检验+显著性检验+固定/随机效应模型选择
时间序列的平稳性:如果序列随时间具有恒定的统计特性(稳定的均值、方差和不依赖于时间的自协方差),我们可以假设序列是平稳的。等严重后果,所以必须对每个变量进行单位根检验,这样能够保证每个变量的平稳性,平稳变量回归才是有效的。伪回归:两因素间本不存在因果关系,却被误认为存在。在面板数据和序列数据中,如果存在单位根,会产生。异方差检验:使用混合OLS回归还是变系数模型。若要证明序列平稳,即拒绝原假设,需要。ADF检验的python实现。豪斯曼检验(hausman)选择随机/固定效应模型。常用数据类型(金融)
2022-09-23 16:30:30 8171
原创 IP地址、子网掩码、默认网关介绍及例题计算
前段时间再公司要连有线来着,要自己设置IP,子网掩码和默认网关,我瞎弄了一通,被旁边的姐姐科普了,还是不太懂,自己鼓捣了两天才大概明白这些玩意,记录一下~~
2022-09-09 14:15:48 20402 4
原创 力扣之环形链表
文章目录题目方法一:龟兔赛跑复杂度分析哈希表的方法题目方法一:龟兔赛跑如果真有环,那兔子肯定会和乌龟相遇,当然,兔子的速度肯定要比龟的快,这样才能有交集其实还是快慢指针的原理class Solution: def hasCycle(self, head: ListNode) -> bool: if not head or not head.next: return False slow = head
2022-05-03 16:49:45 712
原创 力扣之删除链表倒数第几个节点
题目主要有三个思路解决这个问题:第一个最普通的思路,获取链表长度,再操作len-n+1次,定位到被删除节点的前一个第二个思路,用栈,先让所有链表元素入栈,再一个一个退出,后入先出嘛,完美的工具第三个思路,我最爱的双指针,让俩指针相隔n个位置,这样前面的指针到头的时候,后面那个指针就刚好到要删除的那个节点的前一个,当然实现这样的想法还需要引入哑结点前两个方法也引入,这样可以让头结点普通化,否则还要对节点是否是头结点单独讨论栈的方法class Solution: def re
2022-04-28 14:53:39 1193
原创 SMOTE算法
文章目录算法原理算法存在的问题算法原理人工合成少数类样本它以每个样本点的k个最近邻样本点为依据,随机的选择N个邻近点进行差值乘上一个[0,1]范围的阈值,从而达到合成数据的目的核心:特征空间上邻近的点其特征都是相似的。它并不是在数据空间上进行采样,而是在特征空间中进行采样三个参数:样本集数据量,采样比例(是原来样本集的几倍),采样的最近邻数对样本集中的观测点,确定算法存在的问题batchnormalization层的作用解决梯度消失和梯度爆炸的一些方法解决过拟合的办法Adam优化
2022-03-24 10:14:55 533
原创 广度优先搜索
文章目录广度优先搜索(BFS,Borad-first Search)是一种图算法解决最短路径问题要解决的问题1:是否有从A到B的路问题2:若有路,最短路径怎么走可以把广度搜索理解成一系列的同心圆;先找离节点关系最近的,再找下一个最近的圆必须要把最近的圆里的每个元素都检查过才能到下一个圆这满足“先进先出”的规则,队列出现...
2022-03-21 13:18:34 152
原创 李航_统计学习
文章目录统计学习介绍假设空间策略损失函数与风险函数经验风险最小化结构风险最小化(SRM)算法1.5正则化与交叉检验1.6泛化能力统计学习介绍统计学习三要素:模型、算法、策略模型就是要学习的条件概率分布(概率模型)/决策函数(非概率模型)统计学习(statistical learning)是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科.统计学习也称为统计机器学习 (statistical machine learning).统计学习关于数据的基本假设是同类数据具
2022-03-16 21:39:00 630
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人