自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(309)
  • 收藏
  • 关注

原创 Excel 数据透视表 统计数据

需要对下载的评价问卷数据进行一个计数统计。比如以被评单位为标准进行一个计数。

2023-12-11 14:58:27 575

原创 vscode修改markdown侧边预览pdf字体等设置

然后在文件内加上下面两行设置字体大小和样式,再Ctrl+S保存该文件即可。

2023-06-28 15:42:57 1707

原创 集成学习(bagging/boosting/stacking)BERT,Adaboost

集成学习是集合多个弱监督模型,通过一定的结合策略,得到一个更好更全面的强监督模型的过程.潜在的思想是即使某一个弱分类器得到了错误的预测,其他的弱分类器也可以将错误纠正回来

2023-03-01 20:43:09 611 1

原创 秋招面试问题整理之机器学习篇

2023秋招中被问到的关于机器学习的问题

2023-02-21 20:48:40 436

原创 假设检验选择统计量重点-----正态总体参数的假设检验

此时有两种情况:

2023-02-19 17:05:37 876

原创 数据分析面试---假设检验知识点

显著性检验(significance test)统计显著性和置信度补充:第一类错误和第二类错误p值是啥XFX;

2023-02-16 21:13:02 749

原创 聚类分析--基本原理、方法(Kmeans,层次聚类)

聚类分析就是将研究对象根据一些特征指标,把比较相似的研究对象,按一定的方式归为同类。

2023-02-09 22:16:38 14637 2

原创 面试--机器学习中的基本概念(重要)

机器学习面试可能会问的基本概念

2022-12-28 23:03:43 126

原创 算法工程师需要学习的基础

应该早点系统地了解算法工程师需要学习的东西的,B站上的up主:梁唐讲的很好,大家可以去看一下,只截了一部分图做一个记录。

2022-12-28 22:05:48 181

原创 Hive中数据类型介绍

当于关系数据库中的命名空间( namespace ),它的作用是将用户和数据库的应用,隔离到不同的数据库或者模式中。

2022-12-13 23:43:56 408

原创 秋招---SQL学习

2.可能用到覆盖索引,减少回表,提高查询效率(啥意思,覆盖索引、回表查询?还有一种情况可能会用or,比如要查询某个字段等于好几个值。也可以改写成union all形式。在sql中,整型数据有以上四种类型。1.节省资源、减少网络开销。√:用union all。

2022-12-08 22:37:47 421

原创 求某个数开几次方根(二分法、数值分析、运筹学、牛顿法和拟牛顿法)

今天面试了一家公司,面试官很厉害,随机出题,考得我头都大了,还是自己太菜了,以前学的东西不会学以致用,都忘了,面试的时候很丢人,以后还是要继续学习啊,虽然马上要毕业了,但本专业的知识是立足之本,专业知识都不牢,别人怎么相信你在其他地方做的好?立下flag,以后每天要回顾一个专业知识点!逼近

2022-12-07 22:08:36 438

原创 1124面试复盘总结--hive

hive是基于hadoop的数据仓库它适用于什么场景提出的/适用于什么场景提供什么功能怎么查询,查询的内部转化流程缺点是什么。

2022-11-24 22:00:48 2216

原创 笔记本电脑+第二块显示屏如何双屏操作

买了个戴尔的vga转换器,用来连接实验室的显示屏,然后并不知道如何操作,我的目的是:在自己的主电脑上写东西,需要第二块显示屏给我固定我需要参考的资料,我对着写。

2022-11-20 15:26:06 3562

原创 SQL 连接操作

SQL 连接操作。

2022-11-19 16:49:12 126

原创 Hive提供的服务

hive是基于Hadoop构建的一套数据仓库分析系统,它提供了丰富的SQL查询方式来分析存储在Hadoop分布式文件系统中的数据:可以将结构化的数据文件映射为一张数据库表,并提供完整的SQL查询功能;可以将SQL语句转换为MapReduce任务运行,通过自己的SQL查询分析需要的内容,这套SQL简称Hive SQL,使不熟悉mapreduce的用户可以很方便地利用SQL语言查询、汇总和分析数据。

2022-11-19 16:47:24 340

原创 VScode退出全屏

好家伙,我就随便点着玩,然后退出不了了,网上说按F11就行,我按半天了,只能调亮度,无了个大语,结果我这个猪脑子,按F类型的键得+Fn,就在Ctrl旁边,我半天都没看见,气死了o(╥﹏╥)o。

2022-11-14 21:23:23 1054 1

原创 VScode退出全屏

好家伙,我就随便点着玩,然后退出不了了,网上说按F11就行,我按半天了,只能调亮度,无了个大语,结果我这个猪脑子,按F类型的键得+Fn,就在Ctrl旁边,我半天都没看见,气死了o(╥﹏╥)o。

2022-11-14 16:31:21 563

原创 每天学习一点英语——number,amount,quantity区别、用法

number,amount,quantity用法

2022-11-01 19:42:01 3285

原创 容斥问题的一个例题[银行行测]

上午做gf银行的行测题,有一道集合有关的题目,想了两分钟居然没想出来,我都听课了,居然还有我没见过的题目类型??结果,好家伙,下午听我刘哥的课,讲了道几乎一模一样的,呜呜呜,原来知识点在例题里,赶紧记录一下。

2022-10-28 18:38:50 391

原创 银行行测之百炼成钢

银行行测

2022-09-25 16:33:08 283

原创 时间序列之单位根检验+显著性检验+固定/随机效应模型选择

时间序列的平稳性:如果序列随时间具有恒定的统计特性(稳定的均值、方差和不依赖于时间的自协方差),我们可以假设序列是平稳的。等严重后果,所以必须对每个变量进行单位根检验,这样能够保证每个变量的平稳性,平稳变量回归才是有效的。伪回归:两因素间本不存在因果关系,却被误认为存在。在面板数据和序列数据中,如果存在单位根,会产生。异方差检验:使用混合OLS回归还是变系数模型。若要证明序列平稳,即拒绝原假设,需要。ADF检验的python实现。豪斯曼检验(hausman)选择随机/固定效应模型。常用数据类型(金融)

2022-09-23 16:30:30 8171

原创 循环队列基本知识与代码

循环队列基本知识,相关计算,代码

2022-09-21 11:07:50 976

原创 markdown添加代码块,并给代码块每行前加序列数

在开始的点点后面加{.line-numbers}

2022-09-16 14:48:12 766

原创 IP地址、子网掩码、默认网关介绍及例题计算

前段时间再公司要连有线来着,要自己设置IP,子网掩码和默认网关,我瞎弄了一通,被旁边的姐姐科普了,还是不太懂,自己鼓捣了两天才大概明白这些玩意,记录一下~~

2022-09-09 14:15:48 20402 4

原创 力扣--查找数组中的任一重复元素

【代码】力扣--查找数组中的任一重复元素。

2022-09-07 10:36:24 241

原创 数据结构之八大排序及代码

数据结构中的排序

2022-09-05 14:15:23 502

原创 力扣之斐波那契数列

本来以为就是非常简单的一道题,想着递归大法来着,结果n=37时直接超过时间限制了o(╥﹏╥)o。

2022-08-26 10:43:14 869

原创 位运算与集合运算

位运算and集合

2022-08-26 10:25:58 292

原创 力扣:两个栈实现一个队列

【代码】力扣:两个栈实现一个队列。

2022-08-22 16:40:35 105

原创 精确率、召回率、AUC、ROC

机器学习常用评价指标

2022-08-22 15:32:39 206

原创 计算机体系结构之CPU、寄存器、存储器、内存等

2022-06-07 19:57:57 1605

原创 LSTM公式原理+Keras Pytorch LSTM中参数对比+每层LSTM参数计算

LSTM基础知识记得点赞喔(*^▽^*)

2022-06-03 16:09:39 1278

原创 Hive数据库操作 + Excel处理数据操作

文章目录记录一下这段期间实习的一些工作内容和处理

2022-05-31 18:04:32 372

原创 力扣之环形链表

文章目录题目方法一:龟兔赛跑复杂度分析哈希表的方法题目方法一:龟兔赛跑如果真有环,那兔子肯定会和乌龟相遇,当然,兔子的速度肯定要比龟的快,这样才能有交集其实还是快慢指针的原理class Solution: def hasCycle(self, head: ListNode) -> bool: if not head or not head.next: return False slow = head

2022-05-03 16:49:45 712

原创 力扣之删除链表倒数第几个节点

题目主要有三个思路解决这个问题:第一个最普通的思路,获取链表长度,再操作len-n+1次,定位到被删除节点的前一个第二个思路,用栈,先让所有链表元素入栈,再一个一个退出,后入先出嘛,完美的工具第三个思路,我最爱的双指针,让俩指针相隔n个位置,这样前面的指针到头的时候,后面那个指针就刚好到要删除的那个节点的前一个,当然实现这样的想法还需要引入哑结点前两个方法也引入,这样可以让头结点普通化,否则还要对节点是否是头结点单独讨论栈的方法class Solution: def re

2022-04-28 14:53:39 1193

原创 jupyter-notebook打开

文章目录打开anaconda命令行打开anaconda命令行输入 jupyter notebook即可

2022-04-19 13:40:59 1124

原创 SMOTE算法

文章目录算法原理算法存在的问题算法原理人工合成少数类样本它以每个样本点的k个最近邻样本点为依据,随机的选择N个邻近点进行差值乘上一个[0,1]范围的阈值,从而达到合成数据的目的核心:特征空间上邻近的点其特征都是相似的。它并不是在数据空间上进行采样,而是在特征空间中进行采样三个参数:样本集数据量,采样比例(是原来样本集的几倍),采样的最近邻数对样本集中的观测点,确定算法存在的问题batchnormalization层的作用解决梯度消失和梯度爆炸的一些方法解决过拟合的办法Adam优化

2022-03-24 10:14:55 533

原创 广度优先搜索

文章目录广度优先搜索(BFS,Borad-first Search)是一种图算法解决最短路径问题要解决的问题1:是否有从A到B的路问题2:若有路,最短路径怎么走可以把广度搜索理解成一系列的同心圆;先找离节点关系最近的,再找下一个最近的圆必须要把最近的圆里的每个元素都检查过才能到下一个圆这满足“先进先出”的规则,队列出现...

2022-03-21 13:18:34 152

原创 李航_统计学习

文章目录统计学习介绍假设空间策略损失函数与风险函数经验风险最小化结构风险最小化(SRM)算法1.5正则化与交叉检验1.6泛化能力统计学习介绍统计学习三要素:模型、算法、策略模型就是要学习的条件概率分布(概率模型)/决策函数(非概率模型)统计学习(statistical learning)是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科.统计学习也称为统计机器学习 (statistical machine learning).统计学习关于数据的基本假设是同类数据具

2022-03-16 21:39:00 630

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除