GUI Research Group
机器学习, 生物信息
展开
-
20应用统计考研复试要点(part1)--统计学
学习笔记,仅供参考,有错必纠贾俊平统计学数据的搜集数据的来源统计数据主要来自两条渠道:一个是数据的间接来源,即数据是由别人通过调查或实验的方式搜集的,使用者只是找到它们并加以使用。另一个是通过自己的调查或实验活动,直接获得第一手数据,对此我们称为数据的直接来源。概率抽样与非概率抽样概率抽样也称随机抽样,是指遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选人样本。...原创 2020-05-04 12:48:18 · 2635 阅读 · 1 评论 -
机器学习面试题(part3)
单选题原创 2021-03-14 08:39:15 · 206 阅读 · 0 评论 -
机器学习面试题(part4)
单选题原创 2021-03-14 08:59:42 · 188 阅读 · 0 评论 -
机器学习面试题(part5)
多选题原创 2021-03-14 09:10:58 · 175 阅读 · 0 评论 -
机器学习面试题(part2)
学习笔记单选题原创 2021-03-14 08:24:20 · 191 阅读 · 0 评论 -
机器学习面试题(part1)
机器学习单选题原创 2021-03-14 08:05:35 · 251 阅读 · 0 评论 -
数据分析师实习岗笔试题(part1)
笔试后记,仅供参考因为公司说不能泄露笔试题,所以我就加了点润色,但是不影响内容限时免费:1天前言笔试时间:2020年6月笔试方式:在线笔试笔试内容:sql语言、R语言/python、统计学相关知识笔试时间:2小时之内来几个励志的名人名言吧要随时牢记在心中:决心取得成功比任何一件事情都重要。——林肯烈火试真金,逆境试强者。——塞内加笔试内容第一题现在需要按月统计汇总,得到最近1个月每个省份每个月的成交总数,输出结果是省份、月份、成交总数,其中同一个省份按月份从前到后原创 2020-06-10 11:40:28 · 1449 阅读 · 0 评论 -
算法工程师实习岗面试题(part1)
面试笔记,不一定记得很全,但大概是这个意思因为公司说不能泄露面试题,所以我就加了点润色,但是不影响内容限时免费:1天前言面试时间:2020年6月面试方式:电话面试面试内容:数据挖掘及机器学习,包含一些编程面试时间:25分钟来几个励志的名人名言吧只有经历过地狱般的磨砺,才能练就创造天堂的力量;只有流过血的手指,才能弹出世间的绝响。——泰戈尔未曾失败的人恐怕也未曾成功过——佚名人的一切痛苦,本质上都是对自己的无能的愤怒。——王小波面试内容面试官:说出你的故事(原创 2020-06-09 21:41:01 · 2191 阅读 · 0 评论 -
JAVA面试题(part6)--局部内部类
学习笔记,仅供参考JAVA面试题观察以下代码,要求在问号处填空,在控制台输出30, 20, 10class Test1_InnerClass { public static void main(String[] args) { Outer.Inner oi = new Outer().new Inner(); oi.show(); }}class Outer { public int num = 10; class Inner { public int num =原创 2020-06-02 23:16:13 · 169 阅读 · 0 评论 -
JAVA面试题(part5)--多态与抽象类
学习笔记,仅供参考JAVA面试题观察以下代码,看他的输出是啥代码:class PolymorphicTest2 { public static void main(String[] args) { A a = new B(); a.show(); System.out.println("--------"); B b = new C(); b.show(); }}class A { public void show() { show2(); }原创 2020-06-02 12:01:51 · 247 阅读 · 0 评论 -
JAVA面试题(part4)--控制跳转语句
学习笔记,仅供参考JAVA面试题请问下面的代码会不会出错class Test0530 { public static void main(String[] args) { http://baidu.com/ System.out.println("Hello World!"); }}回答:不会,因为http:相当于一个标号,而//baidu.com/相当于一行注释return, break, continue的区别回答:return是结束方法,break是跳出循环,原创 2020-05-30 08:54:20 · 212 阅读 · 0 评论 -
JAVA面试题(part3)--if条件语句
学习笔记,仅供参考JAVA面试题问下面的代码出错的原因是啥?class IfTest { public static void main(String[] args) { int age = 22; if (age >=18) int x = 10; System.out.println("OK."); }}出错语句:int x = 10;出错原因:因为int x = 10;是两句话,int x 声明是一句话,x = 10 赋值是另一句话原创 2020-05-29 18:13:40 · 340 阅读 · 0 评论 -
JAVA面试题(part2)--位运算符
学习笔记,仅供参考JAVA面试题如何实现两个整数的变量交换?方法:创建中间变量class OperatorTest9 { public static void main(String[] args) { int x = 10; int y = 5; int temp; temp = x; x = y; y = temp; System.out.println("x = " + x); System.out.println("y = " + y); }原创 2020-05-29 10:12:48 · 300 阅读 · 0 评论 -
JAVA面试题(part1)--变量相加与常量相加
学习笔记,仅供参考JAVA面试题看下面的程序是否有问题,如果有问题,请指出并说明理由代码1class Test0528 { public static void main(String[] args) { //test1 byte b1 = 3; byte b2 = 4; byte b3 = b1 + b2; System.out.println(b3); }}输出:---------- javac ----------Test原创 2020-05-28 18:41:20 · 353 阅读 · 0 评论 -
20应用统计考研复试要点(part2)--统计学
应用统计考研复试要点(part2)–统计学学习笔记,仅供参考,有错必纠具体原理:统计量及其抽样分布 ;数据的概括性度量文章目录贾俊平统计学数据的分布特征概率与概率分布统计量及其抽样分布贾俊平统计学数据的分布特征概率与概率分布样本、事件和样本空间总体:是包含所研究的全部个体(数据)的集合。样本:是从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本量。随机事件...原创 2020-05-04 16:09:00 · 1371 阅读 · 1 评论 -
20应用统计考研复试要点(part3)--统计学
学习笔记,仅供参考,有错必纠具体原理:参数估计文章目录贾俊平统计学参数估计假设检验贾俊平统计学参数估计参数估计参数估计:就是在抽样及抽样分布的基础上,用样本统计量去估计总体的参数。参数估计是推断统计的重要内容之一。估计量与估计值样本的函数称之为统计量,而用于估计的统计量则被称为估计量。由于统计量对于不同的样本取值不同,所以估计量就是随机变量,并有其分布。如果样本已...原创 2020-05-04 19:48:05 · 866 阅读 · 0 评论 -
20应用统计考研复试要点(part4)--统计学
学习笔记,仅供参考,有错必纠具体原理:分类数据分析贾俊平统计学分类数据分析卡方检验卡方检验是对分类数据的频数进行分析的统计方法。卡方统计量χ2=∑(f0−fe)2fe\chi^2 = \sum \frac{(f_0-f_e)^2}{f_e}χ2=∑fe(f0−fe)2拟合优度检验拟合优度检验是用卡方统计量进行统计显著性检验的重要内容之一。它是依据总体...原创 2020-05-04 20:27:00 · 664 阅读 · 0 评论 -
20应用统计考研复试要点(part5)--统计学
学习笔记,仅供参考,有错必纠贾俊平统计学变量选择与逐步回归根据多个自变量建立回归模型时,若试图将所有的自变量都引进回归模型,带来的问题往往让人无所适从,或者是对所建立的模型不能进行有效的解释。变量选择过程在建立回归模型时,总希望尽可能用最少的变量来建立模型。但究竟哪些自变量应该引入模型,哪些自变量不应该引入模型,这就要对自变量进行一定的筛选。如果在进行回归时,每次只增加一个变...原创 2020-05-04 21:44:31 · 743 阅读 · 0 评论 -
20应用统计考研复试要点(part6)--统计学
学习笔记,仅供参考,有错必纠贾俊平统计学指数指数的概念指数,或称统计指数,有广义和狭义之分。广义:同类现象对比的相对数。狭义:测定多项内容数量综合变动的相对数。指数的分类按照考察对象的范围不同,可分为个体指数和总指数。按照所反映指标的性质不同,可分为数量指标指数和质量指标指数。按照计算形式不同,可分为简单指数和加权指数。指数编制中的问题指数编制过程中,需要...原创 2020-05-04 23:35:28 · 1431 阅读 · 0 评论 -
20应用统计考研复试要点(part7)--统计学
学习笔记,仅供参考,有错必纠贾俊平统计学无量纲化处理统计标准化这是一种通用的将具体数值转变为标准模式的做法,公式表示为:zi=xi−x‾sz_i= \frac{x_i - \overline{x}}{s}zi=sxi−x式中,ziz_izi,为第iii个指标的标准化值; x‾\overline{x}x为xix_ixi的均值;sss为标准差相对标准化这种方法...原创 2020-05-05 10:54:57 · 571 阅读 · 0 评论 -
20应用统计考研复试要点(part8)--应用多元分析
学习笔记,仅供参考,有错必纠王学明应用多元分析矩阵代数定义p∗qp*qp∗q阶矩阵,常记作A=(aij):p×qA=(a_{ij}):p \times qA=(aij):p×q若q=1q=1q=1,则称A为ppp维列向量:若p=1p=1p=1,则称A为q维行向量:a′=(a1,a2,...,aq)a'=(a_1,a_2,...,a_q)a′=(a1,a2,.....原创 2020-05-05 15:56:40 · 468 阅读 · 0 评论 -
20应用统计考研复试要点(part9)--应用多元分析
学习笔记,仅供参考,有错必纠王学明应用多元分析矩阵代数行列式定义p阶方阵A=(aij)A=(a_{ij})A=(aij)的行列式定义为:这里的∑j1j2...jp\sum_{j_1j_2...j_p}∑j1j2...jp表示对1,2,…p的所有排列求和,τ(j1,j2,...jp)\tau(j_1,j_2,...j_p)τ(j1,j2,...jp)是排列j...原创 2020-05-05 16:50:14 · 415 阅读 · 0 评论 -
20应用统计考研复试要点(part10)--应用多元分析
学习笔记,仅供参考,有错必纠王学明应用多元分析矩阵代数矩阵的秩定义存在一组同维向量a1,a2,...,ana_1,a_2,...,a_na1,a2,...,an,若存在不全为零的常数c1,c2,...,cnc_1,c_2,...,c_nc1,c2,...,cn,使得:c1a1+c2a2+...+cnan=0c_1a_1 + c_2a_2 + ...+ c_na...原创 2020-05-05 20:17:37 · 385 阅读 · 0 评论 -
20应用统计考研复试要点(part11)--应用多元分析
学习笔记,仅供参考,有错必纠王学明应用多元分析矩阵代数正定矩阵和非负定矩阵定义设A是p阶对称矩阵,xxx是p维向量,则x′Axx'Axx′Ax称为A的二次型。若对一切x≠0x \not= 0x=0,有x′Ax>0x'Ax > 0x′Ax>0,则称A为正定矩阵,记作A>0A>0A>0若对一切xxx,有x′Ax≥0x'Ax \geq ...原创 2020-05-05 21:32:52 · 472 阅读 · 0 评论 -
20应用统计考研复试要点(part12)--应用多元分析
学习笔记,仅供参考,有错必纠王学明应用多元分析随机向量多元分布多元概率分布函数一个向量,若它的分量都是随机变量,则称之为随机向量。随机变量xxx的分布函数为:F(a)=P(x≤a)F(a)=P(x \leq a)F(a)=P(x≤a)随机向量x=(x1,x2,...,xp)′x=(x_1, x_2, ..., x_p)'x=(x1,x2,...,xp)′的分布函...原创 2020-05-06 08:30:19 · 406 阅读 · 0 评论 -
20应用统计考研复试要点(part13)--应用多元分析
学习笔记,仅供参考,有错必纠王学明应用多元分析随机向量数字特征相关矩阵设x和y是两个随机变量,它们之间的相关系数定义为:它度量了x和y之间线性相关关系的强弱,ρ\rhoρ的取值范围为[−1,1][-1,1][−1,1]设x=(x1,x2,...,xp)′x=(x_1, x_2, ..., x_p)'x=(x1,x2,...,xp)′和y=(y1,y2,...,yq...原创 2020-05-06 09:46:48 · 402 阅读 · 0 评论 -
20应用统计考研复试要点(part14)--应用多元分析
学习笔记,仅供参考,有错必纠王学明应用多元分析多元正态总体的统计推断均值向量的检验设x1,x2,...,xnx_1,x_2,...,x_nx1,x2,...,xn是取自多元正态总体Np(μ,Σ)N_p(\mu, \Sigma)Np(μ,Σ)的一个样本,这里Σ>0\Sigma > 0Σ>0,现欲检验:H0:μ=μ0,H1:μ≠μ0H_0: \mu=\m...原创 2020-05-06 11:26:56 · 794 阅读 · 0 评论 -
20应用统计考研复试要点(part15)--应用多元分析
学习笔记,仅供参考,有错必纠王学明应用多元分析多元正态总体的统计推断多个总体均值的比较对不起,我真的是太懒了,直接贴截图吧:T、E、H分别称为总平方和及叉积和矩阵、误差(或组内)平方和及叉积和矩阵(简称组内矩阵)、处理(或组间)平方和及叉积和矩阵(简称组间矩阵),它们分别具有自由度(n-1)、(n-k)、(k-1)这与一元方差分析相同。采用似然比方法可以得到威尔克斯Λ\La...原创 2020-05-06 13:11:35 · 530 阅读 · 3 评论 -
20应用统计考研复试要点(part16)--应用多元分析
学习笔记,仅供参考,有错必纠王学明应用多元分析判别分析贝叶斯判别贝叶斯统计思想假定对研究对象已有一定认识,常用先验概率分布来描述这种认识,然后抽取样本来修正已有认识,得到后验概率分布,各种统计推断都通过后验概率分布来进行。最大后验概率法设有k个组πi,π2,...,πk\pi_i,\pi_2,...,\pi_kπi,π2,...,πk,且组πi\pi_iπi的概...原创 2020-05-06 19:22:51 · 495 阅读 · 0 评论 -
20应用统计考研复试要点(part17)--概率论与数理统计
学习笔记,仅供参考,有错必纠茆诗松概率论与数理统计随机事件与概率随机事件及其运算随机现象在一定的条件下,并不总是出现相同结果的现象称为随机现象。随机现象有两个特点:结果不止一个;哪一个结果出现,人们事先并不知道.只有一个结果的现象称为确定性现象。必然事件和不可能事件结果只有1个,所以不是随机事件,它们在本书中作为随机事件的两个端点。随机试验对在相同条件下可以重复的随机现象的观察、记录、实验称为随机试验。随机试验具有重复性、结果可知性和随机性。样本空间随原创 2020-05-09 10:16:06 · 705 阅读 · 0 评论 -
20应用统计考研复试要点(part18)--概率论与数理统计
学习笔记,仅供参考,有错必纠茆诗松概率论与数理统计随机事件与概率概率的定义及其确定方法概率的公理化定义确定概率的频率方法确定概率的频率方法是在大量重复试验中,用频率的稳定值去获得概率的一种方法,其基本思想是:(1)与考察事件A有关的随机现象可大量重复进行。(2)在n次重复试验中,记n(A)n(A)n(A)为事件A出现的次数,又称n(A)n(A)n(A)为事件A的频数,称:fn(A)=n(A)nf_n(A)=\frac{n(A)}{n}fn(A)=nn(A)为事原创 2020-05-09 15:22:01 · 716 阅读 · 0 评论 -
20应用统计考研复试要点(part19)--概率论与数理统计
学习笔记,仅供参考,有错必纠茆诗松概率论与数理统计随机事件与概率概率的性质利用概率的公理化定义(非负性、正则性和可列可加性),可以导出概率的一系列性质。以下我们逐个给出概率的一些常用性质。性质1P(∅)=0P(\emptyset)=0P(∅)=0性质2(有限可加性)若有限个事件A1,A2,...,AnA_1,A_2,...,A_nA1,A2,...,An互不相容,则有:P(⋃i=1nAi)=∑i=1nP(Ai)P \left( \bigcup_{i=1}^n A_i原创 2020-05-09 16:10:11 · 618 阅读 · 0 评论 -
20应用统计考研复试要点(part20)--概率论与数理统计
学习笔记,仅供参考,有错必纠茆诗松概率论与数理统计随机事件与概率条件概率条件概率的定义所谓条件概率,它是指在某事件B发生的条件下,求另一事件A的概率,记为P(A∣B)P(A|B)P(A∣B),它与P(A)P(A)P(A)是不同的两类概率.设A与B是样本空间Ω\OmegaΩ中的两事件,若P(B)>0P(B)>0P(B)>0,则称:P(A∣B)=P(AB)P(B)P(A|B)=\frac{P(AB)}{P(B)}P(A∣B)=P(B)P(AB)为在B发生下A的原创 2020-05-09 17:10:07 · 860 阅读 · 0 评论 -
20应用统计考研复试要点(part21)--概率论与数理统计
学习笔记,仅供参考,有错必纠茆诗松概率论与数理统计随机事件与概率独立性两个事件之间的独立性是指:一个事件的发生不影响另一个事件的发生。两个事件独立定义:若下式成立,则称事件A与B相互独立,简称A与B独立,否则称A与B不独立或相依。P(AB)=P(A)P(B)P(AB)=P(A)P(B)P(AB)=P(A)P(B)性质:若事件A与B独立,则A与B‾\overline{B}B独立,A‾\overline{A}A与B独立,A‾\overline{A}A与B‾\overline{B原创 2020-05-10 09:00:53 · 907 阅读 · 0 评论 -
20应用统计考研复试要点(part22)--简答题
学习笔记,仅供参考,有错必纠简答题统计学中的三大分布分别是哪三大分布,其均值和方差分别是多少?χ2\chi^2χ2分布、ttt分布、FFF分布,常称为统计三大分布。χ2\chi^2χ2分布:χ2\chi^2χ2分布的数学期望:E(χ2)=nE(\chi^2)=nE(χ2)=nχ2\chi^2χ2分布的方差:D(χ2)=2nD(\chi^2)=2nD(χ2)=2nttt分布:当n≥2n \ge 2n≥2时,ttt分布的数学期望E(t)=0E(t)=0E(t)=0当n≥3n \原创 2020-05-14 10:15:10 · 721 阅读 · 0 评论 -
20应用统计考研复试要点(part23)--简答题
学习笔记,仅供参考,有错必纠简答题主成分分析的基本思想主成分分析是一种通过降维技术把多个变量化为少数几个主成分(综合变量)的统计分析方法。这些主成分能够反映原始变量的绝大部分信息,它们通常表示为原始变量的某种线性组合,且彼此不相关。什么是Fisher判别法Fisher判别法是判别分析的方法之一,它是借助于方差分析的思想,利用已知各总体抽取的样品的p维观察值构造一个或多个线性判别函数y=l′xy=l'xy=l′x,使不同总体之间的离差(记为B)尽可能地大,而同一总体内的离差(记为E)原创 2020-05-14 10:45:28 · 724 阅读 · 0 评论 -
20应用统计考研复试要点(part24)--简答题
学习笔记,仅供参考,有错必纠简答题什么是数据的离散程度,列举5种,并说明其特点数据的离散程度反映的是各变量值远离其中心值的程度。异众比率,是指非众数组的频数占总频数的比例,其计算公式为:四分位差,也称为内距或四分间距,它是上四分位数与下四分位数之差用QLQ_LQL表示,其计算公式为:Qd=QU−QLQ_d=Q_U-Q_LQd=QU−QL极差,一组数据的最大值与最小值之差称为极差,也称全距,用R表示。其计算公式为:R=max(xi)−min(xi)R=max(x原创 2020-05-14 11:46:10 · 1615 阅读 · 6 评论 -
20应用统计考研复试要点(part25)--简答题
学习笔记,仅供参考,有错必纠简答题概率的公理化定义什么是显著性检验,假设检验的方法有哪些?显著性检验就是事先对总体的参数或总体分布形式做出一个假设,然后利用样本信息来判断这个假设是否合理,即判断总体的真实情况与原假设是否有显著性差异。显著性检验的就是利用小概率事件实际不可能性原理来判断是否拒绝原假设。假设检验的方法:z检验、t检验、F检验、卡方检验判别分析的目的,说出几种判别分析的方法按照一定的判别准则,建立一个或多个判别函数,利用大量的研究对象资料来确定判别函数中的待原创 2020-05-14 12:33:18 · 833 阅读 · 0 评论 -
20应用统计考研复试要点(part26)--简答题
学习笔记,仅供参考,有错必纠简答题非参数统计中秩的概念,说几种非参数检验方法非参数检验中秩(rank)是最常使用的概念,一般来说,秩就是该数据按照升幂排列之后,每个观测值的位置。我们以下面的数据为例:利用秩的大小进行推断就避免了不知道背景分布的困难。这也是大多数非参数检验的优点,多数非参数检验明显地或隐含地利用了秩的性质,但也有一些非参数方法没有涉及秩的性质。检验方法:总体分布的卡方检验、单样本位置的符号秩检验、随机性的游程检验、两独立总体位置的秩和检验什么是多重共线性?多重原创 2020-05-14 16:34:15 · 1306 阅读 · 0 评论 -
20应用统计考研复试要点(part27)--简答题
学习笔记,仅供参考,有错必纠简答题显著性水平α\alphaα的含义,举例说明如何利用显著性水平进行检验显著性水平,是在原假设正确的情况下,错误的拒绝原假设的概率。显著性水平用α\alphaα表示。举例:(1)提出原假设H0H_0H0和备择假设H1H_1H1,同时,指出所作检验为双尾检验还是左单尾或右单尾检验。(2)构造检验统计量,收集样本数据,计算检验统计量的样本观察值。(3)根据所提出的显著水平,确定临界值和拒绝域。(4)作出检验决策,把检验统计量的样本观察值和临界值进行比较原创 2020-05-14 17:47:00 · 628 阅读 · 0 评论