数据分析面试准备

数据分析面试准备

1、使用元组而不是列表有什么好处?
A元组的大小没有限制。
B-元组可以包含任何数据作为元素
C处理元组比处理列表快
D-使用元组没有优势。
【C】
元组固定大小,而列表是dynamic的; tuple是不可变的,而list是可变的 。

元组比列表更快。如果你正在定义一组常量值,并且你将要使用它来遍历它,
那么使用一个元组而不是一个列表。

列表是动态的,长度大小不固定,可以随意的增加、删除、修改元素元组是静态的,
长度在初始化的时候就已经确定不能更改,更无法增加、删除、修改元素
从tuple的源码中也可以看出,只有两个自带的方法,
一个是统计元素出现的次数一个是查询元素的索引。
2、以下关于ID和class的区别,描述错误的是
A ID在一个页面中只能使用一次,class可以多次使用
B ID比class有更高的优先级
C 一个元素只能有一个ID属性值,但可以有多个class属性值
D ID选择符前面应加前缀符号‘.’,class选择符前面应该加前缀符号‘#’
【D】
id是identity,id 属性规定 HTML 元素的唯一的 id。 id 在 HTML 文档中必须是唯一的。

id 属性可用作链接锚(link anchor),通过 JavaScript(HTML DOM)或通过 CSS 
为带有指定 id 的元素改变或添加样式

ID和class的优先级:
通过继承来的属性 id 的优先级高于 class
CSS的优先级顺序: tag中的style > id > class > 继承的属性
一个元素同时应用多个class,后定义的优先(即近者优先),加上!important者最优先!
3、LRU置换算法所基于的思想是?
A在最近的过去用得最少的在最近的将来也用得最少
B在最近的过去很久未使用的在最近的将来也不会使用
C在最近的过去用得多的在最近的将来也用得多
D在最近的过去很久未使用的在最近的将来会使用

【B】
利用局部性原理,根据一个作业在执行过程中过去的页面访问历史来推测未来的行为。 
它认为,过去一段时间里不曾被访问过的页面,在最近的将来可能也不会再被访问。
4、无网多状态切换属于弱网测试的哪方面
A弱网功能测试
B无网状态测试
C用户体验关注
D网络切换测试
【D】
弱网:一般应用低于2G速率的都属于弱网,也可以将3G划分为弱网。
除此之外,弱信号的Wifi通常也会被纳入到弱网测试场景中

弱网功能测试: 2G/3G/4G、高延迟、高丢包

无网络状态测试:网络断开功能测试、本地数据存储

用户体验兴趣:响应时间、页面显示超时拷贝超时重新连接、安全性和流量风险

网络切换测试----4g/3g/2g-----无网多状态切换
5、若个C类网络需要划分5个子网,则子网掩码是?
A 255.255.255.192
B 255.255.255.224
C 255.255.255.240
D 255.255.255.248
【B】
2^3=8
所以5个子网需要3个子网位,子网掩码是255.255.255.11100000
即255.255.255.224
6、在Linux操作系统中,找出当前且录以及其子目录所有扩展名为doc的文件,应该使用哪个命令?
A find -name "*doc"
B Is .doc
C ls-d .doc
D find -name ",doc"
【A】
7、关于Vue-Cli说法错误的是
A Vue-CLI是一个基于Vue.js进行快速开发的完整系统
B CLI(@vue/cli)是一个全局安装的npm包,提供了终端里的Vue命令
C CLI且前还不能提供图形化界面管理你的所有项目
D CLI服务是构建于Webpack和webpack-dev-server之上的
【C】来源力扣
可以通过vue ui一套图形化界面管理你的所有项目
8、在秒杀、抢购、评论、下单这些场景中,应该采用什么方法限制这些场景的并发量和请求量?
A降级
B限流
C缓存
D限速
【D】
9、当执行下面的代码时,循环执行了多少次迭代

number = 2;
done = false;
while(!done)
{
number = number * 2;
if (number >64)
done = true;
}

A 3
B 4
C 5
D 6
【D】
10、当我们删除一个管理表时,Hive( )删除这个表中数据,因此管理表( )和其他工具共享数据。
A会,适合
B会,不适合
C 不会,适合
D 不会,不适合
【B】
当我们删除一个管理表时,Hive也会删除这个表中数据。管理表不适合和其他工具共享数据。
11、为什么需要加入一个max pooling层,而不是相同stride的卷积层?
Max pooling层没有任何参数,而卷积层有参数(虽然很少)。
12、一个C++程序至少由多少个函数组成
A1
B 2
C3
D4
【A】main函数
13、关于GET和POST的区别,错误的是?
A GET只支持ASCII字符格式的参数,而POST方法没有限制。
B GET 方法产生两个TCP数据包,POST方法产生一个。
C GET 请求只支持URL编码,POST请求支持多种编码格式。
D GET方式需要使用Request.QueryString来取得变量的值,而POST方式通过Request.Form来获取。
【B】
1. GET在浏览器回退时是无害的,而POST会再次提交请求。
2. GET产生的URL地址可以被Bookmark,而POST不可以。
3. GET请求会被浏览器主动cache,而POST不会,除非手动设置。
4. GET请求只能进行url编码,而POST支持多种编码方式。
5. GET请求参数会被完整保留在浏览器历史记录里,而POST中的参数不会被保留。
6. GET请求在URL中传送的参数是有长度限制的,而POST么有。
7. 对参数的数据类型,GET只接受ASCII字符,而POST没有限制。
8. GET比POST更不安全,因为参数直接暴露在URL上,所以不能用来传递敏感信息。
9. GET参数通过URL传递,POST放在Request body中。
(本标准答案参考自w3schools)

GET和POST还有一个重大区别,简单的说:
GET产生一个TCP数据包;POST产生两个TCP数据包。

对于GET方式的请求,浏览器会把http header和data一并发送出去,服务器响应200(返回数据);
而对于POST,浏览器先发送header,服务器响应100 continue,浏览器再发送data,服务器响应200 ok(返回数据)。
也就是说,GET只需要汽车跑一趟就把货送到了,而POST得跑两趟,第一趟,先去和服务器打个招呼“嗨,我等下要送一批货来,你们打开门迎接我”,然后再回头把货送过去。
因为POST需要两步,时间上消耗的要多一点,看起来GET比POST更有效。因此Yahoo团队有推荐用GET替换POST来优化网站性能。但这是一个坑!跳入需谨慎。为什么?
1. GET与POST都有自己的语义,不能随便混用。
2. 据研究,在网络环境好的情况下,发一次包的时间和发两次包的时间差别基本可以无视。而在网络环境差的情况下,两次包的TCP在验证数据包完整性上,有非常大的优点。
3. 并不是所有浏览器都会在POST中发送两次包,Firefox就只发送一次。
14、k8s集群中,数据存储在什么位置?
A kubelet
B kube-apiserver
C etcd
D以上都不是
【C】
默认存储再在etcd键值存储系统
15、下列不是http2的优点是
A使用二进制传输
B多路复用
C使用udp协议
D头部压缩

HTTP2 优点

【C】
HTTP2 优点:
多路复用(Multiplexing):一个信道同时传输多路信号。
二进制分帧:将消息分成了更小的二进制编码的帧,各个帧之间存现相互关联的关系。
首部压缩 :将 TCP/IP 信息首部进行压缩处理,减小所占空间。
服务推送:请求资源时,将请求资源可能用到的资源也发送过去。
16、关于使用SSR进行服务端渲染的说法中,正确的是()?
A不利于SEO
B不利于首屏渲染
C服务端压力小
D开发条件受限
【D】
SSR是Server Side Render的缩写,简单来讲:服务端渲染 就是网页上面呈现的
内容在服务器端就已经生成好了,当用户浏览网页时,服务器把这个在服务端
生成好的完整的html结构内容响应给浏览器,而浏览器拿到这个完整的html结构
内容后直接显示(渲染)在页面上的过程。

以前传统的Web网页都是服务端渲染,如:JSP,ASP,.NET,SMARTY等等是
JAVA、C#、PHP等开发人员用的服务器渲染模板

SSR的优势:
有利于SEO:
不同爬虫工作原理类似,只会爬取源码,不会执行网站的任何脚本(Google除外,据说Googlebot可以运行javaScript)。使用了React或者其它MVVM框架之后,页面大多数DOM元素都是在客户端根据js动态生成,可供爬虫抓取分析的内容大大减少(如图一)。另外,浏览器爬虫不会等待我们的数据完成之后再去抓取我们的页面数据。服务端渲染返回给客户端的是已经获取了异步数据并执行JavaScript脚本的最终HTML,网络爬中就可以抓取到完整页面的信息。

有利于首屏渲染
首屏的渲染是node发送过来的html字符串,并不依赖于js文件了,这就会使用户更快的看到页面的内容。尤其是针对大型单页应用,打包后文件体积比较大,普通客户端渲染加载所有所需文件时间较长,首页就会有一个很长的白屏等待时间。

SSR的局限:

服务端压力较大
本来是通过客户端完成渲染,现在统一到服务端node服务去做。尤其是高并发访问的情况,会大量占用服务端CPU资源;

开发条件受限
在服务端渲染中,只会执行到componentDidMount之前的生命周期钩子,因此项目引用的第三方的库也不可用其它生命周期钩子,这对引用库的选择产生了很大的限制;

学习成本相对较高
除了对webpack、React要熟悉,还需要掌握node、Koa2等相关技术。相对于客户端渲染,项目构建、部署过程更加复杂。
18、投票法适用于()问题,平均法适用于()问题。
A回归,回归
B分类:关联
C分类:回归
D关联分类
【C】
投票法是一种遵循少数服从多数原则的集成学习模型,
通过多个模型的集成降低方差,从而提高模型的鲁棒性。
对于分类问题,通常使用相对多数投票法。对于回归问题,通常使用算术平均法。
19、以下代码,正确的是
func main(){
var wg sync.WaitGroup
ans := int64(0)
for i :=0;i<3;i++{
wg.Add(1)
go newGoRoutine(wg,&ans)
}
wg.Wait()
}
A死锁。
B i的值不一定是3
C i的值是3。

Golang Sync.WaitGroup 使用及原理

【】
20、竞选条件( race condition )的情况下,两线程执行如下代码段,其中count为共享变量,线程1执行Thread_ 1 ,线程2执行代Thread 2,那么变量count的值可能为
int count=10;
Thread_1()
{
//do something
count++;
}
Thread_2()
{
//do something
count--;
}
A9
B11
C8

腾讯2015校招笔试题选择题部分

【ABC】
21、在iPhone应用中保存数据的方式有?
A通过Web服务,保存在服务器上
B通过NSCoder固化机制,将对象保存在文件中
C通过SQlite或CoreData保存在文件数据库中
D以上都是
【C】
iOS应用数据存储的常用方式:
    1> XML属性列表(plist)归档.
    2> Preference(偏好设置).
    3> NSKeyedArchiver归档.
    4> SQLite3
    5> Core Data
22、以下Linux基础命令中,显示现行终端机下的所有程序,包括其他用户的程序使用的命令是?
A ps a
B ps -A
C ps c
D ps -e
【A】

在这里插入图片描述

23、简述CNN和RNN的不同之处
1.从应用方面来看CNN主要用于图像识别比较多,
而RNN被用于语言处理多一些,主要用于时序和NLP 
RNN的假设——事物的发展是按照时间序列展开的,即前一刻发生的事物会对未来的事情的发展产生影响。
2.当RNN、CNN都用于NLP时,它们的区别在于: 
RNN(循环神经网络),当前节点的输入包含之前所有节点信息。 
CNN(卷积神经网络),当前节点的输入以树结构形式仅包含上一层节点信息。
24、什么类型的函数最常用来判断一个数是偶数还是奇数?
A偶数
B奇数
C数学
D布小值
【D】
25、在UlKit中,用于响应用户点击事件的界面元素是?
A UILabel
B UIControl
C UIButton
D UITextField
【C】
Ulkit是轻量级和模块化的,用于创建快速但功能强大的Web界面。
26、lstio的功能不包括。
A连接
B侵入式
C控制
D安全

lstio的功能

【B】
27、反编译软件jd-gui的作用是?
A把APK文件反编译,取出资源
B把存有Java内容的dex文件反编译
C直看APK中classes.dex转化成的jar文件
0其他选项均不正确
【C】
“编译”:将源代码转换成二进制执行代码的过程(.java--->.class);
“反编译”:将二进制转换为源代码的过程(.class--->.java)。
把已经生成的Jar包反编译回代码的形式,没有经过代码混淆的Jar包反编译后和实际的源码会有一定的差别,但不影响阅读。
28、事务的隔离性是指?
A 事务中包含的所有操作要么都做,要么都不做
B 事务必须是使数据库从一个一致性状态变到另一个一致性状态
C 当事务正确完成后,它对于数居的改变是永久性的
D一个事务内部的操作及使用的数据对并发的其他务是隔离的
【D】
一个事务内部的操作及使用的数据对并发的其他事务是隔离的
29、在W3C标准盒模型中,默认情况下块元素的总宽度为:
A content
B content+2 padding
C content+2pading 2border
ODcontent+2padaling+2border+2margin
【A】
CSS有两种盒子模型,分别为W3C盒子模型和IE盒子模型。
区别在于,IE盒子模型的content部分,将border和padding包含进去了。
width = border+padding+content。
题干问的总宽度应该理解为width值为多少,而不是盒子的总宽度。
30、泊松分布的标准差记为σ,均数记为入,则当()时,油松分布近似正态分布。
A λ较大
B λ较小
C λ=0
D σ^2 >= 20
E  σ^2<= 10
F  σ = 0
【D】
31、把数据集分成K份,每个子集互不相交且大小相同,依次从K份中选出1份作为验证集,其余K-1份作为川练集,这样进行K次单独的模型训练和验证,最后将K次验证结果取平均值,作为此模型的验证误差。这种方法称为( )
A留一法
B K折交叉验证
C蒙特卡洛交叉验证
Bootstrap自助法
【B】
32、以下关于机器部署的说法正确的是?
A SonarQube Scanners可以水平拓展机器
B SonarQube Server和SonarQube Database可以不在同一网段
C SonarQube Scanners与SonarQube Server必须在同一网段
D SonarQube Scanners与SonarQube Database之间存在通信
【A】
1、只能有1个SonarQube Server 和1个 SonarQube Database
2、考虑性能优化,每一个组件(server, database, scanners)应当安装在不同的机器上,并且是专用服务器。
3、SonarQube Scanners 可以水平扩展机器
4、所有机器的时间必须要同步
5、SonarQube Server 和 SonarQube Database 必须在同一网段
6、SonarQubeScanners 与SonarQube Server可以不在同一网段
7、SonarQube Scanners 与 SonarQube Database之间没有通信
  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值