面试
sxjjxc
这个作者很懒,什么都没留下…
展开
-
数据分析-降维方法归纳
1.缺失值比率(Missing Value Rate)包含太多缺失值的列,包含的信息相对较少,可以将数据列缺失值数目大于某个阈值的列剔除2.低方差滤波(Low Variance Filter)数据列值变化较小的列,包含的信息较少。计算方差前应先对数据做归一化处理3. 高相关滤波(High Correlation Filter)如果两列的数据变化趋势相似,选择其中的一列就可满足要...原创 2020-08-18 15:00:01 · 1401 阅读 · 0 评论 -
计算机网络知识的学习
1. 负载均衡入门和一些基本概念https://blog.csdn.net/ffm83/article/details/42390045https://blog.csdn.net/qq_44718474/article/details/889369302. tomcat、nginx、apache的区别https://www.zhihu.com/question/32212996/answe...原创 2020-08-18 14:59:44 · 125 阅读 · 0 评论 -
数据分析SQL面经整理
其他:sql语句的执行顺序:from-->join-->on-->where-->groupby-->having-->select-->orderbysql语句的分类:DQL查询语句:select from where DDL定义语句:create alter drop ...原创 2020-08-18 14:56:40 · 1809 阅读 · 0 评论 -
顺丰科技面经整理
1.逻辑回归函数的思想,损失函数,损失函数怎么求的,参数更新,正则化知识2.数据倾斜问题是什么?数据倾斜的原因?怎么解决?3.SQL语句:连续登陆三天以上的用户的消费总额4.时间序列分析怎么做?5.时间序列应该考虑哪些关键点?趋势、周期、时期、不稳定因素6.手机销售额下降怎么分析?7.要推广一个新产品,从哪些方面入手?首先必须要确定新产品人群定位,可以分析这部分人群...原创 2020-08-18 14:45:36 · 805 阅读 · 0 评论 -
工商上海分行-预面试
1.自我介绍2.银行的技术岗位都是和业务相结合的,你打算怎么把技术与业务相结合?3.介绍一下你的本科学校?我的本科学校是在海滨城市烟台, 是一所综合性的二本院校,前身是烟台师范学院,文化底蕴深厚,已经建校89周年了。而且我们学校的学风也是比较好的,虽然是二本院校,但是考研率还挺高的,同学们都很积极上进。4.山东省优秀毕业生,你觉得因为什么会被评为这个?5.你是党员...原创 2020-08-18 14:55:30 · 129 阅读 · 0 评论 -
性格问题
1.与别人相比有什么优势,体现在哪里?我不太了解其他人的情况,虽然我作为应届生没有什么工作经验,但是性格方面比较有毅力,比如我在扇贝单词已经坚持打卡600多天,并且会一直坚持下去。工作能力方面,数据分析师的硬技能python、SQL和机器学习算法我也是熟悉的,并且在实习和课题中有一定的应用,因为在互联网行业实习过,掌握数据分析师所必备的软技能业务分析能力,比如常用的分析指标,指标拆解的思维,...原创 2020-08-18 14:57:11 · 201 阅读 · 0 评论 -
面经 - 小红书 数据分析师
1.自我介绍2.为什么想做数据分析师?对这个行业有什么期望?3.实习做过觉得最成功的一件事?4.用户拐点确定,都找到哪些拐点了?针对拐点有没有想过为什么会出现过这两个拐点?5.sql语句:求所有用户登录的平均时间差lag函数6.小红书发布内容“+“处添加引导功能,怎么评判这个功能加的好不好?你认为哪个指标是最关注的?答了:A/B测试,引导功能的点击pv、uv(跳过...原创 2020-08-18 14:55:22 · 2051 阅读 · 0 评论 -
面经 - 流利说 数据分析师
一面1.自我介绍2.实习中感觉最自豪的一件事,对公司帮助最大背景:米读小说APP在ios应用市场的平均特别低,运营那边需要对一批质量较高的用户做评论引导职责:在表征用户行为的特征中,选择用户近30日阅读时长,用户加入书架书籍数、用户近30天活跃天数、用户的vip状态等九个指标,首先进行数据的预处理,像用户阅读时长、加书架书籍数等数据指标的分布较为长尾,为保证结果的可靠性,将长尾用...原创 2020-08-18 14:55:52 · 484 阅读 · 0 评论 -
数据分析业务题
1.日活下降怎么分析?一. 首先向技术确认是否是数据异常导致,是否是数据延迟上报等原因导致数据不正确二. 内部原因分析:日活用户由新增用户、老用户、回流用户组成,按用户维度进行拆分,确定是那部分用户导致的日活下降1.如果是新增用户导致的日活下降,可以看下各个拉新渠道的新增用户数,是否是某个拉新渠道出了问题2.如果是老用户导致的日活下降,再对老用户按照年龄、是否是学生、地区、...原创 2020-08-18 14:58:17 · 2740 阅读 · 0 评论 -
数据分析统计知识
1.变异系数1.应用场景: 比较不同样本数据的离散程度时,由于样本基数不同,使用变异系数,变异系数越大,样本的离散程度越大2.定义: 变异系数=样本标准差 / 样本均值2.偏度和峰度1.偏度:偏度是数据分布对称性的度量,正态分布的偏度为0,右长尾分布的是正偏态,左长尾分布的是负偏态2.峰度:正态分布的峰度为0,如果峰度>0,形态比正态分布...原创 2020-08-18 14:58:27 · 615 阅读 · 0 评论 -
面经 - 中兴(软件测试)
1.什么是事务?事务的特性事务就是一组操作步骤要么同时发生,要么一步也不执行,它保证了数据始终一致的状态,不破坏数据的完整性。比如说同时修改两个表,如果他们是一个事务,当第一个表修改成功而第二个表修改失败时,则两个表都回到修改前的状态,如果他们不是一个事务,只有第二个修改失败的表回到初始状态A原子性:事务是一个不可分割的操作,要么全部执行,要么全部不执行C一致性:事务执行前后数据...原创 2020-08-18 14:56:07 · 2339 阅读 · 0 评论 -
面经 - 浪潮openday
1. python多线程与多进程区别1. 最大区别是:多进程中,同一个变量,各有一个拷贝存在于每个进程中,互不影响,而多线程中,所有变量由所有线程共享i2.字符串中查找或删除某个字符的查找:pandas中:df['col'].str.contains('substring') ------模糊筛选python中:(1) str.find(str, beg=0, e...原创 2020-08-18 14:56:18 · 336 阅读 · 0 评论 -
为面试整理:常见机器学习算法
1.KNN思想:已知带有标签的训练集数据,给定一个测试数据,计算这个测试数据到训练集中各个点的距离并进行排序,选出距离这个测试数据最近的的K个点,然后看这k个点中,那个类别的数据多,那么这个测试数据就属于哪一类。优缺点:思想简单,但是计算量比较大,并且数据集中的各个类型的数据量时平均的,例如A类1000个,B类100个,那么无论如何A类的数据是占优势的。2.决策树2.1 ID3...原创 2020-08-18 14:58:43 · 267 阅读 · 0 评论 -
面经-字节跳动数据分析
====================一面============================1. 自我介绍2. 壹账通实习主要工作3. yolov3网络模型是什么样子的?基于darknet-53的网络模型,从名字上看是有53层全连接层,中间还穿插着residual层4. 调参都调的哪些参数?学习设置多少?5. 机器学习分类算法的损失函数?常用回归损失函数:...原创 2020-08-18 14:57:35 · 4177 阅读 · 0 评论 -
面经-趣头条数据分析实习生
一面:1. 自我介绍2. 第一份实习时间挺长的,负责什么工作?3.研究方向面试官介绍了偏业务的数据分析在做什么工作二面:1.自我介绍2.介绍一下做过的项目,从数据清洗到最后分类(以自己学习的研究课题为例讲的)3.上海地铁数据挖掘项目觉得自己的贡献是啥4.业务分析:以你经常使用的APP为例,分析如果有一天浏览量下降了,是什么原因?解决方法?5.数据中的缺失值、...原创 2020-08-18 14:58:02 · 499 阅读 · 0 评论 -
面经-vivo机器学习算法工程师
1.手撕代码:有序链表删除重复的,保留不重复的。 def deleteDuplicates(self, head): """ :type head: ListNode :rtype: ListNode """ if not head or not head.next: return ...原创 2020-08-18 14:59:19 · 668 阅读 · 0 评论 -
日常实习面试问题整理
====================================================================================================亚信科技============================================================================================...原创 2020-08-18 14:57:50 · 210 阅读 · 0 评论