面试笔记
小力子~
这个作者很懒,什么都没留下…
展开
-
数据分析岗面试题
怎么做恶意刷单检测? a. 选取特征利用机器学习方法做分类。 特征: 结合商家特征和环境特征做商家恶意刷单分类预测,结合用户行为特征和环境特征做商家恶意刷单分类预测。 1)商家特征:商家历史销量、信用、产品类别、发货快递公司等。 2)用户行为特征:用户信用、下单量、下单路径、浏览店铺行为、支付账号。 3)环境特征(主要是避免机器刷单):地区、ip、手机型号等。 注:构造特征。刷单的评论文本可能套...原创 2019-07-08 14:42:09 · 6230 阅读 · 0 评论 -
海量数据处理面试题
数据量太大导致的问题:无法在较短时间内迅速解决,无法一次性装入内存。 针对时间,我们可以采用巧妙的算法搭配合适的数据结构,如 Bloom filter/Hash/bit-map/堆/数据库或倒排索引/trie树 。针对空间,无非就一个办法:大而化小, 分而治之(hash映射) ,你不是说规模太大嘛,那简单啊,就把规模大化为规模小的,各个击破不就完了嘛。 单机及集群问题,通俗点来讲,单机就是处理装...原创 2019-07-13 17:15:15 · 156 阅读 · 0 评论 -
ARIMA时间序列预测
ARIMA模型运用的流程 根据时间序列的散点图、自相关函数和偏自相关函数图识别其平稳性。 对非平稳的时间序列数据进行平稳化处理。直到处理后的自相关函数和偏自相关函数的数值非显著非零。 根据所识别出来的特征建立相应的时间序列模型。平稳化处理后,若偏自相关函数是截尾的,而自相关函数是拖尾的,则建立AR模型;若偏自相关函数是拖尾的,而自相关函数是截尾的,则建立MA模型;若偏自相关函数和自相关函数均是拖...原创 2019-08-21 08:45:26 · 4481 阅读 · 0 评论 -
操作系统(进程,线程,死锁)
进程与线程的一个简单解释(进程,线程,互斥锁,信号量,操作系统的设计) http://www.ruanyifeng.com/blog/2013/04/processes_and_threads.html 进程与线程的区别 1、进程有自己的独立地址空间,每启动一个进程,系统就会为它分配地址空间,建立数据表来维护代码段、堆栈段和数据段,这种操作非常昂贵。 而线程是共享进程中的数据的,使用相同的地址空间...原创 2019-08-27 20:41:48 · 287 阅读 · 0 评论