- 博客(39)
- 资源 (40)
- 收藏
- 关注
原创 如此跌宕起伏的人生……
然而,事情并没有像他想象的那么简单,这家公司在发展的过程中遇到了许多困难,资金链断裂,市场开拓不顺。这个故事告诉我们,投资的过程中充满了风险和挑战,只有具备坚定的信念、敏锐的洞察力和冒险的精神,才能在这个市场上获得成功。然而,就在这个时候,李明发现了一个巨大的市场机会,这个机会可能会让他的投资获得数十倍的回报。但是,这个机会也带来了巨大的风险,如果失败,他的投资将血本无归。他调动了所有的资源,筹集了一笔巨额资金,成功地把握住了这个机会。最终,他的投资获得了巨大的回报,他的梦想终于实现了。
2023-07-21 17:42:07 74
原创 10分钟,获取了面试官芳心的真实大数据面试过程,我到底做了什么?
10分钟,面试官就怦然心动的真实面试过程,我到底做了什么?前言已经经历过了hr的谈话,然后来到了第一轮面试现场面试官了解基本情况环节面试官:刚刚我们HR也有跟你聊过,我:对,刚刚有人事跟我聊过了。面试官:对你现在还在职吗?我只是收了你简历,其他的都还没看着,我:我现在已经离职了。面试官:离职了是吧?那你现在在哪里?广州?我:我现在在广州。面试官:平均我看你做项目这块,不是什么金融方面是吗?是物联网公司吗?我:我上一份工作是做的是一个电商的。面试官:电商是吧?我:对。面试官:
2020-09-06 23:32:37 1521 1
原创 震撼来临,史上最详细的数据自助分析和可视化平台(superset)的入门教程之数据表结构解析
震撼来临,史上最详细的数据自助分析和可视化平台(superset)的入门教程之数据结构解析理清了superset架构的数据表关系,才能使您的二次开发更流畅1、数据表结构图片可能不够清晰:附上百度云链接,可以自行下载链接:https://pan.baidu.com/s/1IL7v11y_r9TLVYcMleyBiA提取码:v49n(如果失效了,可以私信或者评论即可)2、比较重要的表用户信息表ab_user看板表dashboards数据源表dbs保存
2020-06-05 12:21:57 1567
原创 震撼来临,史上最详细的数据自助分析和可视化平台(superset)的入门教程之本地源码安装和调试
震撼来临,史上最详细的数据自助分析和可视化平台(superset)的入门教程之本地源码安装和调试系统环境Window10Python3.6.6Superset0.281、supserset的简介Superset 是一款由 Airbnb 开源的“现代化的企业级 BI(商业智能) Web 应用程序”,其通过创建和分享 dashboard,为数据分析提供了轻量级的数据查询和可视化方案。 Superset 的前端主要用到了 React 和 NVD3/D3,而后端则基于
2020-06-05 11:19:22 1444 1
原创 数据质量监控工具-Apache Griffin本地安装和调试
数据质量监控工具-Apache Griffin本地安装和调试1 、Apache Griffin简介Griffin起源于eBay中国,并于2016年12月进入Apache孵化器,Apache软件基金会2018年12月12日正式宣布Apache Griffin毕业成为Apache顶级项目。Griffin是属于模型驱动的方案,基于目标数据集合或者源数据集(基准数据),用户可以选择不同的数据质量维度...
2019-06-16 18:26:19 4763 18
原创 大数据面试总结《二十三》--技能编写模板
1:技能模板1:顺序:熟练使用Linux常用的操作命令,熟悉shell脚本编程;熟悉MapReduce的原理和流程,并能用其API开发应用程序;熟悉Spark的原理和流程,并能用Java或Scala语言进行Spark应用程序开发,熟悉Spark Streaming组件,并能用其开发实时计算系统,了解Spark源码;熟悉Hive和HBase的系统架构,能使用Hive进行海量数据的统计分...
2019-03-29 09:35:41 747
原创 大数据总结《二十二》--简历注意事项
面试前a) 写简历职业技能i. 简明写出你能使用你知道的技术“做什么”???准备好人家要问的问题回答这个了之后准备抛出其他的问题,让面试官来问你ii. 面试之前,针对公司去写这个公司关心的问题。抓住重点复习找他们公司产品(公司官网),然后假设你去做,需要什么技术架构。大概有什么功能,如果这个功能你去做,,应该选用什么技术??、面试中a) 注意的问题i. 你为什么上家公司离职(...
2019-03-29 09:32:50 522
原创 大数据总结《二十一》--简历问题
简历写的时候必须要有预测文档a) 你为什么写这句话b) 这句话你预测面试官会问你什么?i. 你怎么回答(没有答案我不看)c) 职业技能i. 强调 你能干什么问题,解决问题“什么”d) 你能解决某些方面的问题i. 按照方面分类()技术价值排序ii. 离线大数据分析:Mapreduce()iii. 实时分析技术:1. iv. 内存计算v. 机器学习vi. 存储...
2019-03-29 09:27:49 358
原创 大数据面试总结《二十》--优秀简历的编写
简历如何写:知乎:https://www.zhihu.com/question/25002833一一::基基本本格格调调简洁明了,逻辑结构清晰字体,排版,顺畅,清晰整齐就好最好是PDF格式,兼容性强且不易乱序二二::基基本本信信息息((姓姓名名/性性别别/毕毕业业院院校校/电电话话/邮邮箱箱/居居住住地地/期期望望地地))再额外能加上QQ或者微信就更好了(以防有时候电话打不通哦,时不时...
2019-03-28 09:56:30 4948
原创 大数据面试总结《十九》--面试题
Java集合类:1.Java的HashMap是如何工作的?HashMap是一个针对数据结构的键值,每个键都会有相应的值,关键是识别这样的值。HashMap 基于 hashing 原理,我们通过 put ()和 get ()方法储存和获取对象。当我们将键值对传递给 put ()方法时,它调用键对象的 hashCode ()方法来计算 hashcode,让后找到 bucket 位置来储存值对象...
2019-03-28 09:53:03 439
原创 大数据面试总结《十八》--面试技巧
一般来说,面试你的人都不是一个很好对付的人。别看他彬彬有礼,看上去笑眯眯的,很和气的样子。但没准儿一肚子坏水。有些人待人特别客气,说话还稍稍有点结巴的,更容易让人上当。所以,牢记一点,面试的时候保持高度警觉,对方不经意问出来的问题,很可能是他最想知道的。举例来说,我每次面试的时候,最喜欢说的话就是:哦,我不是HR的,你别拘束,咱们就当是聊天……负责面试的人,一般有两种,一种是专门的人力资源...
2019-03-28 09:50:32 257
原创 大数据面试总结《十七》--面试一家公司之前需要做的准备
第一:了解应聘公司;了解应聘岗位查该公司的资料,知道该公司是做什么的,发展情况,招聘的岗位的要求等公司地点在哪里,交通是否方便,需提前多久出发;公司类型如何?我应该如何着装?去咨询公司逃不掉正装,而去互联网公司这么穿,人家或许以为你是房产中介;公司业务如何?上市了吗?财报如何?主要产品有哪些?公司在中国有多少分支机构?最近有什么新动向?公司所在行业有何新动向?发展趋势如何?公...
2019-03-28 09:47:04 818
原创 大数据面试总结《十六》--面试题规律总结
关于Java的面试题:关于虚拟机的面试题:1.hashmap底层?2.Java进程中断怎么处理?3.介绍下面向对象?4.介绍下多态?5.方法重载和重写?6.这俩哪个属于多态?7.说下多线程?8.实现方式有哪些,区别?9.同步锁 互斥,为什么常量不能做锁?10.说下反射,都是做什么的?11.反射机制怎么实现的?12.linkedlist和arraylist的区别?13.h...
2019-03-28 09:44:27 4423 1
原创 大数据面试总结《十五》--人事面试技巧总结
一定不要将公司的工作当作负担,一定要做好并且学到东西,这才是你下一次跳槽能够展示的东西,所以在公司工作,你拿着工资,而不只是在为公司打工,而是为自己的未来进行修炼,一定要有这方面的意识。总之,面试的时候要牢记一点,面试你的那个混蛋,不管他有多和善,但他问的问题,可能里面处处陷阱!!!1:人事这关也很重要,特别是工资方面,还有团队,工作方面?(重要)2:对公司的主营业务要表现足够的兴趣,关系...
2019-03-28 09:42:39 1312
原创 大数据面试总结《十四》
1 使用Hive或者自定义MR实现如下逻辑product_no lac_id moment start_time user_id county_id staytime city_id13429100031 22554 8 2013-03-11 08:55:19.151754088 571 571 28...
2019-03-28 09:37:31 248
原创 大数据面试总结《十三》
下面哪个程序负责 HDFS 数据存储。答案C datanodea)NameNodeb)Jobtrackerc)Datanoded)secondaryNameNodee)tasktrackerHDfS 中的 block 默认保存几份? 答案A默认3分a)3 份b)2 份c)1 份d)不确定下列哪个程序通常与 NameNode 在一个节点启动?答案Da)SecondaryNa...
2019-03-28 09:36:18 380
原创 大数据面试总结《十二》
1.Hadoop集群可以运行的3个模式?单机(本地)模式伪分布式模式全分布式模式2. 单机(本地)模式中的注意点?在单机模式(standalone)中不会存在守护进程,所有东西都运行在一个JVM上。这里同样没有DFS,使用的是本地文件系统。单机模式适用于开发过程中运行MapReduce程序,这也是最少使用的一个模式。3. 伪分布模式中的注意点?伪分布式(Pseudo)适用于开发和...
2019-03-28 09:34:20 211
原创 大数据面试总结《十一》
第一家 喜马拉雅FM电话面试,问了40多分钟第二家 中星电子没有笔试题,直接就问项目,问了40多分钟1,两个项目电信和交通厅,分别用了什么架构,怎么搞得,参与搭建了吗?2,接着又问flume几台,怎么从其他系统获取的数据,kafka几台?3,我说的kafka吞吐量10万条信息每秒,我们用了一台,接着问那一台kafka挂了呢?4,这个地方回答的不好,没搞过kafka高可用,说多台k...
2019-03-28 09:29:14 402
原创 大数据面试总结《九》
上午去 明略数据,面试官一直不到,有个临时的面试官先面了一次:1 hdfs api新特性2 java7新特性3 hive的默认分隔符4 eclipse版本号之后正式面试官面试:1 shell 脚本sort , uniq -u,uniq -t ,uniq -d, cat 组合使用,解决从不同文件中找出相同数据的问题,还有解决只在一个文件中出现的数据的问题2 java实现上述功能,在...
2019-03-27 22:01:56 717
原创 大数据面试总结《八》
今天面了一家,上午两个小时技术面,下午两个小时hr面试问题如下:1 jvm调优2 redis 工作原理 LRU算法3 hive原理,优化4 线程同步5 ha原理6 mr数据倾斜解决办法7 hive数据倾斜优化8 远程通信技术9 hdfs文件创建–工作流程10 hbase部署11 hdfs异步读12 hdfs api 源码 解答:文件创建工作流程13 hive 执行...
2019-03-27 21:59:02 252
原创 大数据面试总结《七》
上午第一家被虐的很惨,一直在追问项目中的一个项目,从设计架构,业务实现,为什么这样做,性能如何,等等问题,很多地方深入到项目中实现细节 ,没有答出来,1 项目规模2000万用户日志数据总量在50-100TB每日数据500GB-1TB服务器 16GB + 8TB数据节点20台集群规模在30节点2 lvs和nginx比较浮动ip ,负载均衡面试官说 ,实际nginx就足...
2019-03-27 21:56:00 233
原创 大数据面试总结《六》
上午第一家被虐的很惨,一直在追问项目中的一个项目,从设计架构,业务实现,为什么这样做,性能如何,等等问题,很多地方深入到项目中实现细节 ,没有答出来,1 项目规模2000万用户日志数据总量在50-100TB每日数据500GB-1TB服务器 16GB + 8TB数据节点20台集群规模在30节点2 lvs和nginx比较浮动ip ,负载均衡面试官说 ,实际nginx就足...
2019-03-27 21:54:57 248
原创 大数据面试总结《五》
第一天面试:下午1点半到公司(人人贷),公司做P2P,个人贷款,一共三轮面试,第一个技术偏向算法,第二个DBA,主要问sql和hive ql,第三个应该是公司负责技术方面的老大,问部分技术问题;主要问题:1 sql优化设计角度 — 建索引,建视图sql--------------- 充分利用索引,避免全表扫描2 hive优化充分利用临时表 , 重复利用3 Pa...
2019-03-27 21:52:43 324
原创 大数据面试总结《四》
锐安科技的面试情况总结:被虐(天气热,笔试以及九宫格问题作答和等待面试时间较长造成面试时头脑发晕 发胀 短暂空白,被面试官带着走 带沟去了)以下为笔试题接下来是类似的九宫格笔试该单位用的东西比较杂,什么都有,而且要求java功底问道的一些东西1.MR的原理 拿wordcount来讲,以及优化(全面些)2.Hbase的相对多些,基础和优化3.就用到hbase的项目提问,实际如何...
2019-03-27 21:49:54 264 1
原创 大数据面试总结《三》
四家工具 公安部和 关数 都比较简单 重点在百分点和大麦先说说大麦网(非主流头型面试官小哥)1 .Flume 处理日志重复问题将agent节点上监听的日志文件夹下已经发送的日志文件移出,处理完,故障重新启动agent即可。 注:在agent节点失败的情况下,按照失败的时间点,将时间点之前的数据文件移出,将flume.agent.logdir配置的文件夹清空,重新启动agent。2.你的推荐...
2019-03-27 21:43:18 331
原创 大数据面试总结《二》
北京XXX宇有限公司Hashmap hashset treemap 区别HashSet 实现了Set 接口 ,值不能重复,将对象存储挨HashSet 前,需要重写Equals 和hashCode ,这样才能比较对象的值是否相等,确保set 中没有存储相等的对象,什么是hashMapHashmap 实现了map 接口,map接口对键值对进行映射,Map 不允许重复的键位,HashMap和...
2019-03-27 21:39:09 303
原创 大数据面试总结
1 总体情况现在我面试了三家第一家:***技术股份有限公司,已经得到复试通知第二家:***第一研究所,面试成功,给的待遇是18万~20万/年。他们在等待我的回复。第三家:电话面试,面得不好,这个部门主要不是开发,他需要熟悉各组件,做架构推荐的。下面是面试题汇总,我自己做了一些,有些正在看。2 ***技术股份有限公司2.1 面试题2.1.1 介绍自己,讲讲自己的项目2.1....
2019-03-27 21:34:20 1001
原创 大数据面试总结《十》
这里写自定义目录标题大数据面试反馈反思大数据面试反馈反思面试公司:特斯联-大数据开发工程师1:yarn?参考博客(Hadoop MapReduceV2(Yarn) 框架简介):https://www.ibm.com/developerworks/cn/opensource/os-cn-hadoop-yarn/答题思路:解决MapReduce1.0版本的JobTracker/TaskTr...
2019-03-27 21:25:43 570
原创 大数据面试题【真实面试过程中遇到的面试题】
大数据面试题【真实面试过程中遇到的面试题】java面向对象编程有哪些重要的特征?分别说一下你对这些特性的理解?请写出下面的输出结果Integer a =127,b=127,c=128,d=128,e=129,f=129;System.out.println(ab);System.out.println(cd);System.out.println(e==f);大数据生态圈...
2019-03-24 21:43:27 452
基于流式计算的电信实时营销系统设计与实现.caj
2019-10-20
基于“用户画像”的商品推送系统设计与实现.caj
2019-10-20
基于移动互联网行为分析的用户画像系统设计.pdf
2019-10-20
基于用户特征的群组标签系统的设计与实现.caj
2019-10-20
研发-Java诊断工具-Arthas.pptx
2019-09-23
深度学习Deep Learning 中文版
2019-02-26
大数据相关的90多本电子书(网盘的分享链接)
2019-02-24
[中文]Mahout算法解析与案例实战
2019-02-24
[中文]Spark快速数据处理
2019-02-24
[中文]Scala编程中文版
2019-02-24
[中文]机器学习实战
2019-02-24
[中文]HADOOP权威指南 第3版 完整版
2019-02-24
[中文]《KVM虚拟化技术 实战与原理解析》.(任永杰,单海涛).
2019-02-24
21个项目玩转深度学习——基于TensorFlow的实践详解
2019-02-17
Hadoop大数据分析与挖掘实战 高清版
2019-02-17
学习OpenCV 中文版(配上随书源码)
2019-02-17
Python高级编程-第2版
2019-02-17
用户网络行为画像 大数据中的用户网络行为画像分析与内容推荐应用
2019-02-17
网络爬虫-Python和数据分析 PDF完整版 (王澎 著)
2019-02-17
TortoiseGit
2019-02-16
Snapde超大文件编辑软件
2019-02-16
Everything绿色版
2019-02-16
EditPlusTool
2019-02-16
万能数据库客户端学习软件dbvisualizer
2019-02-16
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人