自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 数据库编程(1):SQL基础篇 一

一、主流DBMS1、数据库基础概念 DB (DataBase ): 数据库,是存储数据的集合,也可理解为多个数据表。 DBMS(DataBase Management System):数据库管理系统,是位于用户与操作系统之间的一层数据管理软件,可以对多个数据库进行管理。和操作系统一样是计算机的基础软件。 DBS(DataBase System):数据库系统。可理解为DBS = DBMS + DB + DBA(数据库管理与) + 应用程序。2、主流...

2020-06-21 18:40:51 647

原创 求职之路(1):4399公司数据研发工程师

一、笔试试卷总共125分,(但实际上不是都130分了吗, 还是我哪个环节记错了ORZ)1、选择题(20*1分):大约6道算法题,2道Linux命令相关题,3道计算机网络(对TCP/IP四层协议)整体要熟,4道数据库编程(数据库性能优化、事务提交等细节),5道大数据题(对主流大数据产品Hadoop,HIVE的基本架构和实现细节要熟)2、数据库题(10+15分):第一道题是分析对比Redis、传统数据库(mysql)、Hbase、Hive的区别;第二道题是建表,SQL查询以及建立索引(mys

2020-05-31 09:57:29 1007

原创 大数据技术(1):大数据发展脉络

一、大数据技术发展史:大数据的前世今生 在2004年,Google前后发表了三篇论文,即大数据技术的“三驾马车”:分布式文件系统GFS、大数据分布式计算框架MapReduce和NoSQL数据库系统BigTable。分别是一个文件系统、一个计算框架和一个数据库系统。其本质思路是部署一个大规模的服务器集群,通过分布式的方式将海量数据存储在这个集群上,然后利用集群上的所有机器进行数据计算。这样就不需要追求单个服务器的性能了。 Doug Cutting阅读论文后在自己的产品上实现...

2020-05-29 14:56:07 1190

原创 数据分析思维与方法(1):数据分析三种核心思维(框架)

一、结构化(金字塔)图1 四原则(或称四步骤) (1)核心论点:寻找金字塔的塔顶,它可以是假设,是问题,是预测是原因; (2)结构拆解:自上而下,将核心论点层层拆解成分论点,上下之间呈因果或依赖关系; (3)MECE :相互独立,完全穷尽,论点之间避免交叉和重复,分论点们要尽量完善; (4)验证 :不论是核心论点还是分论点,都应该是可量化的,用数据说话。它们必然是可验证的。图2 实例 图...

2020-05-28 14:50:09 2179

原创 数据分析算法学习(1):SVM

一、模型引入下面有这样一些分类任务: 图1 图2 左边很容易分,在中间画一条线即可,但是右边呢?这时有人提出一种思路:把这些点放入更高维度,从数学的角度来看,空间维度越高,点在空间中的分布就越稀疏,也就越线性可分,这样就可以用...

2020-05-27 12:47:13 846

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除