自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 一图总结Hadoop、Hive和Spark的关系

Hadoop主要由两部分组成,分布式存储(HDFS)和分布式计算(MapReduce)。​Hive使用类SQL语言,底层经过编译转为MapReduce程序,在Hadoop上运行,数据存储在HDFS上。Spark 将大数据集合抽象成一个 RDD 对象,然后提供了 transformation(转换)、action(动作)两大类算子函数,对RDD进行处理,并得到一个新的 RDD,然后继续后续迭代计算,像 Stream 流一样依次执行,直到任务结束。内部也是采用分片处理,每个分片都会分配一个执行线程。​

2022-10-30 19:41:03 1656 1

原创 MySQL基础篇01之SQL语句(笔记整理)

本文是MySQL数据库基础篇关于数据库概述和SQL语句的整理汇总,可作为手册查阅。其中,系统而详细地讲解关系数据库标准语言SQL的分类,包括 DDL(数据定义语言)用来定义数据库对象(数据库、表、字段)、DML(数据操作语言)用来对数据库表中的数据进行增删改、DQL(数据查询语言)用来查询数据库中表的记录、DCL(数据控制语言)用来创建数据库用户、控制数据库的控制权限。

2022-10-28 00:21:41 302

原创 python爬虫基础知识(有案例)

爬虫是通过编写程序,模拟浏览器上网,然后让其去互联网上抓取数据的过程。通过python的requests库可以实现高效的数据爬取,本文介绍了爬虫的基本概念和requests库的基本使用,来实现用python爬虫爬取网页小说或者其他的正文部分,并将结果保存到input.txt文件中的案例。

2022-10-23 14:52:03 1014

商务与经济统计 原第13版第七章抽样与抽样分布英文题库

《商务与经济统计》是2006年机械工业出版社出版发行的图书,作者是安德森。本书作者精心设计了“方法”、“应用”和“自测题”三种题型,并设计了起提示、总结和建议作用的“注释”,这些都体现出《商务与经济统计(原书第10版)》的实用特点。

2023-03-05

商务与经济统计 原第13版第一章英文课后答案

《商务与经济统计》是2006年机械工业出版社出版发行的图书,作者是安德森。本书作者精心设计了“方法”、“应用”和“自测题”三种题型,并设计了起提示、总结和建议作用的“注释”,这些都体现出《商务与经济统计》的实用特点,课后答案可以帮助读者更更好的掌握所学知识。

2023-03-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除