自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 Linux 中最常用 150 个命令详细汇总,收藏它就够了

线上查询及帮助命令(2个)命令功能man查看命令帮助,命令的词典,更复杂的还有info,但不常用。help查看Linux内置命令的帮助,比如cd命令。文件和目录操作命令(18个)命令功能ls全拼list,功能是列出目录的内容及其内容属性信息。cd全拼change directory,功能是从当前工作目录切换到指定的工作目录。cp全拼copy,其功能为复制文件或目录。find查找的意思,用于查找目录及目录下的文件。mk

2020-07-09 18:28:03 548

原创 大数据Spark技术数据分析综合实验:出租车数据分析

Spark出租车数据实验目录Spark出租车数据实验【实验目的】【实验原理】【实验环境】【实验步骤】1.数据加载2.数据分析3、模型构建4.可视化展现【实验目的】主要使用出租车上传的GPS点作为分析对象,使用Kmeans把出租车轨迹点聚类,找出出租车出现密集的地方,并用地图的方式进行可视化展示【实验原理】(1)数据的准备。(2)创建DataFrame。(3)使用kmeans聚类。(4)聚类结果可视化。【实验环境】操作系统:Linux开发环境:pyspark命令行【实验步骤】1.数据

2020-07-08 18:26:57 9996 4

原创 网站访问数据ip地址分析--Spark技术

网站访问数据ip地址分析一、 技术:语言:python分析技术:spark技术路线:本地数据源–>spark 分析–>打印结果数据二、 需求:求出各个省份访问量。三、数据解读:数据路径分别为:http://10.90.3.2/HUP/spark/ip.txthttp://10.90.3.2/HUP/spark/http.log1、http.log 为某网站采集的用户访问数据。访问时间信息|访问的主机ip|访问源2、ip.txt为一个参照信息表,里面记载着每个省份对

2020-07-07 11:23:34 1059

原创 大数据分析项目实战--天猫订单综合分析

天猫订单综合分析分析订单转化率、销量趋势、地域分布统计等。文章目录天猫订单综合分析一、数据背景二、分析目的三、读取数据导入相关包读取并查看数据四、处理数据规范字段名称重复值与缺失值五、数据分析订单转化率总体转化率整体订单数趋势销量区域分布统计一、数据背景本数据集共收集了发生在一个月内的28010条数据,字段包含以下:订单编号:订单编号总金额:订单总金额买家实际支付金额:总金额 - 退款金额(在已付款的情况下)。金额为0(在未付款的情况下)收货地址:各个省份订单创建时间:下单时间订单付

2020-07-05 12:09:18 2724 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除