自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 实训日记十三: Python文本数据挖掘-part4

Python文本挖掘

2024-06-21 08:00:00 790

原创 实训日记十一:Python文本数据挖掘part2

可见:每年占比情况变化不大,灭鼠杀虫剂和蚊香液市场大,灭鼠杀虫剂和蚊香液可进一步扩展,就需要与甲方业务人员进一步沟通 ,假设沟通后我们重点关注的是灭鼠杀虫剂。范围: [1/N,‘高度竞争行业’,0.01],(0.01,‘不集中的行业’,0.15],(0.15,‘中等集中’,0.25],(0.25,‘高度集中’,1]例子:六家最大的公司市场上生产90%的商品,剩余的10%由10个规模相等的生产者分配,六家公司中,最大的公司生产80%,其余各2%直观的看灭鼠杀虫剂和蚊香液都有较大的机会。

2024-06-19 15:00:00 606

原创 实训日记十:Python文本挖掘数据分析-part1

Python文本挖掘数据分析第一部分

2024-06-18 15:00:00 820

原创 实训日记十二:Python文本挖掘-part3

可见:最受欢迎的是灭鼠类产品,市场占比最大,高达38%,需要重点研究。查看各产品’类别’总的’预估销售额’的分布,以此表示市场分布情况。3、按照 ‘类别’ 列进行分组,并计算每个类别的总预估销售额。

2024-06-17 16:37:29 108

原创 实训日记九:Spark SQL基础

Spark基础

2024-06-17 15:00:00 672

原创 实训日记八:Scala、Spark介绍

Scala是一种将面向对象和函数式编程结合在一起的高级语言,旨在以简洁、优雅和类型安全的方式表达通用编程模式。Scala功能强大,不仅可以编写简单脚本,还可以构建大型系统。Scala运行于Java平台,Scala程序会通过JVM被编译成class字节码文件,然后在操作系统上运行。其运行时候的性能通常与Java程序不分上下,并且Scala代码可以调用Java方法、继承Java类、实现Java接口等,几乎所有Scala代码都大量使用了Java类库。

2024-06-14 13:33:31 619 2

原创 实训日记七:Zookeeper的基本介绍及下载安装

Zookeeper的介绍与安装

2024-06-13 14:36:57 905

原创 实训日记六:在虚拟机中安装mysql和hive

7、拷贝mysql驱动jar 到/export/servers/apache-hive-3.1.3-bin/lib,并删除冲突的log4j(log4j-slf4j-impl-2.4.1.jar)5、拷贝hive-env.sh.template模版配置文件为hive-env.sh,在hive-env.sh文件中添加Hadoop目录位置为。2、安装mysql-community-release-el7-5.noarch.rpm包。1、解压apache-hive-3.1.3-bin.tar.gz到指定目录。

2024-06-12 16:38:51 268

原创 实训日记五:基于Hadoop的电商实战(问题三)

项目最终章

2024-06-12 10:26:56 336

原创 实训日记四:基于Hadoop的电商实战(问题二)

问题二:各省份浏览量统计

2024-06-12 09:56:27 559

原创 实训日记三:基于Hadoop的电商实战(问题一)

统计页面浏览量

2024-06-12 09:20:43 380

原创 实训日记二:手机流量统计项目优化

手机流量统计项目优化版

2024-06-05 16:49:48 338

原创 实训日记一:手机流量统计分析项目

基于数据分析实训:手机流量分析统计

2024-06-04 18:01:22 353 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除