大数据
sakura小樱
这个作者很懒,什么都没留下…
展开
-
大数据----数据分析及Ptyhon实现
一、什么是大数据二、Apache Hadoop介绍2.1、下载2.2、思想2.3、常用LINUX系统操作三、词频统计WordCount(类似TF)四、IBM股价分析一、什么是大数据 ~~~~~原创 2018-07-23 20:59:58 · 920 阅读 · 0 评论 -
大数据----Hive集成Python分析
一、Hive的基本使用● 创建数据库CREATE DATABASE IF NOT EXISTS db_hive ;● 使用数据库USE db_hive ;● 创建表'''样本数据:00:00:00 2982199073774412 [360安全卫士] 8 3 download.it.com.cn/softweb/software/firewall/an...原创 2018-07-26 20:36:35 · 2173 阅读 · 0 评论 -
大数据----Spark中的 决策树 及 SVM 建模
一、算法解释             &amp原创 2018-10-30 18:07:02 · 1027 阅读 · 0 评论 -
大数据----Spark中决策树模型Pipeline的建立 和 两种验证方法(完整版)
一、数据预处理1、加载数据2、SparkSession读取CSV格式文件3、清洗数据4、特征处理4.1、StringIndexer4.2、OneHotEncoder4.3、VectorAssembler二、建模分类决策树DecisionTreeClassifier三、评估(ROC曲线)四、打包(ML Pipeline)Step 1...原创 2019-06-19 09:45:50 · 1629 阅读 · 0 评论 -
liunx安装python3.X环境及opencv安装问题
文章目录1.检测Python版本2.安装Python3版本1、可利用linux自带下载工具wget下载2、下载完成后到下载目录下3、解压4、区分目录5、gcc编译6、保留与否7、再建立新版本python的链接`8、查看版本1.检测Python版本 ~~~~~~~~~ ...原创 2019-09-06 15:21:59 · 568 阅读 · 0 评论