![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据挖掘
文章平均质量分 74
kyle6666
致力做Data Analyst的小菜鸡
展开
-
Haddop+spark大数据分析(二)之Hadoop 集群的搭建
文章目录 前言 一、pandas是什么? 二、使用步骤 1.引入库 2.读入数据 总结 前言 上一节介绍了虚拟机的下载以及Java环境的搭建,这节主要讲解Hadoop集群的搭建 一、集群环境的下载及其配置 我们需要现在一台机器上配置好 hadoop,然后再把它拷贝到其他机器上,这里我选择在master 也就是要做为 nameNode 的那台机器 1.下载hadoop 再次强调 建议在克隆之前,先在一台机器上,下载、解压好再克隆,这样多台机器就都有了 下载...原创 2021-05-28 11:16:45 · 479 阅读 · 0 评论 -
Hadoop+Spark 大数据分析(一)之 虚拟机安装及Java环境的配置
系统与平台 文章目录 目录 系统与平台 文章目录 前言 一、系统环境 二、系统设计 1.主机分配 2.功能分配 三、 环境准备 1.安装虚拟机 2.配置Java环境 说明 环境监察 安装JDK 配置JDK 3.配置网络参数 设置主机名 配置 hosts 文件 配置静态IP 禁用防火墙 四、集群环境搭建 1.下载 hadoop 总结 前言 为了学习大数据下的数据分析,第一次尝试搭建完全分布式的...原创 2021-05-28 09:25:31 · 671 阅读 · 0 评论 -
pandas中groupby()方法 as_index属性的使用
print各种可能性 import pandas as pd df = pd.DataFrame(data = {'book':['bk1','bk1','bk2','bk2','bk3'], 'price':['12','12','5','5','45']}) print(df) print(df.groupby('book',as_index = True).sum()) print(df.groupby('book',as_index = False).sum()) output: books翻译 2021-05-20 16:37:28 · 3268 阅读 · 0 评论