- 博客(5)
- 收藏
- 关注
原创 hadoop伪分布式搭建
hadoop伪分布式搭建欢迎使用Markdown编辑器前言一、pandas是什么?二、使用步骤1.引入库2.读入数据总结新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入 欢迎使用Markdown编辑器 你好! 这是你第一次
2021-12-15 16:47:05 652
原创 简单的定时任务
简单的定时任务 sudo apt-get update #更新包 sudo apt-get install cron #安装crontab vi mytest.cron #创建一个简单的定时任务文档(.cron) */2 * * * * echo "hello ,world. this is my first crontab program!" >> /home/ubuntu/log.txt crontab mytest.cron #添加定
2021-05-10 00:47:43 96
原创 Spark出租车数据实验实用说明书
Spark出租车数据实验实用说明书 一、实验原理: (1)数据的准备。 (2)创建DataFrame。 (3)使用kmeans聚类。 (4)聚类结果可视化。 二、实验要求 使用出租车上传的GPS点作为分析对象,使用KMeans把出租车轨迹点聚类找出出租车出现秘籍的地方,用地图的方式可视化展示。 三、实验实现: 1、数据的下载 数据为:taxi.csv 格式: tid-出租车编号 lat-维度 lon-经度 time-时间戳 利用到的第三方库:numpy(pip install numpy) 在cmd中即可
2021-05-10 00:30:34 1308
原创 Datawhale-Task2 数据分析
学习目标: 零基础入门数据挖掘-Task2 数据分析(熟悉数据,分析数据,处理数据) 学习心得: 基于二手车交易数据,对其数据进行处理得出相关需要的数据。在这个过程中加深我对数据集的认识,以及在下次面对数据集时可以进行一些简单的机器学习,处理数据,或者时使用深度学习的使用。经过一系列的处理加深预测数据的可信度和准确度。 学习内容: 1、 选择相应的开发环境,安装所需要的可视化库。 2、载入数据(数据下载地址:https://tianchi.aliyun.com/competition/entrance/23
2021-04-17 00:44:40 137
原创 Datawhale-Task1 Baseline
学习目标: 1、掌握python使用的基本语法 2、了解掌握python中的第三方库的功能,例如实验所需要的使用的numpy、pandas、matplotlib等。 3、能对目标数据进行适当地处理,最终选择合适的模型进行训练和预测,达到所需要的目的,预测二手车的成交价格。 学习内容: 1、 二手车交易价格数据的下载 二手车数据下载地址: https://tianchi.aliyun.com/competition/entrance/231784/introductionspm=5176.12281957
2021-04-14 00:11:57 240 2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人