笔记
努力成为大数据技术人才
学习记录 ,温故而知新
展开
-
python报错纠正
python出现错误#基于回归补充缺失数据import pandas as pdimport numpy as npSinfo=pd.DataFrame({"ID":['001','002','003','004','005','006','007','008','009','010'], "weight":['55','54','51','45','67','68','67','68','67','55'], "heigh原创 2021-11-13 21:38:02 · 1221 阅读 · 0 评论 -
数据填充报错
报错信息报错:Input contains NaN, infinity or a value too large for dtype(‘float64’)源代码:from sklearn.impute import SimpleImputer data=SimpleImputer(missing_values='nan',strategy='mean') dataMode=data.fit_transform(df)解决:1、0.20版中的新功能:SimpleImputer替换之前sklearn.原创 2021-11-04 21:11:31 · 867 阅读 · 0 评论 -
数据挖掘的流程
这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Markdown编辑器你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Mar原创 2021-09-06 12:38:01 · 1417 阅读 · 0 评论 -
报错信息
ypeError: fit() missing 1 required positional argument: ‘y’#使用随机森林建模from sklearn.ensemble import RandomForestClassifiermodel=RandomFotestClassifiermodel.fit(x_train,y_train)y_pre=model.prsdict(x_test)model.score(x_test,y_test)#出现了 一下报错ypeError: fi原创 2021-05-19 15:27:40 · 322 阅读 · 0 评论 -
Centos8下 安装Hadoop(1)
一、在VMware中新建一个虚拟机。1、自定义新建虚拟机,按向导一步步进行,放入映像文件,命名。2、编辑虚拟机设置,将第一个CD/DVD的设备状态中的启动时连接 不勾选3、开启此虚拟机,按指引导向进行,进入如下页面4、打开选中的部分,勾选customer选项,done进行下一步,添加三个分区/boot :用来存放与 Linux 系统启动有关的程序,比如启动引导装载程序等,建议大小为256MB 。swap :实现虚拟内存,建议大小是物理内存的 1~2 倍。/ : Linux 系统的根目录,所有原创 2021-04-28 17:54:31 · 382 阅读 · 0 评论 -
hadoop集群下安装及配置hama
一、简介:hama是基于BSP(BulkSynchronous Parallel)计算技术的并行计算框架,用于大量的科学计算 。二、Hama 的下载安装1、下载网址:http://archive.apache.org/dist/hama/2、通过FlashFXP 文件传输助手连接虚拟机,将hama压缩文件上传到虚拟机的自定义目录下 (例如 我上传到home/hadoop/downloads/路径下)3、在 自定义目录下进行解压#:cd ~#:cd /home/hadoop/download原创 2021-04-26 18:09:17 · 548 阅读 · 0 评论 -
数据清洗之缺失值处理—删除
一、数据清洗1、目的:让数据更加完整合理2、为什么:数据可能存在缺失数据或异常数据,清洗就是对缺失的数据和异常的数据进行处理。3、定义:数据清洗是通过删除,转换器,组合等方法,处理数据中的异常样本,为数据建模提供优质的数据的过程4、包括:缺失值处理异常值处理一.1、缺失值处理1、缺失的原因:人为疏忽、机器故障人为刻意隐瞒部分数据数据本身不存在系统实时性高历史局限性导致数据收集不完整2、数据缺失类型:完全随机缺失随机缺失非随机缺失3、缺失值存在的形式:np:nan 、"原创 2021-04-07 11:34:52 · 7748 阅读 · 3 评论