TH_NUM的博客

日常积累

排序:
默认
按更新时间
按访问量

pandas对列数据进行处理,将Nan变为0,将str变为0

test.csv文件内容: 1,2, 1,54 89,5 6,7,9 代码: import pandas as pd import numpy as np import re def format(x): value = re.compile(r'^\s*[-+]*[0-9]...

2018-04-19 17:54:28

阅读数:1548

评论数:0

HADOOP基本操作命令

HADOOP基本操作命令 在这篇文章中,我们默认认为Hadoop环境已经由运维人员配置好直接可以使用。 假设Hadoop的安装目录HADOOP_HOME为/home/admin/hadoop。 启动与关闭 启动HADOOP 1. 进入HADOOP_HOME目录。 2. ...

2018-04-14 12:20:27

阅读数:26

评论数:0

Intellij IEDA: the working directory does not exist

1.首先找到打开设置 Run -> Edit Configurations 2.在Working Directory中输入 . 其中. 代表当前路径

2018-04-12 16:58:07

阅读数:161

评论数:0

HDFS:如何复制文件

hadoop复制文件 hadoop fs -cp /user/merge /user/search 上面的命令将merge文件下面的所有文件(包括merge文件夹)复制到search目录下。

2018-04-12 16:54:54

阅读数:167

评论数:0

HDFS:如何将文件从HDFS复制到本地

下面两个命令是把文件从HDFS上下载到本地的命令。 get 使用方法:Hadoop fs -get [-ignorecrc] [-crc] 复制文件到本地文件系统。可用-ignorecrc选项复制CRC校验失败的文件。使用-crc选项复制文件以及CRC信息。 示例: hadoop fs ...

2018-04-12 16:52:31

阅读数:97

评论数:0

Communication with HDFS: Exception in thread “main” java.io.IOException: Failed on local exception:

MAP-Reduce 的文件写错,key或者value 存在null值。

2018-03-28 15:47:50

阅读数:34

评论数:0

使用K-S检验一个数列是否服从正态分布、两个数列是否服从相同的分布

假设检验的基本思想: 若对总体的某个假设是真实的,那么不利于或者不能支持这一假设的事件A在一次试验中是几乎不可能发生的。如果事件A真的发生了,则有理由怀疑这一假设的真实性,从而拒绝该假设。 实质分析: 假设检验实质上是对原假设是否正确进行检验,因此检验过程中要使原假设得到维护,...

2018-03-20 20:27:51

阅读数:171

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭