C++使用Hadoop

本文提供了一篇详细的Hadoop在Ubuntu 20.04上安装教程,包括用户权限设置和环境变量检查。同时介绍了三种C++调用Hadoop API的方法:libhdfs、libhdfs3以及通过执行hadoop命令行。对于libhdfs的示例代码也进行了展示。
摘要由CSDN通过智能技术生成

安装Hadoop

这里推荐一篇文章,我感觉写得很详细,跟着流程安装起来很容易。
install-hadoop-on-ubuntu-20-04

使用Hadoop注意事项

  • hadoop有用户组,有用户权限区分,其他linux用户使用需要加入权限。
  • hadoop安装好以后,如果不能正常使用,查看环境变量CLASSPATH和USER。
  • 在终端可以成功运行,但是在Clion编辑器里面也需要考虑环境变量。

三种C++调用Hadoop API的方式

  • 使用libhdfs,一个c语言调用java JNI的库。

例如:

#include <iostream>
#include <cstring>
#include "hdfs.h"


int main() {
    std::cout << "Hello, World!" << std::endl;
    // 在 $HADOOP_HOME/etc/hadoop/core-site.xml 中配置
    hdfsFS fs = hdfsConnect("localhost", 9000);
    std::cout << fs<< std::endl;
    const char *writePath = "/tmp/testfile.txt";
    hdfsFile writeFile = hdfsOpenFile(fs, writePath, O_WRONLY | O_CREAT, 0, 0, 0);
    if (!writeFile) {
        fprintf(stderr, "Failed to open %s for writing!\n", writePath);
        exit(-1);
    }
    char *buffer = "Hello, World!";
    tSize num_written_bytes = hdfsWrite(fs, writeFile, (void *) buffer, strlen(buffer) + 1);
    if (hdfsFlush(fs, writeFile)) {
        fprintf(stderr, "Failed to 'flush' %s\n", writePath);
        exit(-1);
    }

    std::cout << num_written_bytes << std::endl;
    hdfsCloseFile(fs, writeFile);

    return 0;
}
  • 使用libhdfs3,c++对libhdfs的包装。
  • 使用linux system或者popen 执行hadoop的命令行Command。区别是system不能返回执行的结果,popen可以通过管道获取终端输出的结果。(推荐使用,比较简单,不用配置java jni环境)

例如:

void fun(){
	std::string commandStr = "hadoop fs -get " + file_path + " .";
	system(commandStr.c_str());
}
  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值