实验 : 直接访问单个 HDFS 文件
步骤1: 配置操作系统的目录和数据库的Directory对象
步骤2: 创建外部表
步骤3: 在Hadoop中放入示例文件
步骤4: 生成“位置文件”
步骤5: 检查结果
步骤6: 改动HDFS文件,检查结果.
1、直接访问HDFS数据文件
- Oracle的HDFS直接连接器允许从数据库中直接访问HDFS的数据文件。 支持的数据文件格式取决于ORACLE_LOADER的驱动程序。
- 直接访问HDFS上的几个带分割符的文本文件。可以在数据库中用SQL来查询该文件。
步骤1:
配置hdfs_stream script文件。在使用直接连接器前,需要配置hdfs_stream 脚本. hdfs_stream 是 包含在ODCH的安装包中(ODCH_HOME/bin). 我们需要在脚本中指定HADOOP_HOME和DIRECTHDFS_HOME.
PROMPT> vi ${DIRECTHDFS_HOME}/bin/hdfs_stream
…
export HADOOP_HOME=/opt/hadoop
…
export DIRECTHDFS_HOME=/opt/ODCH
…
//另外Oracle用户需要在 {$DIRECTHDFS_LOG_DIR} 目录中创建log/bad文件. 所以要确保Oracle用户有读写权限.
PROMPT> su - oracle
PROMPT> touch /opt/ODCH/log/oracle_access_test
PROMPT> rm /opt/ODCH/log/oracle_access_test
步骤2
- 配置操作系统的目录和数据库的Directory对象