这里我们要实现的案例是先对学生姓名进行排序(字典排序),如果遇到姓名重名的情况,再对年龄进行排序(升序)。
- 将原始数据文件上传至HDFS
[root@hadoop01 test_data]# hdfs dfs -mkdir /test_comparation_input
[root@hadoop01 test_data]# hdfs dfs -put test_comparation.txt /test_comparation_input
这里会对原始的5行数据先按照姓名的ascii值进行字典排序,对于重名的Bob,会对第2行和第4行的两个Bob按照年龄进行二次排序。
新建project:
- 引入pom依赖
<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
<modelVersion>4.0.0</modelVersion>
<groupId>