Bytes.toBytes()为hadoop方法,String.getBytes()为java方法。
toBytes()方法是将参数使用UTF-8的编码格式转换成byte[],getBytes()是用读取file.encoding的编码格式,然后用读取的格式进行转换,所以,getBytes转换的byte[]的格式取决于操作系统和用户设置,不推荐这种方法,最好统一只用toBytes()方法。
此外,去看下toBytes()的源码就可以发现,底层的实现是调用的getBytes()方法,只是固定了编码格式为UTF-8而已。