MR--Text

This class stores text using standard UTF8 encoding. It provides methods to serialize, deserialize, and compare texts at byte level. The type of length is integer and is serialized using zero-compressed format.
In addition, it provides methods for string traversal without converting the byte array to a string.

Also includes utilities for serializing/deserialing a string, coding/decoding a string, checking if a byte array contains valid UTF8 code, calculating the length of an encoded string.

功能:
1. 使用UTF-8来存储文本的对象.
2. 在字节级别对文本比较, 无需字符化的进行字符串比较.
3. 序列化和反序列化功能, 测试utf8编码合法性, 计算编码后的长度.

总结:
该类代表了一个文本, 提供了编码, 长度计算等的专为大数据环境实现的优化方法

思考:
如果抛开大数据环境, 这些功能用处可能不大.
在普通程序中, 比较两个字符串无论用什么方法其时间都差不多, 但是将这个微小的差异线性放大100w倍, 甚至1000w倍的时候, 差异就出现了.

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值