关于中文和分词,计算机通讯的思考

1 篇文章 0 订阅
1 篇文章 0 订阅

 

  1. 中文分词 为什么不用四角号码呢(方块字四个角加一个补码)?

         10604 30104 22770 80221 26000 67127 12013 42913 44214 30112 12900 21182 27106 77217

          西塞山前白鹭飞,桃花流水鳜鱼肥.

          要知道中文的四角号码之间是有天然的联系的,比如词\成语等,对中文分池的查找和分类绝对有帮助吧

    2.计算机的底层是01,10,00,11 组成的二进制流,中文不能传输四角号码流吗?

      这样对传输和识别都很有帮助吧. 四角号码流组合变化更多,也有中国传下来的识别方法,比什么16进制,64位处理中文要          快一些吧

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值