一个文明延续时间的计算
原始数据来源
获取python第三方库jieba(0.42.1版)中的词汇文件:dict.txt
统计分析
该dict.txt文件一共收录了349046个词,这些词由12040个字符组成;统计结果如下:
十万汉字字符最终成词量预估(按比例计算)的第一行数据的值为:
100000×自然成词概率,第二行数据开始按占总词量比例计算;
如:948289 = 占总词量的比例 × ( 96179 ÷ 0.033176143 )
1090899 = 占总词量的比例 × ( 96179 ÷ 0.033176143 )
汉字目前的数量为10万左右,由此,十万汉字最终成词量预估为:2899053个;按现在70万词汇计算,且每年匀速产生140新词(70万/5千年),预计15707年后,汉字将失去顺畅造词的能力,汉字文明将逐渐消失;且可以大概的预估一个文明从诞生文字到逐渐消亡大约2万地球年。
参考
我的大脑