2018和2019年经济学人The Economist词频统计
最近看到网上关于2018和2019年的经济学人词频统计数据比较少,所以自己对2018全年以及2019全年的经济学人文本进行了一次统计,其词频前15个具体如下:
2019年全年统计:
the 175939
of 93510
to 88070
a 81499
in 72888
and 63556
is 40276
that 38526
for 30140
it 28404
on 23534
as 23011
are 20381
by 19578
with 18900
2018年全年统计:
the 178232
of 95476
to 89934
a 81270
in 74488
and 65221
is 41148
that 39241
for 30959
it 27454
on 23553
as 23153
are 20836
by 19926
with 19144
这次共统计到文本数为:
2019年全年 | 2018年全年 |
---|---|
不重复单词数: 84484 | 不重复单词数: 86489 |
全部单词数: 3091951 | 全部单词数: 3121423 |
总的不重复单词数为:123923
总词数:6213374
其中:
词频 | 单词个数 |
---|---|
大于50次 | 9020 |
大于20次 | 16370 |
大于10次 | 24846 |
大于5次 | 37255 |
大于1次 | 65171 |
1次 | 58752 |
对全部文本单词进行拼写检查后得到:
不重复单词数: 64174
全部单词数: 5739093
附上拼写检查前和检查后的全部词频表,需要的自取:
链接:https://pan.baidu.com/s/1uHnWsFgwOVics3Vo2lumFw
提取码:eacp