2018和2019年经济学人The Economist词频统计

最新推荐文章于 2025-04-28 15:27:03 发布

weikia

最新推荐文章于 2025-04-28 15:27:03 发布

阅读量736

点赞数 1

分类专栏：学习文章标签：恰饭

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weikia/article/details/105818764

版权

学习专栏收录该内容

1 篇文章

订阅专栏

2018和2019年经济学人The Economist词频统计

最近看到网上关于2018和2019年的经济学人词频统计数据比较少，所以自己对2018全年以及2019全年的经济学人文本进行了一次统计，其词频前15个具体如下：

2019年全年统计：
the  175939
of   93510
to   88070
a    81499
in   72888
and  63556
is   40276
that 38526
for  30140
it   28404
on   23534
as   23011
are  20381
by   19578
with 18900

2018年全年统计：
the  178232
of   95476
to   89934
a    81270
in   74488
and  65221
is   41148
that 39241
for  30959
it   27454
on   23553
as   23153
are  20836
by   19926
with 19144

这次共统计到文本数为：

2019年全年	2018年全年
不重复单词数: 84484	不重复单词数: 86489
全部单词数: 3091951	全部单词数: 3121423

总的不重复单词数为：123923
总词数：6213374
其中：

词频	单词个数
大于50次	9020
大于20次	16370
大于10次	24846
大于5次	37255
大于1次	65171
1次	58752

对全部文本单词进行拼写检查后得到：
不重复单词数: 64174
全部单词数: 5739093

附上拼写检查前和检查后的全部词频表，需要的自取：
链接：https://pan.baidu.com/s/1uHnWsFgwOVics3Vo2lumFw
提取码：eacp

博客等级

码龄5年

1
原创

1
点赞

0
收藏

0
粉丝

关注

私信

分类专栏

学习 1篇

展开全部收起

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。