爬取《政府工作报告》词云展示并做词频统计

最新推荐文章于 2025-04-13 14:54:33 发布

unique_xl

最新推荐文章于 2025-04-13 14:54:33 发布

阅读量5k

点赞数 5

文章标签： python

本文链接：https://blog.csdn.net/unique_xl/article/details/110671489

版权

本文介绍了如何使用Python爬取《政府工作报告》，进而生成词云展示，并进行了词频统计，展示了统计结果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

爬取《政府工作报告》词云展示并做词频统计

爬取《政府工作报告内容代码：

from requests import *
from bs4 import BeautifulSoup
r=get("http://www.hgnu.edu.cn/2020/0531/c1112a61314/page.htm",timeout=10)
r.encoding="utf-8"
s=BeautifulSoup(r.text,"html.parser")
f=open("报告.txt","w",encoding="utf-8")
L=s.find_all("p")
for c in L:
    f.write("{}\n".format(c.text))

f.close()

词云展示：

引用图：
在这里插入图片描述

词频统计

import re
import collections  # 词频统计库
import numpy

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

unique_xl

关注关注

5
点赞
踩
52

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

python爬虫之2017政府工作报告词频统计

云先生的博客

03-15

6240

python爬虫之2017政府工作报告词频统计工作报告获取中文编码数据清洗字符分割统计 python编码中文显示问题图表显示快捷键加粗 Ctrl + B 斜体 Ctrl + I 引用 Ctrl + Q 插入链接 Ctrl + L 插入代码 Ctrl + K 插入图片 Ctrl + G 提升标题 Ctrl + H 有序列表 Ctrl +

利用python爬取网页做词云分析——2019年政府工作报告

草地打滚的熊

03-28

5822

直接上代码 #!/usr/bin/python # -*- coding:utf-8 -*- import matplotlib.pyplot as plt from PIL import Image import numpy as np from wordcloud import WordCloud from bs4 import BeautifulSoup import jieba imp...

参与评论您还未登录，请先登录后发表或查看评论

2002-2020年各省政府工作报告创新、环保、绿色、低碳等词频统计

2401_84585615的博客

02-25

311

在2002年至2020年期间，中国各省政府工作报告中关于“创新”、“环保”、“绿色”、“低碳”等关键词的出现频率，反映了国家对创新驱动发展战略和生态文明建设的重视程度。2002-2020年各省政府工作报告创新、环保、绿色、低碳等词频统计。

基于Python的政府工作报告文本分析：从词频统计到词云生成

最新发布

m0_74774931的博客

04-13

1157

在政策研究和舆情分析领域，政府工作报告是解读国家发展战略的重要文本资料。本教程将展示如何运用Python对政府工作报告进行深度文本分析，通过词频统计和可视化呈现，快速抓住报告的核心关键词。

政府工作报告

weixin_46945014的博客

01-01

169

# -*- coding: utf-8 -*- """ Spyder Editor This is a temporary script file. """ # #1.通过网络数据采集获取政府工作报告（2014-2021年度报告）， #并对政府工作报告历年的数据进行存储、数据整理、中文分词、统计词语关联，并可视化， #同时给出政府工作报告重心随时间的转移情况统计。 #导入必要的包 import requests from lxml import etree import jieba from wordcl

利用python爬取工作报告

weixin_52260515的博客

11-11

2239

利用python爬取工作报告

爬取政府工作报告文本-Python

Stata连享会

10-23

731

政府工作报告》是一份具有法律效力的官方文件，它不仅汇总了各地区过去一年的工作成果，还展望了未来的发展蓝图，因此，它对于经济建设与发展的研究具有不可替代的价值。本文将指导你如何使用 Python 编程语言，从中国经济网这一权威平台上爬取全国各省市的《政府工作报告》。

Python-政府工作报告词云实例

小程博客

10-25

2643

问题分析需求：对于政府工作报告等政策文件，如何直观理解？体会直观的价值：生成词云&优化词云政府工作报告等文件 => 有效展示的词云文本1-新时代中国特色社会主义文本2-关于实施乡村振兴战略的意见基本思路步骤1：读取文件、分词整理步骤2：设置并输出词云步骤3：观察结果，优化迭代 #CiYun.py import jieba import wordcl...

2022年政府工作报告词频分析

niuyongliang110的博客

03-15

2495

2022年政府工作报告词频分析 a.获取网页文件（捕获异常） b.筛选有用目标 c.写入文件 d.文件预处理：去除无用字符及停用词汇 e.词频统计，建立字典，按词频排序并输出 f.绘制词云 from bs4 import BeautifulSoup from wordcloud import WordCloud import matplotlib.pyplot as plt import requests import jieba url=“http://www.gov.cn/premier/2022-0

使用Python抓取豆瓣电影评论并分析词云生成词云图

qq_74311623的博客

12-21

4377

本文将介绍如何使用Python抓取豆瓣电影的评论，并通过词云分析来展示评论中的高频词汇，使用Python的词云生成库，可以将文本数据转换为词云图。通过实践，可以掌握词云生成的基本方法和技巧，并了解如何将文本数据以更加直观的方式呈现出来。同时，本文所介绍的方法也可以应用于其他网络平台的评论分析，为相关领域的研究提供一定的借鉴和帮助。将list_tags转换为一个新的DataFrame，名为data_tags，包含两列，一列是词语，一列是词性。设置词云图的标题为"海王的评论"，字体大小为23。

基于Python词云分析政府工作报告关键词

09-16

主要介绍了基于Python词云分析政府工作报告关键词,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

【头歌-Python】8.3 政府工作报告数据提取(project)-第1~3关

谛凌的博客

06-11

8049

附件中为2023年政府工作报告，本关要求将报告文件读取为一个字符串。头歌-Educoder 8.3 政府工作报告数据提取(project) 前三关

利用jieba和wordcloud写政府工作报告的词云统计和显示

tdjack的博客

02-01

2124

非科班小白，断断续续学习一些python相关的知识，做个简单记录，方便以后查阅，代码中的filename文件需要在py文件同一个文件夹内，另外chinamap这个图片也需要在同意文件夹内。图片需要白色背景 import jieba from wordcloud import WordCloud from scipy.misc import imread ###排除词库 excludes...

【头歌-Python】8.3 政府工作报告数据提取(project)-第5关

谛凌的博客

06-11

6217

头歌-Educoder 8.3 政府工作报告数据提取(project) 第5关附件中为2023年政府工作报告，本关要求将报告读取为一个字符串，再利用jieba对中文进行分词，略过停用词后，统计报告中出现的前n个高频词。

关键词数量统计python_利用python统计《十九大报告》中的关键词和词频

weixin_30972263的博客

01-14

823

利用python统计《十九大报告》中的关键词、报告摘要和词频。引用snowNLP。得到的结果：1、关键词:前五个关键词为 ['发展', '人民', '中国', '党', '建设']2、报告摘要：强调坚定道路自信、理论自信、制度自信、文化自信;明确全面深化改革总目标是完善和发展中国特色社会主义制度、推进国家治理体系和治理能力现代化;明确全面推进依法治国总目标是建设中国特色社会主义法治体系、建设社会...

Python实例12：政府工作报告词云

LuckSugar

08-06

3531

Python实例12：政府工作报告词云基本思路：读取文件、分词整理；设置并输出词云；观察结果，优化迭代； # GovRptWordCloudv1.py import jieba import wordcloud f = open("E:\\python\\learn\\2020政府工作报告.txt", "r", encoding="utf-8") t = f.read() f.close() ls = jieba.lcut(t) txt = " ".join(ls) w = wordcl

【Python开发】年报词频统计-附完整代码

weixin_43498642的博客

05-10

1290

拿来就可以用的年报词频统计，根据指定的关键词来统计年报中各个分类的词频，一共有五个类别（人工智能技术指数、区块链技术指数、云计算技术指数、大数据技术指数、实践应用），每个类别中包含数量不等的属于各自的关键词。

【Python】政府工作报告词云

点滴记忆

04-26

2505

2019政府工作报告.txt https://www.lanzous.com/iby44eh 栗子1： import wordcloud import jieba f=open("2019政府工作报告.txt","r",encoding="utf-8") t=f.read() f.close() ls=jieba.lcut(t) txt=" ".join(ls) w=wo...