python 提取swf中的文字_用Python提取新闻联播文字摘要

本文介绍了一种使用Python从新闻联播中提取摘要和关键字的方法,结合jieba和jiagu库,实现了内容分析和关键词提取。通过Github Actions定时运行脚本,自动更新静态网站内容,以跟踪国家政策趋势。
摘要由CSDN通过智能技术生成
本文使用 Zhihu On VSCode 创作并发布

display: false date: 2020-06-11 title: 用Python提取新闻联播摘要和关键字 categories: [Python] tags: [摘要,CCTV,jieba,jiagu] draft: false

转载请注明微*信公众号:结丹记事本儿,关注有惊喜哦!

eef41ee14f705c6e37f9ce0b4bfdacd7.png
20200612110411

对一个业余投资爱好者来说,看新闻联播可比什么K线布林小道要有意义的多,传说会看新闻联播能少走十年弯路,我是深信不疑啊。

但我们不愿意蹲点看视频,还是文字报道读起来快,如果能有个摘要那就更好了,要是能有关键字提取,还能回顾一段时间的关键字,那岂不是时间轴都有了,啧啧,完美掌握国家政策趋势。

内容

由于是给hugo静态网站添加内容,按照hugo模板生成一个文件即可。

文件内容主要有两部分组成

  1. 今日关键字:由全天报道的所有内容自动生成,选取今日最佳关键字。另外针对投资领域,我们把指数名称、板块和行业等也做了关键字整理,如果发现这些关键字,也做高亮提示
  2. 新闻摘要:每篇报道的内容文字可能比较多,我们提取最关键的两句

新闻源采用tushare的新闻联播接口。

中文的分词和摘要采用jiagu。

运行环境

Github全家桶的Action功能(真香啊),可以完整打开一个docker进程。

  1. 定时运行Python脚本拉取新闻数据
  2. Hugo生成静态文件
  3. 提交repo

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值