论融媒体——从产品角度和解决方案角度

最新推荐文章于 2024-06-15 06:34:12 发布

jayli517

最新推荐文章于 2024-06-15 06:34:12 发布

阅读量715

点赞数 1

分类专栏：舆情和融媒体文章标签：大数据人工智能

本文链接：https://blog.csdn.net/jayli517/article/details/115005052

版权

舆情和融媒体专栏收录该内容

1 篇文章 0 订阅

订阅专栏

我是舆情行业出身，大数据和AI方向的产品做过很多年，舆情和融媒体确实有千丝万缕的关系，主要原因还是因为舆情会用到分布式采集技术、大数据的一些技术以及NLP语义分析技术，这些技术其实是融媒体产品的基础，所以很多原舆情企业都顺水推舟的做了融媒体产品，比如老牌的拓尔思、清博、闻歌等等。

所谓全媒体，一般解释为：全媒体指采用文字、声音、影像、动画和网页等多种媒体表现手段，利用广播、电视、音像、电影、出版、报纸、杂志和网站等不同媒介形态，通过融合的广电网络、电信网络以及互联网络进行传播。

所谓融媒体，一般解释为：融媒体就是一种信息共享，依据媒介属性进行信息传播的新型媒体。简单说就是实现多种媒体形态，像视频、音频、文字、图片在报纸、微博、微信公众号等不同媒介的传播。通过资源整合互补，实现“资源通融、内容兼融、宣传互融、利益共融”。

两者区别之处在于，“融媒体”不仅包括“全媒体”所追求的技术层面的融合，还包括内容、组织架构、人员设置、管理运营等层面的融合。也就是说“全媒体”是基础，“融媒体”是目的。（这一点仁者见仁智者见智，并不能一概而论，仅供参考）

相关关键词包括：融媒体、全媒体、智媒体、中央厨房、县级融媒体、新闻+、四全媒体、媒介融合等等，还有长一些的组合如“三创、四融、五统、六全、七位一体”，请各位自行查询。（大家都懂的，写方案的人总是会造一些词和概念）

从融媒体的功能分布和业务流程上来说，有几种方法，这个行业各方用法不一，比较全的包括：“策-采-编-发-审-统-汇-示”，也有“舆、策、采、编、发、传、评”等变体或者缩略版本，但是大体含义接近，而且都没有离开“策采编发”这个核心。

在这里插入图片描述

如上图所示，简单来说各个流程需要做的业务基本就是这些，还有很多细节主要是丰富在功能体系里。从系统整体结构来看如下图：

在这里插入图片描述

但是以上的这些流程、结构仅供参考，为什么这么说呢，因为融媒体面向的客户有几种类型，一是出版行业、而是广电行业。他们的侧重点可能不一样，有可能侧重互联网媒体、自媒体等，也可能侧重广播、电视、短视频、移动端媒体等等。根据这些区别，功能结构、系统底层、基础技术和预算报价都会有较大区别。

整个系统会涉及很多功能，尤其是细节功能，我会结合偏向出版行业的解决方案挑重点部分介绍一下。

数据采集部分：

1，国内外基于互联网的数据采集

通过对国内外各类媒体文章采集，汇聚新闻素材并提供检索、筛选、排序等功能。可自定义重点关注微信公众号、微博号、Facebook、Twitter等社交媒体账号，快速捕捉KOL信息，实现线索、素材的整合管理。

2，多种形态内外部数据获取

接入多种渠道线索数据，包括APP客户端用户提交的线索、热线电话反馈线索、邮件反馈线索等等，可针对线索通过关键词、时间范围等条件定位查找。

3，特殊的数据采集

比如某网站、某栏目首页或特定区域数据采集，刊载时长分析可以用，头条分析也可以用。又或者是新闻APP推送的文章采集，第一时间获取最新头条。

选题策划部分：

1，热点分析和挖掘

对实时获取的网络数据不间断实时计算特征，通过特征值快速聚类；并且通过智能算法，结合该网站、该频道历史文章传播情况数据、相似相关文章量、PR值、内外链情况等参数，综合计算其热度，最终分析挖掘出高准确度的热点文章。

2，线索汇聚

平台对每一篇收录的文章都会进行分类打标、实体提取、描述关系提取等处理，通过对分类、时间范围、实体检索等条件进行筛选，可以实现快速定位关键线索、查看摘要、跳转原文等操作。支持通过线索自动生成报题、选题或样稿。

3，策划指挥

支持多级任务流，支持任务派发、工作认领、信息共享、选题协作、流程跟踪等多种管理功能，实现统一平台、统一入口、统一管理、统一指挥。

策划部分一般都会结合舆情监测与分析功能，这样相辅相成，可以最大化利用舆情技术。

舆情监测部分：

1，基础功能

面向海量互联网数据，包括国内外各类数据源，可定制关键词规则、预警规则、舆情简报生成周期，进行全方位7*24小时自动监测、预警、生成报告，实现无人值守。

2，专题、事件监测分析

平台支持通过关键词布尔表达式规则生成条件，框定专题或事件范围，通过分析其始发来源、传播脉络、网民舆论、热点趋势等数据，实现事件溯源、传播追踪、观点分析等功能。

3，社交媒体监测分析

平台通过分析舆论领袖账号，通过关注、粉丝、转发、点评、点赞等数据，分析该账号网络言论倾向以及粉丝传播趋势，发现推手和传播者。

指挥调度部分：

1，指挥和协同

通过选题策划、任务委派、协同配合、共享稿库、共享线索、多级审核等多项功能，实现跨部门多级用户协同办公，提高效率，加强编辑团队建设；

2，移动办公

平台同时支持通过网页和手机端进行远程办公，实时指挥调度工作。

内容编辑部分：

1，一键转发

可对已采集内容或输入自定义URL采集的内容一键转载至后台编辑，支持文章标题、内容、摘要自动提取、图片自动缓存等功能，协助编辑人员快速实现文章再编辑，提高效率。

2，自动版式样式调整

通过统一的编辑器进行文章内容编辑后，可自动生成适合普通网页传播、适合手机H5页面传播和适合微信公众号等自媒体传播的样式并且将图片自动调整适合的大小。

3，智能校对

支持自定义词库，例如领导人名、单位名称、专业词汇、敏感词等；支持错误词库，针对方言等常出错的部分检查；支持自定义行业术语等词汇；针对具体业务需求，支持病句检查。

更高级别的智能校对系统则不仅可以支持以上功能，还可以通过开放式知识图谱进行校对矫正。

可视化分析部分：（内部页面和大屏展示都会用到）

1，影响力分析

通过阅读量、点赞量、评论数、转发转载量、传播渠道传播能力指数、内外链数据等多维度数据综合分析稿件影响力以及网络热度，通过多种图表直观展现数据。

2，传播链分析

通过分析并展现原创、转发转载、推手、引爆点等链条，展现文稿在网络上的传播路径。

3，KPI分析

通过多维度数据分析，建立科学量化的KPI考核机制，实现客观有效的打分和激励机制。

除此之外，还可以有很多种数据的组合方法，图表种类是很多的，但是做多炫就要看客户意思了。这里还有一点问题就是数据的实时性问题，数据量级较大的系统对技术是有要求的，大多数可视化还是做得静态或者伪实时数据，真正能实时的大数据系统必须有足够的分布式底层研发能力的团队才能做。

媒体资源库（媒资库）部分：

•通过管理大量历史新闻素材、图片、音频、视频等资料，可为编辑人员提供快速检索、定位、下载素材等服务；

•素材支持人工分类标签、名称智能匹配检索、多种显示方式方便查找和预览。

•系统支持视频、图片、音频（转文本后识别）、文字的鉴黄和鉴暴恐识别；

•采用基于深度学习的图像识别/分类技术，并结合视觉属性分析，特定目标检测，特定文本检测和特定声音检测等方法，建立多线索语义融合策略，从多个维度对图像及视频进行涉黄涉恐涉暴内容识别。

聚合发布部分：

这部分很简单，就是能对接更多的平台，不管是用API形式还是模拟页面操作形式，让工作人员省事就行。

以上就是一些核心功能的介绍和说明，实际的解决方案会复杂很多，每个功能都要详细说明，而且还有很多细节功能，这里就不过多阐述了。毕竟本文只是介绍，并不是我教大家写解决方案。

关于技术难点和技术差距，主要体现在以下的一些方面，因为很多，这里只介绍一部分，无法以点带面，毕竟很多都可以作为控标点。

数据采集能力，包括采集量、更新频率、覆盖面，能否采集头条数据等特殊数据，能否采集微信公众号的阅读点赞、评论之类的。（面上说的都是虚的，POC测试的时候直接就看出来了，会测的人一测就灵，比如原文发布时间是几分钟前的能否对上、公众号采集100个高频的能力等等，没有足够技术积累的直接废掉，他们只能买数据）；

数据计算、清洗、存取能力，糊弄的话，这里用个mysql、Oracle怎么都能混过去，但是如果每天数据量是几百万级别以上的，这些都没戏。MongoDB等数据库都不一定扛得住，因为数据检索部分还是更适合用ES，所以一般是ES+HBase+Hdfs+MongoDB组合，再配合MQ，比如Kafka、ZeroMQ，还有好用的Redis。在数据量和计算量飚增的时候，尤其是提高了数个数量级的时候，有几个研发敢说系统足够Strong？能说能做到的都是硬汉，至于没有足够技术积累的公司，100万以内的数据处理量就不错了，5000万以上每日的数据量就是对技术的考验了；

NLP技术，很多公司吹了半天的NLP技术，无非就是开源修改或者调别人的接口，搞python的都知道结巴分词、snowNLP、haNLP等，也有bosenNLP等接口。但是真正具备NLP开发和词库积累的研发团队很少。这一点是个忧伤，因为不懂技术的人不通过严格测试，很可能看不出来技术团队的NLP实力如何，例如分词的速度、准确率、句法分析能力、NER准确率等等，但是如果说功能，开源代码这些功能都能实现。我就问一句话：有几个团队有20个G以上的分词词库？（去重且做过标签分类和校对）这是超过10年时间积累出来的，后来才进入NLP领域的人根本做不到，但是客户并不会关注到这些细节，所以NLP大家都说自己做得好，实际情况请自行脑补。

以上是从某乎我的原创专栏迁移过来的文本，格式不好请见谅。

jayli517

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
打赏
0
评论
论融媒体——从产品角度和解决方案角度

我是舆情行业出身，大数据和AI方向的产品做过很多年，舆情和融媒体确实有千丝万缕的关系，主要原因还是因为舆情会用到分布式采集技术、大数据的一些技术以及NLP语义分析技术，这些技术其实是融媒体产品的基础，所以很多原舆情企业都顺水推舟的做了融媒体产品，比如老牌的拓尔思、清博、闻歌等等。所谓全媒体，一般解释为：全媒体指采用文字、声音、影像、动画和网页等多种媒体表现手段，利用广播、电视、音像、电影、出版、报纸、杂志和网站等不同媒介形态，通过融合的广电网络、电信网络以及互联网络进行传播。所谓融媒体，一般解释为：融媒
复制链接

扫一扫