【数据分析实战】用猛男必备的可视化库做春节档最火电影【第二十条】影评数据分析-1

一、Python所有方向的学习路线

Python所有方向路线就是把Python常用的技术点做整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。

二、学习软件

工欲善其事必先利其器。学习Python常用的开发软件都在这里了,给大家节省了很多时间。

三、入门学习视频

我们在看视频学习的时候,不能光动眼动脑不动手,比较科学的学习方法是在理解之后运用它们,这时候练手项目就很适合了。

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化学习资料的朋友,可以戳这里获取

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

_idcommentratingsharing_urlshow_time_tipis_voteduriplatformsvote_countcreate_timestatusip_locationid
04088229895窝囊废属实是雷佳音的统治区{‘count’: 1, ‘max’: 5, ‘star_count’: 4, ‘value’: 4}https://www.douban.com/doubanapp/dispatch?uri=/movie/36208094/interest/4088229895FalseFalsedouban://douban.com/movie/36208094/interest/4088229895[]88622024-02-12 10:42:47done河南4088229895
14085537171我就说昨天小品沈腾为啥突然叫李逵了,原来是马丽电影里的初恋叫李逵。案子挺好的,立意也很好,但为啥前一个小时非得给我们看雷佳音马丽夫妻吵架。{‘count’: 1, ‘max’: 5, ‘star_count’: 4, ‘value’: 4}https://www.douban.com/doubanapp/dispatch?uri=/movie/36208094/interest/4085537171FalseFalsedouban://douban.com/movie/36208094/interest/4085537171[]75752024-02-10 11:27:49done上海4085537171
2.2 数据清洗预处理
  • 将影评评分从嵌套字典中抽取到一个独立字段
  • 删除无用的字段
  • 预处理空值
2.2.1 预处理数据展示
_idcommentratingsharing_urlshow_time_tipis_voteduriplatformsvote_countcreate_timestatusip_locationidrating_value
04088229895窝囊废属实是雷佳音的统治区{‘count’: 1, ‘max’: 5, ‘star_count’: 4, ‘value’: 4}https://www.douban.com/doubanapp/dispatch?uri=/movie/36208094/interest/4088229895FalseFalsedouban://douban.com/movie/36208094/interest/4088229895[]88622024-02-12 10:42:47done河南40882298954
14085537171我就说昨天小品沈腾为啥突然叫李逵了,原来是马丽电影里的初恋叫李逵。案子挺好的,立意也很好,但为啥前一个小时非得给我们看雷佳音马丽夫妻吵架。{‘count’: 1, ‘max’: 5, ‘star_count’: 4, ‘value’: 4}https://www.douban.com/doubanapp/dispatch?uri=/movie/36208094/interest/4085537171FalseFalsedouban://douban.com/movie/36208094/interest/4085537171[]75752024-02-10 11:27:49done上海40855371714

3. 数据可视化分析

3.1 评论占比分布图

在这里插入图片描述

3.1.1 饼图可视化代码
from cutecharts.charts import Pie
from cutecharts.components import Page

label = ['看过', '想看']

def pie\_base() -> Pie:
    chart = Pie("2024-02-18【第二十条】 看过/想看 短评占比图")
    chart.set_options(labels=label)
    chart.add_series(list(pd.value_counts(df['status'])))
    return chart

pie_base().render_notebook()


3.2 评分占比分布图

在这里插入图片描述

3.2.1 数据解释
{5: 2359, 4: 1212, 3: 507, 2: 143, 1: 70, 0: 30}

3.2.2 个人浅薄洞察

高分占比较大:评分为5分和4分的占比相对较高,分别为51.52%和26.57%,可以看出大部分观众对该电影给予了积极的评价。可能是因为电影的制作质量较高、题材新颖,或者口碑宣传效果很好,所以有了好的反馈。

3.3 【看过-评论】提及人物出现频次柱状图

通过对看过该电影的人的评价进行NER(命名实体识别)抽取,我们可以了解到一些人名被提及的次数。

3.3.1 柱状图可视化代码
from cutecharts.charts import Bar
from cutecharts.components import Page


def bar\_base() -> Bar:
    chart = Bar("2024-02-18【第二十条】看过 人员出现次数柱状图", width="1000px")
    chart.set_options(labels=list(person.keys()), x_label="I'm xlabel", y_label="I'm ylabel")
    chart.add_series("评论出现次数", list(person.values()))
    return chart

bar_base().render('ner.html')

3.3.2 提及人物出现频次柱状图

在这里插入图片描述

3.3.3 数据解释
{
 '赵丽颖': 687,
 '刘耀文': 560,
 '雷佳音': 477,
 '马丽': 473,
 '张艺谋': 439,
 '郝秀萍': 200,
 '韩明': 137,
 '高叶': 119,
 '韩雨': 80,
 '赵丽': 74,
 '吕玲玲': 57,
 '张译': 54,
 '张贵生': 34,
 '李茂娟': 31,
 '王永强': 23,
 '范伟': 16,
 '罗翔': 13,
 '韩雨辰': 11
 }

3.3.4 个人浅薄洞察:
  1. 主要演员或导演的影响力:出现次数较多的人名有赵丽颖、刘耀文、雷佳音等。他们在电影中的表现应该对观众留下了深刻的印象,所以他们的名字在评论中被频繁提及。
  2. 观众关注点的反映:某些人名的出现次数较少。虽然他们的影响力不如主要演员或导演大,但仍然可以看出观众对于电影中各种角色和元素的关注。
  3. 市场营销效果的评估:通过分析NER抽取结果,电影宣发部门可以了解观众对于不同演员或导演的关注程度。可以帮助他们评估市场营销策略的有效性,指导后续的宣传工作,以提高电影的知名度和观众吸引力。

写在最后

综合分析来看,《第二十条》在观众中引起了较大的关注,大部分观众给予了较高的评分,表明电影在整体上获得了一定程度的认可和喜爱。

通过NER抽取,我们也了解到观众对于电影中的主要演员和导演的关注程度,这有助于我们进一步了解电影的受众群体和市场表现。

接下来,我们将在下一篇博客中继续深入挖掘评论中的好评和差评,以更全面地了解观众对于这部电影的评价。敬请期待!

需要采集数据的可以联系我~

(1)Python所有方向的学习路线(新版)

这是我花了几天的时间去把Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。

最近我才对这些路线做了一下新的更新,知识体系更全面了。

在这里插入图片描述

(2)Python学习视频

包含了Python入门、爬虫、数据分析和web开发的学习视频,总共100多个,虽然没有那么全面,但是对于入门来说是没问题的,学完这些之后,你可以按照我上面的学习路线去网上找其他的知识资源进行进阶。

在这里插入图片描述

(3)100多个练手项目

我们在看视频学习的时候,不能光动眼动脑不动手,比较科学的学习方法是在理解之后运用它们,这时候练手项目就很适合了,只是里面的项目比较多,水平也是参差不齐,大家可以挑自己能做的项目去练练。

在这里插入图片描述

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化学习资料的朋友,可以戳这里获取

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

  • 24
    点赞
  • 24
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
很抱歉,目前没有关于yolov7数据格式转的具体信息。yolov7并不是一个官方支持的模型版本,所以没有官方提供的数据格式转脚本或者规范。如果您想将yolov7的数据格式转为其他格式,您可能需要自行编写转换脚本。一种常见的法是根据yolov7的输出结果和其他数据集格式的要求,编写一个脚本来实现数据格式的转。该脚本可以根据yolov7的输出结果和其他数据集格式的要求,将标签、边界框等信息进行相应的转换和修改。具体的转换步骤和代码实现会根据具体的数据集格式和需求而有所不同。您可以参考一些开源项目或者论坛中的相关讨论,以获取更多关于yolov7数据格式转的信息和实现方法。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [txt数据集格式转为xml数据集格式,yolov5数据集转为coco数据集](https://download.csdn.net/download/u011406896/87757696)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 33.333333333333336%"] - *2* [YOLOV5、V7 训练格式转换-训练自己的数据集-男技术控](https://blog.csdn.net/weixin_45755332/article/details/127688464)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 33.333333333333336%"] - *3* [代码实现如何将yolov5数据格式转换为coco格式](https://blog.csdn.net/yiqiedouhao11/article/details/127631109)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 33.333333333333336%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值