新能源汽车热度追踪系统

随着特斯拉超级工厂的产能不断爬坡,一方面让马斯克登上了世界首富的宝座,另一方面特斯的互联网打法,不断降价的策略,从另一个方面提高了中国新能源汽车市场的竞争强度。

最近更是有部分车厂也学着手机的做法,以期货的形式发布1000公里的车型,广汽的石墨烯电池更是说8分钟快充(这套路很像手机的发布套路)。作为消费者,这么前沿的技术咱也不太懂,也找不到专家问,那咱们就从公开的数据,看看用过的车主怎么说吧?!

一、 总体思路:
1)选取几款差不多的头部新能源车(主要从价位,品牌,配置,续航)
这里选取小鹏P7,比亚迪汉EV,特斯拉 Model3(价格,配置和续航比较接近,新能源可能真的是中国造车弯道超的一个绝佳机会了)
2)从几大主流的汽车网站,抓取从上市以来的车主评价。
这里选取懂车帝,易车网,汽车之家的相关车型的评论数据
3)用情感语义分析的方法做正负面分析。
这里用NLP的技术,主要做正负面和主题词提取
4)用曲线图,和中国地图的方式来展示实时的车主响应。
前端展示
5)因为这些车型上市均比较短,我们最好追踪一段时间,最好能实时追踪同时实时地展示出来。

要用到实时采集和定时发布的技术,同时不能太复杂,最好有第3方的方案能用,否则一个小事情自己要解决的东西就太多了。
在这里插入图片描述
在这里插入图片描述
数据来源:https://www.dongchedi.com/article/6837340277561098766

二、数据源和数据引擎准备

数据源,我们采用懂车帝、易车网、汽车之家的相关评论页作为数据源。

数据引擎方面,我们需要一款配置简单,能24小时定时抓取,实时传送到数据库中的软件,这里我们采用易数据云采集器。数据库方面用mysql来存数据即可。这样易数云采集定时采集的数据,实时存入数据库,供分析层的python的NLP接口进行情感语义分析作准备。

在数据库抓取的过程中,我们利用采集器的数据清洗功能,顺便把一些质量不高的评论给清洗掉。本来还想写进评论者的主页抓取它的日常博文,这样可以更好地筛选出真正的车主,这样评论的内容就更加可信。采集器有这个功能 ,但实间有限,虽然也是可视化操作,但也懒得研究了,本着搞实验的心态,此处略过,等有空了再好好清洗清洗。

在这里插入图片描述

三、数据分析层

利用python语言,因为采集器已经清洗过,同时已经入了库,所以这里可以省去数据清洗的步骤了。真心方便啊,做过数据分析的同学应该有感受,数据分析有一半的功夫一般都花在数据清洗上,现在在采集的源头上轻松解决了这个问题,就不必再用python去洗一次,真是数据分析师福音啊。

正负面分析就简单很多了,直接用snowNLP来做即可,调用这个包,结果直接存入数据库中供展现层调用。哪果嫌麻烦,可以直接调用人家训练好的接口也可以。再不行就自己用软件自己训练一套即可。

四、数据展现

这里因为涉及到网端设计和实现,比较费工夫,时间有限,先说下大概思路。同时也拿了我之前做过的一个系统的截图来举例说明。

例:天涯的舆情实时监控系统,这个有时间专门写一篇文章来说明下。

在这里插入图片描述

了解更多分析及数据抓取可查看:
http://cloud.yisurvey.com:9081/html/d8acf20b-342f-4806-8dcc-5e6a8d00881d.html?ly=csdn
本文仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请联系我们。
特别说明:本文旨在技术交流,请勿将涉及的技术用于非法用途,否则一切后果自负。如果您觉得涉及作品、版权和其他问题,请联系我们予以处理。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值