Pandas——词云图绘制

文本处理

  • 词频统计 绘制词云图

  • 英文词频统计 分词→词形还原(nltk) →去停用词 →统计词频

  • 中文词频统计 分词(jieba) →去停用词 → 统计词频

评论文本的分析

  • 通过词云图展示出现次数较多的词, 可以发现问题

微博/头条/新闻评论

词云图绘制

可以使用Pyecharts绘制词云

绘制词云图的API

import pyecharts.options as opts
from pyecharts.charts import WordCloud

要准备的数据

[(文本, 数值),(文本2,数值2)....]

negtive_words_wordcloud = all_words_n.most_common(100)
(WordCloud()
    .add(series_name="好评词云",
         data_pair=negtive_words_wordcloud,  #传入绘制词云图的数据 [[要展示的词, int值],[要展示的词2, int值]]
         word_size_range=[16, 80])  #word_size_range 字号大小取值范围
    .set_global_opts(
        title_opts=opts.TitleOpts(
            title="好评词云", 
            title_textstyle_opts=opts.TextStyleOpts(font_size=23) # 设置标题字号
        ),
        tooltip_opts=opts.TooltipOpts(is_show=True),  # 设置为True 鼠标滑过文字会弹出提示框
    )
    .render('neg_wordcloud.html')
)

数据分析报告

周报月报

  • 先展示大盘的数据, 最主要的指标

  • 以图为主

    • 使用的图形不要过于复杂

    • 折线图, 饼图, 柱状图, 堆积柱状图, 散点图 基本图表为主

  • 关键的变化, 需要用文字进行说明

  • 如果是月报的话, 大盘数据展示后, 各个维度的数据都要展示一下

周报月报一旦做出来了, 框架搭建起来之后, 直接修改数据,和文字内容就可以

专题分析

  • 用户评论文本分析

  • 用户留存分析 - 同期群分析

    • 明确KPI 当前留存率比较低 当前留存是多少 行业的平均水平是什么样的

    • 拉数据, 最近半年数据列出来, 分渠道, 分城市, 分设备类型.. 做同期群

    • 得出结论

  • 活动运营分析

    • 活动前: 明确关键的KPI GMV (销售总金额) NMV( 净销售金额) 流量数据(每天访客数) 转化率

      • 销售额 = 访客数* 转化率*客单价

      • 人 货 场 (投放)

    • 活动中: 做指标监控, 有波动了要及时发现问题

    • 活动后: 回收数据, 做总结出报告

  • 新产品投放调研分析

  • 4
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值