文本分析:吉利不裁员不降薪背后的真相是什么

​​之前推荐了一些数据入门的资料,这里不妨以一个小小的案例讲解如何进行简单的文本分析。主要的步骤包括以下:

  1. 从知乎相关问题爬下所有回答
  2. 将答案分词、去掉停用词、维护语料库
  3. 查看分词结果,并制作词云

我们可以借知乎了解一下最近沸沸扬扬的吉利事件,了解一下伟大的民族汽车品牌、买车就是爱国的浙江吉利控股。当然纯粹技术分享,卑微的号没啥流量,求资本家放过。

首先是爬虫,打开该问题网页后找到真正和服务器端交流的链接。然后用requests自动把内容搞下来,结果存入csv中如图所示:

image

这里主要爬取了以下问题:

吉利汽车不裁员的内幕曝光后,大家怎么看待民营汽车巨头?

如何评价吉利汽车的单休、军训、裁员套餐?

如何看待吉利对外宣称不裁员不降薪,却疑似内部裁员 20%?

接着,可以借用分词工具jieba进行分词,分词前和分词后的效果如图所示

image

分完词,可以稍加调整一下词库和停用词,就是想显示的词加到词库里,不想看见的词加到停用词里。

image

按照频率高低画出高频词汇。可以看到出现了一些奇怪的词,如蓝海、培训、变相、仲裁、20、C、赔偿等。这些高频词汇稍稍了解就可以知道事情真相。原来是:吉利总裁高调宣称不裁员不降薪,原来吉利是不直接裁员,而是搞了个“蓝海”计划“变相”裁员,这个计划是给20%的人绩效打‘C’去劳动培训,从而拒绝劳动法规定的赔偿,因此很多同事得到通知后要去仲裁。这样我们就可以通过找到高频词汇了解主流民意了

image

最后,用wordcloud画出词云来==。

词云可以显示出更多的词来,例如劳动法、恶心、强制、法律、管理等。也可以把字的轮廓显示如下,哈哈。

image

最后不妨用马克思的一段话作为总结:

只有当他和自己的雇主疏远了的时候,当他明显地看出了雇主仅仅是由于私人利益、仅仅由于追求利润才和他发生联系的时候,当那种连最小的考验也经不起的虚伪的善意完全消失了的时候,也只是在这个时候,工人才开始认清自己的地位和利益,开始独立地发展起来,只是在这个时候,他才不再在思想上、感情上和要求上像奴隶一样地跟着资产阶级走。

联系方式

公众号搜索:YueTan

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

YueTann

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值