大数据分析林夕的歌词

最近看了一篇名叫《我分析了42万字歌词,就为了搞清楚民谣歌手在唱些什么》的文章,一程序员利用爬虫技术爬到大约42万字的民谣歌曲的歌词,再分词解析出每个词出现的频率,最后分析得出民谣歌手的情绪,喜爱的城市、季节等等,用数据来说话,比一句“我觉得”来的更有说服力。这对于酷爱听歌的我来说显得十分的有趣。刚好今天有空,我也尝试分析一下大词作家林夕先生的歌词里到底写了些什么。





程序我是用Java语言写的,其中核心的部分就是分词,也是一个小难点,再统计一下每个元素(每个词)出现的频率,将结果输出到Excel中,再作出分析图。 上网搜了一下,不看不知道,着实吓了我一跳,林夕填过的歌词竟然有2500多首,合起来有60多万字(我连写800字的作文都困难⊙﹏⊙b汗)!注意,这里每首歌歌词都是是不含第二节部分!



接下来看下分析结果


总体来说歌词还是以写男女之间的情爱为主,可以看出除开词作者介绍,出现最多的三个词是“没有”,“一个”和“爱”。




林夕歌词的正面情绪大于负面情绪,乐观大于悲观。可以回忆一下,平时听这些歌是不是能给你更多得溫暖跟鼓舞,这其中“爱”字出现了7083次,也是出现最多的一个汉字,并且“love”也是出现最多的单词。不过往往决定一首歌情感的往往是编曲。



林夕写了2000多首歌词,跟王菲合作的次数最多,有95首歌由王菲来演唱。第二名竟然是谢霆锋。。。可以可以。



如果说一个人作品能说明一个人的性格和喜好的话,那么林夕先生最喜欢的颜色是黑色(167),最爱穿的衣服是毛衣(12),最喜欢的花是玫瑰(51),最喜欢的成语是人山人海(59)和地老天荒(37),跟母亲(84)的关系比跟父亲(67)的关系好。描写男人(523)比女人(267)多了近一倍。歌词中写今天有317次,明天有119次,昨天有60次。可以看出林夕更珍惜当下,并憧憬未来。


总结:林夕给我的感觉是他非常的内敛,沉稳和低调。很多流行的情歌多以伤感、悲痛等暗色系为主题,但林夕歌词里却存在大量的美好事物,如爱(871)、拥抱(376)、幸福(286)等等,是个内向的暖男。我最喜欢他填写的一首词是《钟无艳》,能让人切实的知道这首歌表达的是什么,搭配上粤语的吐字发音,确实让人惊艳。


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值