批评“古风”歌词“狗屁不通”就是不尊重?我们又都成了“垃圾听众”

昨天发了《大学老师称古风歌词“狗屁不通”,遭粉丝围攻:回家葬母吧》帖子之后,发现大家讨论得非常热烈。

500

500

而《盗将行》这首歌的曲作者和词作者,在昨晚都分别出面回应:

先是曲作者&演唱者花粥:

500

500

我觉得上面这段回应槽点真的很多啊.......

500

这个意思我没太懂,是花粥老师的大作意义非凡,然后其他很多歌都是跪舔?

500

不是说歌应该服务听众,而是作为一名歌手,不论是唱片公司的签约艺人,还是小众的独立歌手,既然选择公开发表作品,就必然要面对吃瓜群众的各种评价。你有创作自由,我也有评论自由啊,你觉得我的评论没说到点子上,可以跟我辩论。

500

好像大家都在说这首歌吧?怎么忽然扯到独立音乐的精神了?

顺便您给讲讲什么是独立音乐的精神?

500

500

好嘛,“垃圾观众论”又来了......

500

“真心发自内心创作的音乐人”.......

睡觉之前又刷到了词作者的回应,是真的在认认真真地讨论歌词,把包括“恶犬”还有几个有争议的梗都解释了一下:

500

500

500

而在凌晨,花粥又发了一条微博:

正文里没有提及,是因为我觉得此事根本不值得去发一条微博,让我心灰意冷的是如今的网络风气和那些自鸣得意的嘴脸,休息一段时间,希望回来的时候看见的是清醒的人们。

500

可能大家都需要清醒一下吧。

----------------------------------------------------------------------------------------------

btw 大家讨论的时候请就事论事,拒绝当“垃圾听众”,从你我做起。

### Python3 爬取并清洗网易云音乐歌单数据进行古风歌词统计分析 #### 数据采集部分 为了实现网易云音乐上古风歌词的数据采集,可以采用Python中的`requests`库来发送HTTP请求,并利用`BeautifulSoup`或`lxml`解析网页内容。然而,考虑到网易云音乐网站可能具有反爬机制,建议使用Selenium模拟浏览器行为以绕过这些限制[^1]。 ```python from selenium import webdriver import time options = webdriver.ChromeOptions() options.add_argument('headless') # 设置无界面模式 driver = webdriver.Chrome(options=options) def get_lyrics(singer_url): driver.get(singer_url) time.sleep(2) # 延迟等待页面加载完 lyrics_list = [] try: song_elements = driver.find_elements_by_class_name("txt")[:50] # 获取前50首热门歌曲链接 for element in song_elements: href = element.find_element_by_tag_name("a").get_attribute("href") driver.execute_script(f'window.open("{href}");') handles = driver.window_handles driver.switch_to.window(handles[-1]) time.sleep(2) lyric_area = driver.find_element_by_class_name("lyric-content") lyrics_text = lyric_area.text.strip().replace("\n", " ") lyrics_list.append(lyrics_text) driver.close() driver.switch_to.window(handles[0]) except Exception as e: print(e) finally: return lyrics_list ``` 此代码片段展示了如何打开指定歌手主页上的每首歌曲详情页,并从中提取歌词文本。需要注意的是,在实际应用中应当适当增加延时(`time.sleep`)以降低被封禁的风险;同时也要遵循目标站点的服务条款和法律法规。 #### 数据清洗与预处理 收集到原始歌词后,下一步是对它们进行必要的清理工作,比如去除HTML标签、过滤掉无关字符等操作: ```python import re def clean_data(raw_lyrics): cleaned_lyrics = [] pattern = r'<.*?>|[\(\[].*?[\)\]]|[^\u4e00-\u9fa5]' # 定义正则表达式匹配规则 # 移除 HTML 标签 和 非中文字符 (括号内除外) for raw_line in raw_lyrics: line_without_tags = re.sub(pattern, '', raw_line).strip() # 应用正则替换函数 if len(line_without_tags)>0: # 排除非空行 cleaned_lyrics.extend([line_without_tags]) # 添加至列表 return cleaned_lyrics ``` 上述方法能够有效地移除需要的信息,保留纯文字形式的歌词供后续分析使用。 #### 统计分析 最后一步就是基于已有的干净数据集来进行各种类型的统计学研究了。这里提供了一个简单的词频计算例子: ```python from collections import Counter all_words = ' '.join(cleaned_lyrics).split() word_counts = dict(sorted(dict(Counter(all_words)).items(), key=lambda item:item[1], reverse=True)) for word, count in list(word_counts.items())[:10]: print(f"{word}: {count}") ``` 这段脚本会输出最常见的十个词语及其出现次数。当然还可以进一步探索更多复杂的自然语言处理技术,如情感倾向评估、主题模型构建等等。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值