petitlyrics 歌词提取 有感

想做一下歌曲的时间轴,搜歌词搜到了这个网站。

奇怪的是看前端代码和network监听请求都不能获得完整歌词。

https://petitlyrics.com/lyrics/934773

a. 歌词截图如下:

Figure1 歌词截图

b. 控制台查看前端代码只有部分歌词

Figure2 控制台截图

c. Network查看请求数据,发现是日语对应的unicode编码,即`&#`+unicode+`;`

Figure3 请求返回的页面代码截图

d. 解码(借助python html.unescape(字符串))后仍然是只有部分歌词

夢を見ていたわ望み高く生きて愛がすべてだと神は許し給うと若く勇気溢れ夢は輝いてた自由にはばたき歓び追いかけた夢は悪夢に狼の牙が望み引き裂き 夢喰いちぎり夏 あの人来て

e. 尝试以`続け`的`続け`来搜索,也没有搜索到。

f. 截图然后随便找了三个OCR在线识别的网站

Figure4 OCR 识别网站1 txt

Figure5 OCR 识别网站2 在线文本

Figure6 OCR 识别网站3 txt

============前端知识匮乏,待我再想想办法弄到原歌词==============

https://franks543-lyric-get.azurewebsites.net/这个网站好像可以用

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值