声明:本人并无散播任何具有版权的专栏文章的目的,研究专栏内容仅为方便摘录句子,无任何侵犯版权行为。
最近突然有朋友问我,如何才能提取到知乎的文章精彩内容,觉得很nice,然后发现,无法复制,包括右键查看源代码都被禁用了,于是就想着使用edig浏览器的阅读模式来进行复制直接在http前加上"read:"即可进入浏览器的阅读模式,但我们发现了一个问题,阅读内的文章内容出现了很奇怪的词语,而且是很多地方同时出现,这该如何解决呢?
经过大量的浏览网络资料后发现原来是字体上出的问题,打开Fiddler进行抓包,重新F5刷新文章页面后到Fiddler找到文章链接那一条包
打开响应包解析包内容然后查看html源代码,可以看到跟阅读模式一样的文章内容出现
这时候大家别着急,我们翻到html源代码的最上面会发现几条base64编码过后的ttf字体文件
看后面两条字体的信息,我们复制src元素里面的base64编码内容去在线Base64转文件工具 - 在线工具网 (hiofd.com)转换到二进制文件内容下载,并更改后缀名为".ttf",因为是字体文件,所以后缀名为".ttf"
下载完毕后,我们进入下一步,打开打开 TTF 字体 | 在线和免费 | Aspose.Font然后我们选择文件,随便复制一部分文章内乱字的内容到输入框内
最后我们点击查看,会发现惊喜
如果还没发现,那咱们来对比一下:
源内容 : 就被绑架到
转换内容 : 我XXX了
结合内容 : 我被绑架了
发现了没,没发现再去好好瞧瞧吧,一般正问内容使用normal字体文件即可