知乎盐选文章复制(乱码乱字解决)

最新推荐文章于 2024-09-30 23:18:07 发布

酷酷的小贤佬

最新推荐文章于 2024-09-30 23:18:07 发布

阅读量8.9k

点赞数 28

文章标签：论文阅读网络爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Front_969/article/details/135737397

版权

声明：本人并无散播任何具有版权的专栏文章的目的，研究专栏内容仅为方便摘录句子，无任何侵犯版权行为。

最近突然有朋友问我，如何才能提取到知乎的文章精彩内容，觉得很nice，然后发现，无法复制，包括右键查看源代码都被禁用了，于是就想着使用edig浏览器的阅读模式来进行复制直接在http前加上"read:"即可进入浏览器的阅读模式，但我们发现了一个问题，阅读内的文章内容出现了很奇怪的词语，而且是很多地方同时出现，这该如何解决呢？

经过大量的浏览网络资料后发现原来是字体上出的问题，打开Fiddler进行抓包，重新F5刷新文章页面后到Fiddler找到文章链接那一条包

打开响应包解析包内容然后查看html源代码，可以看到跟阅读模式一样的文章内容出现

这时候大家别着急，我们翻到html源代码的最上面会发现几条base64编码过后的ttf字体文件

看后面两条字体的信息，我们复制src元素里面的base64编码内容去在线Base64转文件工具 - 在线工具网 (hiofd.com)转换到二进制文件内容下载，并更改后缀名为".ttf"，因为是字体文件，所以后缀名为".ttf"

下载完毕后，我们进入下一步，打开打开 TTF 字体 | 在线和免费 | Aspose.Font然后我们选择文件，随便复制一部分文章内乱字的内容到输入框内

最后我们点击查看，会发现惊喜

如果还没发现，那咱们来对比一下：

源内容：就被绑架到

转换内容：我XXX了

结合内容：我被绑架了

发现了没，没发现再去好好瞧瞧吧，一般正问内容使用normal字体文件即可

评论 5

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。