从网页上直接扒取latex格式的公式

latex是写公式非常方便的格式,很多具有专业性质的网站,发布者在发布公式内容时都采用的latex的形式。但是我们读者看的时候这些公式是图片的形式,不方便扒取下来进行编辑。最近写作业的时候遇到这个问题,联想到了HTML,稍微研究了一下网页,找到了这个偷懒的方法。
这里以知乎为例。
在这里插入图片描述

这是知乎的一篇关于高斯核函数可改写成内积形式的推导,推导部分自己重新推一遍问题不大,但是里面有个多项式展开的公式形式很复杂,属实不想再在latex里面敲一遍:
在这里插入图片描述

这个时候我们就需要用到HTML。首先按f12打开网页查看器,我用的是火狐浏览器,不同浏览器操作上可能有细微的差别,大家自己摸索一下就行。初始的界面是很简洁的,如下图所示。
在这里插入图片描述

接下来我们打开网页的body,发现变得很复杂。但是看一下就会发现下面都是些js的,我们要的内容没关系,就在这些js上面的root标签里面:
在这里插入图片描述

依次点开root→App→App-main的标签,可以发现基本上没找错。同时可以借助浏览器的指示器确认一下,是网页的主体部分。
在这里插入图片描述在这里插入图片描述

接下来就是一样的过程,同样借助浏览器的指示,找到网页具体内容的css格式部分。每一次的展开我就不具体展示了,直接看到展开的我们需要的内容:
在这里插入图片描述

可以看到,每一行的data-pid就对应了网页的一行。借助指示器找到我们要的那一行公式,展开:
在这里插入图片描述我们需要的公式就在里面了:
在这里插入图片描述

双击公式的地方,可以进入编辑状态,直接复制latex代码。
在这里插入图片描述

复制到latex编辑器里看一下效果:
在这里插入图片描述在这里插入图片描述

之后就可以随意编辑了。

  • 9
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值