C语言解析动态html,【c语言】使用gumbo解析HTML

本文介绍了如何在C语言中使用gumbo库解析HTML。首先讲述了为何选择gumbo,然后详细描述了在Linux Debian环境下编译安装gumbo的步骤,包括解决编译错误的过程。接着通过两个实例展示了gumbo的使用方法,包括获取HTML中的title和解析带有特定class属性的DNS IP地址及物理地址。编译gumbo示例代码时,需要添加-lgumbo和-loauth链接库。
摘要由CSDN通过智能技术生成

之前使用过PHP的Simple HTML DOM简单地解析HTML但PHP终非我所熟悉的语言,虽然我并不对语言抱有绝对的执着= =(什么你不相信,好吧,不管你信不信,反正我是信了= =)。虽然可以简单地使用正则表达式来解析HTML但我不是希望能够找到一个合适的HTML解析库,网上搜索了下关于c语言解析HTML的库,好像不是挻多的样子,我搜索到了google的gumbo,

gumbo是开源的,可以从这里得到它

https://github.com/google/gumbo-parser

我们需要下载回来手动编译安装,这里以linux debian为例

git clone https://github.com/google/gumbo-parser

cd gumbo-parser

./autogen.sh

./configure

这些一般都会非常顺利,没什么好说的,接下来就是

make

我要执行make后发现有一个错误导致无法编译通过,不知道各位是什么情况,给出的错误提示是benchmarks/benchmark.cc

文件中使用了未定义的函数clock_gettime

man了一下,该函数需要包含time.h头文件,打开benchmark.cc文件查看的确已经包含了time.h头文件,很苦恼,突然一下子就懵了,不过还好我反应还算快,看到manpages中写到

Link with-lrt (only for glibc versions before 2.17).

于是猜测没有链接库,使用vim打开Makefile文件,

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值