lua去除HTML/css/js等代码
近期打算重新用c+lua实现以前用python写的一个简单的spider,所有规则尽可能都用lua实现,当然了,比如ocr的部份还是转调C的实现,由于对lua的不熟,花了几天,断断续续才整理出一个清理HTML等代码的函数:
[code="lua"]
function clearHTML(html)
html = string.gsub(html, '[%a%A]-', '')
...
原创
2013-10-10 10:43:30 ·
795 阅读 ·
0 评论