尚方宝剑之说
我使用FilterHTML。它很简单,允许您定义一个控制良好的白名单,擦除URL,甚至匹配正则表达式的属性值或每个属性具有自定义过滤功能。如果小心使用它可能是一个安全的解决方案。以下是自述文件的简化示例:import FilterHTML# only allow:# tags with valid href URLs# tags with valid src URLs and measurementswhitelist = {
'a': {
'href': 'url',
'target': [
'_blank',
'_self'
],
'class': [
'button'
]
},
'img': {
'src': 'url',
'width': 'measurement',
'height': 'measurement'
},}filtered_html = FilterHTML.filter_html(unfiltered_html, whitelist)