我有以下输入:
Hi! How are you?
Wassup? :P
LOOOL!!! :D :D :D
然后通过表情符号库运行,它就变成了这个:
Hi! How are you?
Wassup?
LOOOL!!!
我有一个逃避HTML entites的功能来阻止XSS。因此,在第一行的原始输入上运行它将产生:
Hi! How are you? <script>//NOT EVIL!</script>
现在我需要逃避所有输入,但同时我需要保持表情符号处于初始状态。因此,如果有<:-p>
我正在考虑对情感文本进行正则表达式分割。然后自己处理每个部分,然后将字符串连接在一起,但我不确定Regex被绕过的容易程度如何?我知道格式永远是这样的:
[]
使用列表可能很慢,因为我需要在可能有20-30-40个表情符号的文本上运行该正则表达式。另外,可能需要处理5-10-15条短信。什么可以是一个优雅的解决方案?我准备使用第三方库或jQuery。 PHP预处理也是可能的。