在将人人新鲜事爬取后插入mysql数据库时,遇到了这样的报错:
Incorrect string value: '\xF0\x90\x8D\x83...' for column
原来是爬取下来的新鲜事带有了emoji表情,搜索解决方案:
【异常处理】Incorrect string value: '\xF0\x90\x8D\x83...' for column... Emoji表情字符过滤的Java实现
加入这么一行代码
//filter emoji过滤掉emoji表情
content = content.replaceAll("[\\ud800\\udc00-\\udbff\\udfff\\ud800-\\udfff]", "*");
return content;
所有的emoji都被变成了**