数据预处理--词语压缩
最新推荐文章于 2023-11-16 19:39:05 发布
博客介绍了在电商评论数据预处理中,如何通过词语压缩来去除单条评论文本中的重复文字。方法主要针对开头或结尾的重复文字,通过正向和逆向判断实现压缩,例如将'质量很好很好很好很好'压缩为'质量很好'。
摘要由CSDN通过智能技术生成