- 博客(3)
- 收藏
- 关注
原创 Lab 0(Exercise、task)
使用文本相似度检测工具(如 TF-IDF、Jaccard 相似系数或 Word2Vec)来比较两段文本的内容,评估其语义相似度,即使某些词汇被替换。模型会发现潜在的同义词替换伪装。领域特异性:不同领域的停用词可能不同。:检测文章中是否存在不符合上下文的同义词替换,替换的同义词是否保持逻辑连贯性。上下文敏感性:某些词在特定上下文中可能是重要的,而在其他情况下可能不重要。领域特定列表:构建行业特定的停用词列表,考虑到专业术语和常用表达。上下文驱动的动态停用词:根据特定任务或领域动态生成停用词列表。
2024-10-22 23:50:53 240
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人