NLP 岗位精选笔试题分享

本文分享了NLP岗位的精选笔试题目,涵盖文本预处理、关键词归一化、N-gram计算、日期正则表达式、文本分类模型选择等方面。还探讨了在NLP数据集中提升模型精度的特征选择和主题建模的正确认识。
摘要由CSDN通过智能技术生成

问题1:下面在 NLP 项目中哪些是文本预处理的重要步骤?

1、词干提取(Stemming)
2、移去停止词(Stop word removal)
3、目标标准化(Object Standardization)

答案:1、2 和 3
解析:词干提取是剥离后缀(「ing」,「ly」,「es」,「s」等)的基于规则的过程。停止词是与语境不相关的词(is/am/are)。目标标准化也是一种文本预处理的优良方法。


问题2:下面哪项技巧可用于关键词归一化(keyword normalization),即把关键词转化为其基本形式?

1、词形还原(Lemmatization)
2、Levenshtein
3、词干提取(Stemming)
4、探测法(Soundex)

答案:1、3

解析:词形还原和词干提取一般用于关键词归一化,Levenshtein 和探测法一般用于字符串匹配。


问题3:N-gram 被定义为 N 个关键词组合在一起。 给定下述短语 「Analytics

  • 1
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值