目录
"re.sub('自然语言处理',"NLP",text l)"表示的含义为( )。正确答案: C :将test1中的"自然语言处理"替换为"NLP";
( )函数用于获取语料库中的文件。正确答案: D :fileids;
BOW模型其中的一个缺点是( )。正确答案: D :矩阵稀疏;
DM模型与CBOW模型的区别为( )。正确答案: C :DM模型输入不仅包括上下文,而且还包括相应的段落;
jieba词性标注的流程不包括( )。正确答案: D :创建规则库;
NLTK的安装步骤为( )。答案: D :安装NLP虚拟环境→安装NLTK→检查是否存在NLTK→下载NLTK数据包;
TF-lDF算法的主要思想是( )。正确答案: A :字词的重要性随着它在文档中出现次数的增加而上升,随着它在语料库中出现频率的升高而下降;
B
不是聊天机器人模型优化方法的是( )。正确答案: B :自适应梯度法;
不属于jieba分词步骤的是( )。正确答案: B :统计每个出现在词头的位置状态的次数,得到初始概率;统计每种位置状态转移至另一种状态的次数,得到转移概率。;
不属于NLP应用场景的是( )。正确答案: A :数据挖掘;
不属于常用的正则表达式函数的是( )。正确答案: B :matplotlib函数;
不属于常用的正则表达式函数的是( )。正确答案: B :matplotlib函数;
不属于打开Jupyter Notebook 方式的是( )。正确答案: B :单击桌面上的Jupyter Notebook 图标;
不属于分布式表示模型的是( )。正确答案: D :分类模型;
不属于关键词提取算法的是( )。正确答案: B :关联算法;
不属于基于规则的分词方法的是( )。正确答案: C :反向最大匹配法;
不属于情感分析应用的是( )。正确答案: B :远程通信;
不属于未登录词的是( )。正确答案: A :网络热门词语;
不属于未登录词的是( )。