2021山东大学软件学院web数据管理期末考试回忆版

2021山东大学软件学院web数据管理期末考试回忆
一、填空题(顺序记不住了,部分题)
1.DFS比BFS是()
2.礼貌性是()
3.网页基于承载内容的分类()和()
4.颜色矩是计算颜色通道的()、()和()
5.词项词表的处理步骤 文档解析、()、()和()去除停用词表(个人感觉少了一空 但试卷上确实是3空)去除停用词的方法有()和()
6.统计语言模型是(),应用是()
7.LBP的全称是(),它是()特征描述子,记录像素点和()
8.中文分词的方法有 基于NLP的,基于()的和基于()的
二、名词解释
1.正则表达式
2.web数据抽取
3.倒排索引
4.TF/IDF
5.BOF
三、问答题
1.反爬虫的策略和爬虫怎么应对
2.网页排序算法有哪些,简述思想
3.HMM模型是什么,基于HMM模型的中文分词思想
4.什么是PLSA,LSA和PLSA的异同

复习的话主要就是结合老师给的范围好好看PPT,基本都是需要背诵记忆的,考前别吃麻辣烫,会拉肚子,很惨,溜了~

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值