互联网搜索与挖掘原理

      互联网搜索原理:

      网页采集技术;

      文本查重技术;

      内容抽取技术;

      信息预处理技术;

      中文分词、实体识别技术;

      布尔查询处理技术;

      倒排索引构建于压缩技术;

      搜索结果的评价;

      Top K检索技术;

      基于向量空间的文档排名技术;

      基于概率模型的文档排名技术;

      基于语言模型的文档排名技术;

      基于连接分析的文档排名技术;

      基于机器学习的文档排名技术;

      搜索结果的摘要技术;

      互联网挖掘原理:

      文本分类技术;

      特征选择技术;

      KNN分类器;

      朴素贝叶斯分类器;

      决策树分类器;

      支持向量机分类器;

      文本聚类技术;

      K-均值聚类;

      凝聚式层次聚类;

  

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值