爬虫
爬虫记录
不要踩井盖儿
这个作者很懒,什么都没留下…
展开
-
爬虫(二):Lucene
搜索引擎: * 什么是搜索引擎 * 搜索引擎基本运行原理 * 原始数据库做搜索有什么弊端 * 倒排索引(敲黑板) lucene lucene相关的概念 lucene和solr的关系 lucene入门程序(写入索引的操作代码) lucene相关写入索引的api的解释 ik分词器 lucene的搜索: 基础的搜索(2个), 多样化的搜索(5个) lucene的高级(理解) lucene的高亮...翻译 2018-10-31 17:46:45 · 819 阅读 · 0 评论 -
爬虫(三):Solr
lucene的索引的修改和删除 solr: 1) solr的概念 2) solr的部署(2种方式) 3) solr的管理界面 4) solr的配置文件: solrConfig.xml schema.xml core.properties 5) solrj 连接solr 相关的操作: C U R D 6) solr的高级: 高亮 分页 排序 1. lucene的索引的修改和删除 索...翻译 2018-10-31 17:49:34 · 614 阅读 · 0 评论 -
爬虫(一):基本内容回顾
本人最近在学习爬虫的相关知识,对于很多基本的概念在此做一个梳理,便于课程的复习和巩固,如有写的不准确或错误的地方,欢迎阅读者批评指正. 要聊爬虫主要是从以下几个方面为主线: 什么是爬虫? 爬虫的价值 爬虫的分类 爬虫的基本运行原理 爬虫的三大模块 爬虫协议 1.什么是爬虫? 想到爬虫,很多人的第一印象就是现实世界中到处爬着找食物的虫子,其实在计算机的世界里亦是如此:所谓的爬虫就是程序员...原创 2018-08-26 14:56:48 · 641 阅读 · 0 评论