AggregateSearch设计文档

最新推荐文章于 2024-08-29 15:01:25 发布

hgcan163

最新推荐文章于 2024-08-29 15:01:25 发布

阅读量110

点赞数

分类专栏： Vue前端框架 Spring框架系列文章标签：服务器运维

本文链接：https://blog.csdn.net/hgc2020/article/details/134381405

版权

Vue前端框架同时被 2 个专栏收录

1 篇文章 0 订阅

订阅专栏

Spring框架系列

1 篇文章 0 订阅

订阅专栏

前言

不知道你们有没有这样一个习惯，当需要下载某个资源时，在互联网上查找一段时间后，你找到了一个可以下载到你需要的资源的网站，你在这个网站下载了所需要的资源，它帮了你大忙，这时候就会想将这个帮了自己大忙的网站收藏到浏览器，但随着浏览器中收藏的资源网站越来越多，当自己后面需要寻找另一个资源时，不得不在每个资源网站间来回切换搜索，这时候就非常麻烦，这时候我在想是不是可以开发一个通用的能够聚合搜索所有浏览器中的资源网站的系统，实现一次搜索来检索多个网站。

列举出所有功能——》列举对象和响应的属性——》实现对应的功能——》不断完善和更新网站功能

import org.springframework.boot.SpringApplication;
import org.springframework.boot.autoconfigure.SpringBootApplication;
@SpringBootApplication
public class ServerStart {
	public static void main(String[] args) {
		SpringApplication.run(ServerStart.class);
		System.out.println("启动成功！！！");
	}
}

该类没什么好讲的，主要是spring boot的启动类。

公共模块

在这里插入图片描述

ResponseResult类，该类主要是用于返回统一的json数据，具体代码如下。

public class ResponseResult<T>{
	/**
	 * 状态码
	 */
	private Integer code;
	/**
	 * 提示信息，如果有错误时，前端可以获取该字段进行提示
	 */
	private String msg;
	/**
	 * 查询到的结果数据，
	 */
	private T data;

	public ResponseResult(Integer code, String msg) {
		this.code = code;
		this.msg = msg;
	}

	public ResponseResult(Integer code, T data) {
		this.code = code;
		this.data = data;
	}

	public Integer getCode() {
		return code;
	}

	public void setCode(Integer code) {
		this.code = code;
	}

	public String getMsg() {
		return msg;
	}

	public void setMsg(String msg) {
		this.msg = msg;
	}

	public T getData() {
		return data;
	}

	public void setData(T data) {
		this.data = data;
	}

	public ResponseResult(Integer code, String msg, T data) {
		this.code = code;
		this.msg = msg;
		this.data = data;
	}
}

FileUtil类，该类是一个用于读取resource目录下的文件，具体代码如下。

import org.springframework.data.repository.init.ResourceReader;

import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStream;
import java.io.InputStreamReader;

public class FileUtil {
	/**
	 * 读取resource下的json规则文件
	 * @return
	 */
	public static String getFileData() {
		String fileData=null;
		InputStream inputStream = ResourceReader.class.getResourceAsStream("/urlRule.json");
		if (inputStream != null) {
			try (BufferedReader reader = new BufferedReader(new InputStreamReader(inputStream))) {
				String line;
				StringBuffer stringBuffer=new StringBuffer();
				while ((line = reader.readLine()) != null) {
					stringBuffer.append(line);
				}
				fileData=stringBuffer.toString();
				reader.close();
				inputStream.close();
			} catch (IOException e) {
				e.printStackTrace();
			}
		}else {
			System.out.println("resource目录中的json文件读取失败！！！！");
		}
		return fileData;
	}
}

搜索模块

该模块用于解析网站的规则，并将结果返回到前端。

在这里插入图片描述

SoftwareSearchImpl类，该类是这个模块的核心，主要用于解析网站，返回处理后的结果，后续该类可能会做性能优化，采用多线程方式来实现，目前的解析实现如下。

import com.gc.config.HttpclientPool;
import com.gc.config.InitData;
import com.gc.domain.SearchResult;
import com.gc.domain.UrlRule;
import com.gc.service.SoftwareSearch;
import com.gc.service.UrlRuleParse;
import org.apache.http.client.methods.CloseableHttpResponse;
import org.apache.http.client.methods.HttpGet;
import org.apache.http.impl.client.CloseableHttpClient;
import org.apache.http.util.EntityUtils;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.select.Elements;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.stereotype.Service;

import javax.annotation.PostConstruct;
import java.io.IOException;
import java.util.ArrayList;
import java.util.List;

@Service
public class SoftwareSearchImpl implements SoftwareSearch {
	private static List<UrlRule>  urlRuleList=null;


	@Autowired
	HttpclientPool httpclientPool;
	@Autowired
	UrlRuleParse urlRuleParse;

	@Override
	public List<SearchResult> searchParse(String s, Integer p){
		List<UrlRule> urlRuleList = InitData.urlRuleList;
		List<UrlRule> requestUrlList = urlRuleParse.urlRuleParse(urlRuleList, s, p);
		String html=null;
		List<SearchResult> ResultList=new ArrayList<>();
		int id=0;
		CloseableHttpClient httpclient=null;
		CloseableHttpResponse response1=null;
		for (UrlRule urlRule: requestUrlList){
			//httpclient = HttpClients.createDefault();
			httpclient=httpclientPool.getHttpClient();
			HttpGet httpGet = new HttpGet(urlRule.getFinalUrl());
			httpGet.addHeader("User-Agent","Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/116.0.0.0 Safari/537.36 Edg/116.0.1938.62");
			if (!"".equals(urlRule.getCookie())){
				httpGet.addHeader("Cookie",urlRule.getCookie());
			}
			try {
				response1 = httpclient.execute(httpGet);
				html = EntityUtils.toString(response1.getEntity(), "UTF-8");
				Document doc = Jsoup.parse(html);
				Elements pictureElements = doc.select(urlRule.getPicturePosition());
				Elements titleElements = doc.select(urlRule.getTitlePosition());
				Elements urlElements = doc.select(urlRule.getUrlPosition());
				Elements synopsisElements=doc.select(urlRule.getSynopsisPosition());
				for (int i = 0;i<pictureElements.size();i++){
					SearchResult searchResult = new SearchResult();
					String pictureSrc=null;
					if ("".equals(urlRule.getPicturePositionAttr())){
						pictureSrc = pictureElements.get(i).text();
					}else {
						pictureSrc = pictureElements.get(i).attr(urlRule.getPicturePositionAttr());
					}
					String url=null;
					if ("".equals(urlRule.getUrlPositionAttr())){
						url = urlElements.get(i).text();
					}else {
						url = urlElements.get(i).attr(urlRule.getUrlPositionAttr());
					}
					String title=null;
					if ("".equals(urlRule.getTitlePositionAttr())){
						title = titleElements.get(i).text();
					}else {
						title = titleElements.get(i).attr(urlRule.getTitlePositionAttr());
					}
					String synopsis=null;
					if ("".equals(urlRule.getSynopsisPositionAttr())){
						synopsis = synopsisElements.get(i).text();
					}else {
						synopsis = synopsisElements.get(i).attr(urlRule.getTitlePositionAttr());
					}
					searchResult.setId((id++)+"");
					searchResult.setSiteName(urlRule.getSiteName());
					searchResult.setFormUrl(urlRule.getUrlBase());
					//根据url是否是绝对路径来组合判断
					if (urlRule.getUrlAbs()){
						searchResult.setUrl(url);
						searchResult.setPictureUrl(pictureSrc);
					}else {
						String substring =
								urlRule.getUrlBase().substring(0, urlRule.getUrlBase().length() - 1);
						searchResult.setUrl(substring+url);
						searchResult.setPictureUrl(substring+pictureSrc);
					}
					searchResult.setTitle(title.trim());
					searchResult.setSynopsis(synopsis.replaceAll((char)12288+"",""));
					ResultList.add(searchResult);
				}
			} catch (IOException e) {
				e.printStackTrace();
			}finally {
				if (response1!=null){
					try {
						//httpclient.close();
						response1.close();
						httpGet.releaseConnection();
					} catch (IOException e) {
						e.printStackTrace();
					}
				}
			}
		}
		return ResultList;
	}
}