抓取百度关键词排名、标题、连接、描述
转载请标明出处
最近在做百度关键词排名的功能,发现网上资源比较这里写代码片少,于是自己琢磨了一下,写一下笔记;
本文重点在于提供思路,请不要过分依赖,本文主要靠抓取页面标签来完成,如果百度官网将页面标签修改了,请自行修改,如果遇到问题或需要修改的地方请私信我。
鸣谢:本公司SEO提供思路
package cc.test.core;
import org.htmlparser.NodeFilter;
import org.htmlparser.Parser;
import org.htmlparser.Tag;
import org.htmlparser.filters.AndFilter;
import org.htmlparser.filters.HasAttributeFilter;
import org.htmlparser.filters.HasParentFilter;
import org.htmlparser.filters.NodeClassFilter;
import org.htmlparser.filters.OrFilter;
import org.htmlparser.filters.TagNameFilter;
import org.htmlparser.tags.Div;
import org.htmlparser.tags.LinkTag;
import org.htmlparser.tags.TitleTag;
import org.htmlparser.util.NodeList;
public class KeywordRun {
/**
*
* @Description: 获取排名数
* @param @param keyword-关键词
* @param @param url-域名
* @param @return
* @return int
*/
public int getKeywordRank(String keyword, String url) {
int re = 0;
// for (int i = 0; i < 100; i += 10) {
// if (i == 0) {
re = getThisRank("http://www.baidu.com/s?wd=" + keyword, url);
//
// if (re > 0)
// break;
// } else {
// re = getThisRank("http://www.baidu.com/s?wd=" + keyword + "&pn=" + i,