python抓取百度搜索结果

最新推荐文章于 2023-02-11 21:26:41 发布

A8572785

最新推荐文章于 2023-02-11 21:26:41 发布

阅读量1w

点赞数

分类专栏： python 学习

本文链接：https://blog.csdn.net/A8572785/article/details/10016377

版权

# -*- coding: utf-8 -*-
#!/usr/bin/env python
#抓取百度搜索结果
import sys
import re 
import urllib2

from BeautifulSoup import BeautifulSoup

def search(key):
        search_url='http://www.baidu.com/s?wd=key&rsv_bp=0&rsv_spt=3&rsv_n=2&inputT=6391' 
        req=urllib2.urlopen(search_url.replace('key',key)) 
        result=[]  
        #循环抓取10页结果进行解析
        for count in range(10):
                html=req.read()
                soup=BeautifulSoup(html)
    
                file = open("result.txt",'a')
                
                content  = soup.findAll('table',id=re.compile("\d"))
                num = len(content)
                
                for i in range(num):
                    #先解析出来内容
                    p_str  = content[i].find('a')
                    #提取关键字
                    if p_str.em:

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

A8572785

关注关注

0
点赞
踩
8

收藏

觉得还不错? 一键收藏
2
评论
python抓取百度搜索结果

# -*- coding: utf-8 -*-#!/usr/bin/env python#抓取百度搜索结果import sysimport re import urllib2from BeautifulSoup import BeautifulSoupdef search(key): search_url='http://www.baidu.com/s?wd=ke
复制链接

扫一扫