喜欢的明星图片下载

1.目前仅仅实现对百度图片下载(喜欢的大明星)

环境:

python2.7

2.代码分析

a.创建关键字以空格 分开

b.创建文件夹保存下载的图片

c.发送request请求去url地址

d.下载数据

e.删除某些不能打开的图片

3.代码如下:

#-*- coding:utf-8 -*-
import re
import requests
from PIL import Image
import os
#存放所有已经下载的url连接
all_url = []
#下载图片
def dowmloadPic(html,keyword,filepath):
    pic_url = re.findall('"objURL":"(.*?)",', html, re.S)
    i = 0
    print '找到关键词:'+keyword+'的图片,现在开始下载图片...'
    for each in pic_url:
        if (i == 50):
            break
        if getrepeat(each,all_url) == 1:
          continue
        else:
          all_url.append(each)
        print '正在下载第'+str(i+1)+'张图片,图片地址:'+str(each)
        try:
            pic= requests.get(each, timeout=30)
        except Exception:
            print '【错误】当前图片无法下载'
            continue
        string = filepath.decode('cp936').encode('utf-8')+'//'+keyword+'_%s.jpg' % str(i)
        print string
        #resolve the problem of encode, make sure that chinese name could be store ===string.decode('utf-8').encode('cp936')
        fp = open(string.decode('utf-8').encode('cp936'),'wb')
        fp.write(pic.content)
        fp.close()
        i += 1
#url图片地址,urls已经下载的所有图片数组对象
#是否重复的图片
#返回0,是
#返回1,不是
def getrepeat(url,urls):
    for one in urls:
        if one == url:
            print("重复图片")
            return 1
        else:
            return 0
#创建目录
def mkdir(path):
    # 去除首位空格
    path = path.strip()
    # 去除尾部 \ 符号
    path = path.rstrip("\\")

    # 判断路径是否存在
    # 存在     True
    # 不存在   False
    isExists = os.path.exists(path)

    # 判断结果
    if not isExists:
        # 如果不存在则创建目录
        # 创建目录操作函数
        os.makedirs(path)

        print path + ' 创建成功'
        return True
    else:
        # 如果目录存在则不创建,并提示目录已存在
        print path + ' 目录已存在'
        return False
#删除不能打开的图片
def delcantopen(dir):
    for root, dirs, files in os.walk(dir):
        for file in files:
            try:
                im = Image.open(dir + file)
            except:
                os.remove(dir + file)
                print '此图片不能打开,已删除'
# 创建文件夹
def createfile(path):
    # 去除首位空格
    path = path.strip()
    # 去除尾部 \ 符号
    path = path.rstrip("\\")
    # 判断路径是否存在
    # 存在     True
    # 不存在   False
    isExists = os.path.exists(path)
    # 判断结果
    if not isExists:
        # 如果不存在则创建目录
        # 创建目录操作函数
        os.makedirs(path)
        print path + ' 创建成功'
        return True
    else:
        # 如果目录存在则不创建,并提示目录已存在
        print path + ' 目录已存在'
        return False
if __name__ == '__main__':
    # word = raw_input("Input key word: ")
    string = "唐嫣 朱茵”
 
words = string.split(' ')
print len(words)
filepath = ''
for word in words:
    filepath = 'E://star_pic//'+word.decode('utf-8').encode('cp936')
    # print 'file==',filepath
    createfile(filepath)
    url = 'http://image.baidu.com/search/flip?tn=baiduimage&ie=utf-8&word='+word+'的生活'+'&ct=201326592&v=flip'
    # url = 'https://user.qzone.qq.com/2592235804/infocenter'http://image.baidu.com/search/flip?tn=baiduimage&ie=utf-8&word=李克强&ct=201326592&v=flip
    result = requests.get(url)
    dowmloadPic(result.text,word,filepath)
    # number+=1
delcantopen(filepath.decode('cp936').encode('utf-8'))



智慧旅游解决方案利用云计算、物联网和移动互联网技术,通过便携终端设备,实现对旅游资源、经济、活动和旅游者信息的智能感知和发布。这种技术的应用旨在提升游客在旅游各个环节的体验,使他们能够轻松获取信息、规划行程、预订票务和安排食宿。智慧旅游平台为旅游管理部门、企业和游客提供服务,包括政策发布、行政管理、景区安全、游客流量统计分析、投诉反馈等。此外,平台还提供广告促销、库存信息、景点介绍、电子门票、社交互动等功能。 智慧旅游的建设规划得到了国家政策的支持,如《国家中长期科技发展规划纲要》和国务院的《关于加快发展旅游业的意见》,这些政策强调了旅游信息服务平台的建设和信息化服务的重要性。随着技术的成熟和政策环境的优化,智慧旅游的时机已经到来。 智慧旅游平台采用SaaS、PaaS和IaaS等云服务模式,提供简化的软件开发、测试和部署环境,实现资源的按需配置和快速部署。这些服务模式支持旅游企业、消费者和管理部门开发高性能、高可扩展的应用服务。平台还整合了旅游信息资源,提供了丰富的旅游产品创意平台和统一的旅游综合信息库。 智慧旅游融合应用面向游客和景区景点主管机构,提供无线城市门户、智能导游、智能门票及优惠券、景区综合安防、车辆及停车场管理等服务。这些应用通过物联网和云计算技术,实现了旅游服务的智能化、个性化和协同化,提高了旅游服务的自由度和信息共享的动态性。 智慧旅游的发展标志着旅游信息化建设的智能化和应用多样化趋势,多种技术和应用交叉渗透至旅游行业的各个方面,预示着全面的智慧旅游时代已经到来。智慧旅游不仅提升了游客的旅游体验,也为旅游管理和服务提供了高效的技术支持。
智慧旅游解决方案利用云计算、物联网和移动互联网技术,通过便携终端设备,实现对旅游资源、经济、活动和旅游者信息的智能感知和发布。这种技术的应用旨在提升游客在旅游各个环节的体验,使他们能够轻松获取信息、规划行程、预订票务和安排食宿。智慧旅游平台为旅游管理部门、企业和游客提供服务,包括政策发布、行政管理、景区安全、游客流量统计分析、投诉反馈等。此外,平台还提供广告促销、库存信息、景点介绍、电子门票、社交互动等功能。 智慧旅游的建设规划得到了国家政策的支持,如《国家中长期科技发展规划纲要》和国务院的《关于加快发展旅游业的意见》,这些政策强调了旅游信息服务平台的建设和信息化服务的重要性。随着技术的成熟和政策环境的优化,智慧旅游的时机已经到来。 智慧旅游平台采用SaaS、PaaS和IaaS等云服务模式,提供简化的软件开发、测试和部署环境,实现资源的按需配置和快速部署。这些服务模式支持旅游企业、消费者和管理部门开发高性能、高可扩展的应用服务。平台还整合了旅游信息资源,提供了丰富的旅游产品创意平台和统一的旅游综合信息库。 智慧旅游融合应用面向游客和景区景点主管机构,提供无线城市门户、智能导游、智能门票及优惠券、景区综合安防、车辆及停车场管理等服务。这些应用通过物联网和云计算技术,实现了旅游服务的智能化、个性化和协同化,提高了旅游服务的自由度和信息共享的动态性。 智慧旅游的发展标志着旅游信息化建设的智能化和应用多样化趋势,多种技术和应用交叉渗透至旅游行业的各个方面,预示着全面的智慧旅游时代已经到来。智慧旅游不仅提升了游客的旅游体验,也为旅游管理和服务提供了高效的技术支持。
Selenium是一个流行的自动化测试工具,但它也可以用于网页爬虫,包括抓取明星图片。它通过模拟用户在浏览器中的操作,如点击、滚动和填写表单,来访问网站并获取内容。以下是使用Selenium抓取明星图片的一般步骤: 1. **安装Selenium**:首先,你需要安装Python的Selenium库及其对应的WebDriver(浏览器驱动),比如ChromeDriver或FirefoxDriver。 ```shell pip install selenium ``` 2. **设置浏览器驱动**:下载对应浏览器的WebDriver,并将其添加到系统的PATH中或指定为Selenium运行时的路径。 3. **初始化浏览器**:通过`webdriver.Chrome()`(或其他浏览器)实例化一个浏览器对象。 ```python from selenium import webdriver driver = webdriver.Chrome() ``` 4. **导航到目标页面**:使用`get()`方法导航到明星图片所在的网页URL。 ```python driver.get("http://example.com/star-pictures") ``` 5. **定位图片元素**:使用Selenium提供的选择器(如XPath, CSS选择器或By.id)找到明星图片的HTML元素。 ```python image_elements = driver.find_elements_by_css_selector('img.star-image') ``` 6. **抓取图片**:获取到图片元素后,通常通过`get_attribute('src')`获取图片的URL,然后下载或保存图片。 ```python for element in image_elements: image_url = element.get_attribute('src') # 下载图片,这里省略下载代码 download_image(image_url) ``` 7. **结束会话**:完成任务后,记得关闭浏览器会话。 ```python driver.quit() ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值