python 爬虫下载图片 以及对excel的处理

先来说一下 python的下载图片吧  

比如我们向看看美女的 图片  然后我们输入 美女 然后点击一个图片  发现 

然后我们想把这个图片下载起来  其实很简单 


import requests
import urllib

url='https://ss0.bdstatic.com/94oJfD_bAAcT8t7mm9GUKT-xh_/timg?image&quality=100&size=b4000_4000&sec=1552008621&di=f162eb87f15203a8113158adc471962d&src=http://h.hiphotos.baidu.com/image/pic/item/d1160924ab18972b83474beeedcd7b899e510a90.jpg'


response=urllib.request.urlopen(url)
with open('meimei.jpg','wb') as fp:
    fp.write(response.read())

这样就能保存下来我们的图片了  

然后如果我们想爬取我们输入的内容的话  就可以了 


import requests
import urllib

word=input('请输入您想要输入的内容:')
url='http://www.baidu.com/s?'

data={
    'ie':'utf-8',
    'wd':word,

}


query=urllib.parse.urlencode(data)
url+=query

filename=word+'.html'
response=urllib.request.urlopen(url)

with open(filename,'wb')as fp:
    fp.write(response.read())

其中  parse 就是链接字典的意思   也可以对字符串操作链接  效果是一样的

然后我们的网页就被保存了下来  结果如下

然后就ok了

然后就是对 excel的处理

这个是一个朋友拜托的我的

需求就是

表格存在多个 ip  ip那一列一行只要一个   其它的元素 直接粘贴  

然后把空的行删除  前面的序号 重新排

处理代码如下


#!/usr/bin/env python3
# encoding=utf-8
import base64
import hashlib
import os
from Crypto.Cipher import DES3
import pyDes
import sys

import openpyxl


if __name__ == '__main__':
    f = openpyxl.Workbook()
    sheet1 = f.create_sheet()

    workbook=openpyxl.load_workbook("adv.xlsx")
    shnames=workbook.sheetnames
    worksheet=workbook[str(shnames[0])]
    titlename=worksheet.title
    #print(titlename)
    rows=worksheet.max_row
    columns=worksheet.max_column
    print(rows,columns)
    sum=0
    writes=[]
    for row in worksheet.rows:
        #if sum==10:
            #break
        l=[]
        for cell in row:
            l.append(cell.value)
        #print(l[7])
        ls=str(l[7]).split(" ")
        #print(ls)
        for i in ls:
            l[7]=i
            #print(l)
            if not l[0] is None:
                if sum!=0:
                    l[0]=sum
                    sum=sum+1
                if sum==0:
                    sum+=1
                for ss in range(8):
                    sheet1.cell(row = sum, column = ss+1).value=l[ss]

                #print(l)

                #writes.append(l)




    print(sheet1.max_row,sheet1.max_column)
    f.save("pipixia.xlsx")



 

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值