python 爬虫下载图片以及对excel的处理

最新推荐文章于 2024-04-12 15:15:37 发布

pipixia233333

最新推荐文章于 2024-04-12 15:15:37 发布

阅读量1.6k

点赞数

分类专栏： web python开发

本文链接：https://blog.csdn.net/qq_41071646/article/details/88336114

版权

web python开发专栏收录该内容

15 篇文章 0 订阅

订阅专栏

先来说一下 python的下载图片吧

比如我们向看看美女的图片然后我们输入美女然后点击一个图片发现

然后我们想把这个图片下载起来其实很简单


import requests
import urllib

url='https://ss0.bdstatic.com/94oJfD_bAAcT8t7mm9GUKT-xh_/timg?image&quality=100&size=b4000_4000&sec=1552008621&di=f162eb87f15203a8113158adc471962d&src=http://h.hiphotos.baidu.com/image/pic/item/d1160924ab18972b83474beeedcd7b899e510a90.jpg'


response=urllib.request.urlopen(url)
with open('meimei.jpg','wb') as fp:
    fp.write(response.read())

这样就能保存下来我们的图片了

然后如果我们想爬取我们输入的内容的话就可以了


import requests
import urllib

word=input('请输入您想要输入的内容:')
url='http://www.baidu.com/s?'

data={
    'ie':'utf-8',
    'wd':word,

}


query=urllib.parse.urlencode(data)
url+=query

filename=word+'.html'
response=urllib.request.urlopen(url)

with open(filename,'wb')as fp:
    fp.write(response.read())

其中 parse 就是链接字典的意思也可以对字符串操作链接效果是一样的

然后我们的网页就被保存了下来结果如下

然后就ok了

然后就是对 excel的处理

这个是一个朋友拜托的我的

需求就是

表格存在多个 ip ip那一列一行只要一个其它的元素直接粘贴

然后把空的行删除前面的序号重新排

处理代码如下


#!/usr/bin/env python3
# encoding=utf-8
import base64
import hashlib
import os
from Crypto.Cipher import DES3
import pyDes
import sys

import openpyxl


if __name__ == '__main__':
    f = openpyxl.Workbook()
    sheet1 = f.create_sheet()

    workbook=openpyxl.load_workbook("adv.xlsx")
    shnames=workbook.sheetnames
    worksheet=workbook[str(shnames[0])]
    titlename=worksheet.title
    #print(titlename)
    rows=worksheet.max_row
    columns=worksheet.max_column
    print(rows,columns)
    sum=0
    writes=[]
    for row in worksheet.rows:
        #if sum==10:
            #break
        l=[]
        for cell in row:
            l.append(cell.value)
        #print(l[7])
        ls=str(l[7]).split(" ")
        #print(ls)
        for i in ls:
            l[7]=i
            #print(l)
            if not l[0] is None:
                if sum!=0:
                    l[0]=sum
                    sum=sum+1
                if sum==0:
                    sum+=1
                for ss in range(8):
                    sheet1.cell(row = sum, column = ss+1).value=l[ss]

                #print(l)

                #writes.append(l)




    print(sheet1.max_row,sheet1.max_column)
    f.save("pipixia.xlsx")