一个python爬虫的实例

最新推荐文章于 2022-04-28 18:08:01 发布

Alasding

最新推荐文章于 2022-04-28 18:08:01 发布

阅读量109

点赞数

分类专栏：练习 python 爬虫文章标签： python

本文链接：https://blog.csdn.net/Alasding/article/details/117266989

版权

练习同时被 3 个专栏收录

20 篇文章 0 订阅

订阅专栏

python

16 篇文章 0 订阅

订阅专栏

爬虫

1 篇文章 0 订阅

订阅专栏

import urllib
import re,xlwt
from bs4 import BeautifulSoup
import demjson
 
#爬虫函数
def gydzf():
    workbook=xlwt.Workbook()
    num=0
    worksheet=workbook.add_sheet("爬虫数据")
    for k in range(1,135):
        url="http://stockdata.stock.hexun.com/zrbg/data/zrbList.aspx?date=2011-12-31&count=20&pname=20&titType=null&page="+str(k)+"&callback=hxbase_json11621778963605"
        user_agent="Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.103 Safari/537.36"
        headers={"User-Agent":user_agent}
        request=urllib.request.Request(url,headers=headers)
        response=urllib.request.urlopen(request)
        contents = response.read()
        soup = BeautifulSoup(contents, "html.parser")
        t = str(soup)[13:-1] 
        data = demjson.decode(t)
        ll=[]
        ll=data["list"]
        for i in ll:
            xuhao=int(i["Number"])
            gupiao=i["industry"]
            defen=float(i['industryrate'])
            dengji=i['Pricelimit']
            gudong=float(i['stockNumber'])
            yuangong=float(i['lootingchips'])
            gongying=float(i['Scramble'])
            huanjing=float(i['rscramble'])
            shehui=float(i['Strongstock'])
            valuelist=[]
            valuelist=[xuhao,gupiao,defen,dengji,gudong,yuangong,gongying,huanjing,shehui]
            for j in range(len(valuelist)):
                worksheet.write(num,j,valuelist[j])
            num+=1
            print(num)
    workbook.save("getValue.xls")

 
#主函数
if __name__ == '__main__':
    gydzf()

Alasding

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
一个python爬虫的实例

import urllibimport re,xlwtfrom bs4 import BeautifulSoupimport demjson #爬虫函数def gydzf(): workbook=xlwt.Workbook() num=0 worksheet=workbook.add_sheet("爬虫数据") for k in range(1,135): url="http://stockdata.stock.hexun.com/zrbg/dat
复制链接

扫一扫

专栏目录