自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

liuxinlin的博客

亩自的学习生活

  • 博客(4)
  • 收藏
  • 关注

原创 【python笔记】腾讯动漫爬取(更新)

 具体参照我之前写的一个笔记:https://blog.csdn.net/qq_40937976/article/details/79856622 目前腾讯动漫阅读界面的滑动需要切换到指定窗口,即漫画照片页所在div 'var q=document.getElementById("mainView").scrollTop ='+str(i*3000) 才可以滑动 import requ...

2018-11-08 18:34:12 1700 1

原创 【Python】大学生三下乡百强团队投票排行榜制作

 网址: http://iqingyun.cyol.com/mobile/practice/tasklist.html 爬取的时候队伍数仍在增多,网页数也会随着队伍数目增多有所变化,其中有部分队伍信息的html结构与其它队伍不同,需要利用xpth对其进行提取。 注意做好异常处理,因为有四百多个页面。 import urllib.request import re from lxml i...

2018-11-06 17:29:37 2155

原创 大学信息简单爬取:借助http://www.chaxiao.com/

       一起是197个网页,网址的规律很明显,主要是对部分信息的提取上,只用正则或只用xpth都无法全部提取到,最后需要对提取到的字符串进行处理,因为有很多空格包含在里面。 re.sub('\s',''," ".join(alluniurl[i])) import urllib.request import re from lxml import etree import xlsxw...

2018-11-06 17:01:37 2298

原创 易班网页版简易刷题:湖南商学院教学评估考试

代码没有进行优化 import time import xlrd from selenium import webdriver def read_excel(row,col): # 打开文件 workbook = xlrd.open_workbook(r'E:\python云沉\湖南教学评估题库.xlsx') # 获取所有sheet #获取sheet1 ...

2018-11-04 08:52:18 7008 11

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除