Python
南丘xf
好记性不如烂笔头——1枚昆明程序猿
展开
-
利用Python爬取包图网图片和视频
目标:抓取包图网全站视频数据保存在本地,并以网站视频名命名视频文件。网址:https://ibaotu.com/shipin/7-0-0-0-0-1.html爬取第一步--检查 robots.txt一般而言,大部分网站都会定义robots.txt 文件,该文件就是给 网络爬虫 了解爬取限制(一般建议遵守robots.txt 文件里面的限制)如何查看这个 robots.txt 文件?==...原创 2018-08-22 14:22:58 · 1084 阅读 · 3 评论 -
pycharm导包from PIL import Image失败问题
在用爬虫的时候,用到了from PIL import Image模块,可是setting里面直接安装PIL总是不成功,cmd命令安装PIL,即:pip install PIL提示无法找到对应的版本,查找资料才知道,直接在setting里面安装pillow即可。搜索pillow,点击pillow,左下角会有install,安装成功即可。...原创 2019-12-12 15:21:18 · 4553 阅读 · 0 评论 -
Python操作简单Excle表
先建一张表,以便操作:利用两个模块进行操作,命令为:pip install xlrdpip install xlwt导包以后,需把文件放在同级目录:开始上代码:import xlrdfile_path='1.xlsx'xlrd.book.ensure_unicode='utf-8' #设置编码data=xlrd.open_workbook(file_p...原创 2018-08-23 11:38:00 · 92 阅读 · 0 评论 -
Python如何爬取豆瓣电影信息,并存储数据库?
由于要存储数据库的关系,所以需在本地先建立一个名为“pachong”的数据库:建立以后,终端执行命令:pip install pymysql豆瓣网网址:https://movie.douban.com/top250?start=0&filter=分析网址'?'符号后的参数,第一个参数'start=0',这个代表页数,‘=0’时代表第一页,‘=25’代表第二页。。。直接上代码:...原创 2018-08-27 15:58:00 · 2243 阅读 · 0 评论