自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 获取当前月的第一天和最后一天,上一个月的第一天和最后一天

运用到的点,觉得写的还行,就分享一下import datetimeimport calendardef get_date(): """ 获取上月第一天和最后一天并返回 (元组) example: now date:2020-10-12 return:2020-09-01,2020-09-30 """ today = datetime.date.today() # 当前日期 last_day_last_month = datetim

2020-11-24 11:34:25 421

原创 python爬虫时爬虫爬数据时出现“访问本页面,请开启JavaScript并刷新该页”

在此之前,爬取其他网站到没有遇到过这种问题,这种类似国家网站,竟然设置了反爬虫,解决办法:使用headers里面添加cookie访问。注意:Cookie的值过一段时间会发生变化,要重新获取。

2020-09-21 21:41:37 6599 1

原创 爬虫实例分析——壁纸网

本次实例为本人独自完成首先,我选定了某壁纸网,至于为啥,还不是因为高清无码,这不香嘛?1、接口寻找此步骤是我从之前就强调过的,非常非常非常重要的!步骤。(主要还是我找到了,找不到我也就不会发出来了)...

2020-06-30 22:36:52 846

原创 关于爬虫爬取图片时,url地址中有转义字符/的处理方法。

从昨晚开始我就开始在爬取某个壁纸网站,一直到刚才才成功了。代码写的很快。但是,到了解析代码时遇到了问题。首先就是解析出源码中的url,这里我有点犯懵,好不容易得到了url,却发现了这个。。。。(经验不够,花的时间太多)这里是的问题就是url中出现了转义。当时没注意源码中的url,运行后就出现了这样的错误。当时还不知道这个问题所在,只知道url出来问题,一查,知道了,其中的转义不能被执行访问,有趣的是我用那个url在浏览器中是可以访问的。至于原因,大概就是浏览器可以解析吧。。。今天早上在查找资料和思

2020-06-20 10:41:19 1524

原创 关于数据库8.0 之后的版本改密码出现ERROR 1290 (HY000): The MySQL server is running with the --skip-grant-tables

今天操作数据库时忘记了密码,这是个很烦的事。但是在修改密码的时候出现了这个错误:ERROR 1290 (HY000): The MySQL server is running with the --skip-grant-tables option so it cannot exe这是因为我在修改密码时,进行了配置,在mysql中的my.cnf 文件中配置了跳过密码验证的步骤。但是,这个错误正是因为你跳过了密码验证所报的错,就造成了死循环!解决办法:刷新一下权限!首先执行以下命令:flush p

2020-06-19 10:33:53 1857

原创 urllib的异常

urllib的异常包括:URLError和HTTPError。1、简介HTTPError类是URLError类的子类HTTPError的异常包括:1、返回状态码404表示路径错误,页面未找到2、500表示服务器内部错误这里只能展示下404的错误了而URLError异常,我是访问了个应该不存在的网站,出现了URLError异常,按照我的理解就是,找不到该网页之类的。2、解决urllib的异常那么怎么解决异常?为了使代码更加的健壮,可以通过try-except进行捕获异常。try-ex

2020-06-18 17:55:14 310

原创 爬虫中urllib库的实例分析

上次说的是urllib库的基本使用,这次是对一些实例进行展示和一定的分析。1、ajax的get请求实例一:db电影页面的爬取首先,需要来找接口,这也是最重要的一步!从上图可以看出,我们在ajax接口中发现了页面的接口,能够看到页面的相关信息,这就是我们需要的接口。我通过自己的爬取,发现了问题,主要也是自己学习的原因,这里的参数并没有想象的那么简单。从图中可以发现,这里对页面进行滑动后,它又刷新出了新的页面。可以看到其中的start是在改变的,此时我知道了,这个页面的滑动相当于点击下一页,所以这

2020-06-17 20:51:06 208

原创 Python爬虫之urllib库的使用

首先urllib库是爬虫中用到的比较多的一个库,也算是比较基础的一个库,对于入门来说,urllib是蛮重要的。后面会介绍一下requests的使用。1、urllib的介绍按我的理解来说,要想爬取到网页中想要的东西,首先必须要爬取到网页的源码。只有爬取到了网站的源码,才能进行下一步的操作——对源码进行解析。解析完之后,才可以得到爬取到的数据。而urllib对于初学者来说,爬取一般网页的源码来说是比较容易的。为什么说是一般?因为对于初学者来说,找到网页的接口是比较难的,特别是一般大型网站的接口特别难找。下

2020-06-16 21:09:21 781 1

原创 初识Python爬虫

由于本人最近正在学习爬虫的相关知识,对于爬虫的很多了解的都不是透彻,有什么错误的地方,还请不吝指出。话不多说,进入正题。第一天,主要就是介绍什么是爬虫。1.什么是互联网爬虫?网络爬虫又称网络蜘蛛、网络蚂蚁、网络机器人 蠕虫等,可以自动化浏览网络中的信息,当然浏览信息的时候需要按照我们制定的规则进行,这些规则我们称之为网络爬虫算法。使用Python可以很方便地编写出爬虫程序,进行互联网信息的自动化检索。搜索引擎离不开爬虫,比如百度搜索引擎的爬虫叫作百度蜘蛛(Baiduspider)。百度蜘蛛每天会在海量

2020-06-13 19:55:46 158

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除