自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 Anconda+Pycharm+Centos云部署

Anconda+Pycharm+Centos云部署

2024-05-27 13:48:36 483 1

原创 Python推导式

方法遍历生成器对象,遍历后原生成器对象将不复存在,这就是遍历后转换原生成器对象却得到空元组的原因。可以这样认为,它只是对 for 循环语句的格式做了一下简单的变形,并用。可以看到,和其它推导式的语法格式相比,唯一不同在于,字典推导式用的是。不仅如此,元组推导式和列表推导式的用法也完全相同。对于包含多个循环的 for 表达式,同样可指定 if 条件。语句,这样列表推导式将只迭代那些符合条件的元素。既然生成的是集合,那么其保存的元素必须是唯一的。括起来而已,只不过最大的不同之处在于,遍历生成器对象,还是使用。

2023-11-01 17:13:29 43

原创 Python调用Js脚本方法

可以发现前端使用了加密函数,如果能找到Pthon实现的这个加密函数,可以直接调用相关的API,或者有能力的自己实现这个加密函数。当我们进行网络爬虫的时候,遇到前端加密函数,而自己不想花费太多时间或者没法重写这个函数时,我们可以直接使用Python执行Js函数来解决这个问题。直接运行,发现报错!成功解决,以后遇到相似的问题,只需要将对应的Js代码复制过来,然后修改相应的参数就行!两种方法,在当前环境下载这个库,或者全局下载,然后再compile里面指定路径。全局下载,然后使用cmd参数指定文件的路径就行。

2023-11-01 16:01:35 301

原创 爬取深圳航空

通过分析发现,condition.constId这个参数是非必须参数,因此,我们可以直接置为空,尝试发现,仅仅通过请求参数是无法成功发起请求头的,我们还需要对请求头进行设置。简单一点来说那就是,你请求的是http格式,那就要使用http的协议,是https格式,就要使用https的协议。由于https的代理比较少,因此,我们需要从数据库手动挑选几个,然后进行随机访问,比如说这种,就是https类型的请求。设置好请求参数,准备好城市站点数据,或者请求我准备好的接口,以及动态生成航班日期。发现,成功发起请求!

2023-10-30 08:29:56 1843

原创 爬取掌上高考(招生计划)

分析发现,一次请求只能获取到10行数据,因此我们需要对其进行翻页处理,分析返回的数据携带数据的总条数,因此,我们可以根据这个总条数进行翻页处理,需要再次发送请求((可以修改size这个参数,减少请求次数,再提高效率的同时,做到反爬效果,但是仍需要动态的获取页数))可以再网上找一些免费的代理,但是一般免费的成功率都很低,而收费的都很贵,因此我们都不采用。其实,作者在这个项目中运用的原来就是到一些免费的代理网站采集 IP,然后测试 IP 的可用性,可用的就存入 Redis 中,不可用就丢弃。

2023-10-19 11:59:09 3556 4

原创 企业级爬虫小项目

爬取厦门航空

2023-10-18 08:52:11 929

原创 Sql查询语句

is not null(不为null值)与like(模糊查询),distinct(去除重复值)分组之后查询的字段:分组字段、聚合函数。运算符: > >= <

2023-09-30 17:35:34 47

全国城市距离数据.csv

全国城市距离数据.csv

2023-03-27

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除