Python爬虫
博大精深的爬虫知识,又是头疼的一天。
Hanzoe_lwh
我走的很慢,但绝不回头。
展开
-
python多线程描述
python多线程描述转载 2021-01-08 23:23:41 · 91 阅读 · 0 评论 -
python的储存管理方式导致的赋值问题(手动狗头)
本来想自己好好总结一下的,但是,看见了别的大佬写的,这也太优秀了。所以直接贴上连接吧。python中copy()和deepcopy()详解要点python里的直接赋值,是将变量作为指针指向该资源的,因此,就相当于c++的引用,内存不变,只是多了一个标签,因此,对其中一个进行操作的时候,另一个也会变。而不像c++一样,每个变量都有自己的内存空间直接使用a = b.copy(),这只是浅层复制,对于多层的资源来说(例如三维列表),只会复制外面的一层,深层的还是共用一个地址,可以想想为什么。解决方法如原创 2020-11-19 21:23:48 · 78 阅读 · 0 评论 -
Python打基础一定要吃透这68个内置函数
前言内置函数就是Python给你提供的, 拿来直接用的函数,比如print.,input等。截止到python版本3.6.2 python一共提供了68个内置函数,具体如下????```pythonabs() dict() help() min() setattr()all() dir() hex() next() slice() any()原创 2020-11-01 13:34:18 · 100 阅读 · 0 评论 -
Python笔记(基本入门函数)
第一章 快速上手 :基础知识1.3 x%y=x-((x//y)*y) 注意求余运算符 向下圆整,如果是负数,则更远离010//310//-310%310%-3 十六进制:0x 八进制:0o 十进制:0b0xAF=1750o10=80b1011010010=7221.6输入input("The meaning of life:")x=input("x:")y=input("y:")print(int(x)*int(y))原创 2020-10-25 13:09:29 · 13799 阅读 · 0 评论 -
Centos7环境下对Crontab的使用以及问题(Anaconda+python脚本)
简介近期写了一个爬虫脚本(爬取学习通的作业时间,并且进行邮件提醒),有兴趣的可以看看我的相关文章。部署在阿里云服务器上,想进行定时运行。Crontab大致简介(菜鸟教程)Linux crontab是用来定期执行程序的命令。当安装完成操作系统之后,默认便会启动此任务调度命令。crond 命令每分锺会定期检查是否有要执行的工作,如果有要执行的工作便会自动执行该工作。注意:新创建的 cron 任务,不会马上执行,至少要过 2 分钟后才可以,当然你可以重启 cron 来马上执行。而 linux 任务原创 2020-11-19 21:03:26 · 440 阅读 · 0 评论 -
Python网络爬虫 一、requests的用法详解
Python网络爬虫一、requests的用法详解什么是网络爬虫?如何搞笑的获取互联网上的海量数据,是大数据时代的我们面临的重要问题。而爬虫就是解决这些问题而生的。1.requests的基础知识requests是用Python语言编写的HTTP库。它比python标准库urllib更加方便,可以节约我们大量的工作,完全满足HTTP测试需求。2.安装pip install reques...原创 2019-08-20 14:02:54 · 535 阅读 · 0 评论 -
Python网络爬虫 三、实战豆瓣
Python网络爬虫三、实战豆瓣目标:爬取豆瓣电影中排名前十的电影获得其主要信息:原创 2019-08-25 22:11:12 · 670 阅读 · 1 评论 -
Python网络爬虫 二、Xpath语法详解
Python网络爬虫二、Xpath语法详解lxml是一个网页解析库。Xpath是一门在XML文档中查找信息的语言。Xpath课 用来在XML文档中对元素和属性进行遍历。安装pip install lxml导入import requestsfrom lxml import etree创建一个简单的html样本,注意其特点,层层嵌套。htm = '''<html>...原创 2019-08-21 15:37:47 · 665 阅读 · 0 评论