- 博客(5)
- 收藏
- 关注
原创 反爬虫的一二三四
一、通过User-Agent来控制访问:无论是浏览器还是爬虫程序,在向服务器发起网络请求的时候,都会发过去一个头文件:headers,比如知乎的requestsheaders:Accept:text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,/;q=0.8Accept-Encoding:gzip, defl...
2019-04-02 21:57:33 230 1
转载 python的基本常识
1. 字符串(string)1.1 输入字符串编写字符串时,既可以用单引号( ’ )也可以用双引号( ” ):对于带有换行符的多行字符串,可以使用三重引号(即 ”’ 或 “”” ):1.2 访问字符串中的值Python访问子字符串,可以使用方括号来截取字符串,如下实例:以上实例执行结果:1.3 字符串的修改Python中已存在的字符串本身不可以改变:...
2019-04-01 14:46:51 440
转载 Chrome + Python 抓取动态网页内容
用Python实现常规的静态网页抓取时,往往是用urllib2来获取整个HTML页面,然后从HTML文件中逐字查找对应的关键字。如下所示:按 Ctrl+C 复制代码按 Ctrl+C 复制代码但是,在动态页面中,所显示的内容往往不是通过HTML页面呈现的,而是通过调用js等方式从数据库中得到数据,回显到网页上。以发改委网站上的“备案信息”(http://beian.hndrc.go...
2019-04-01 10:35:18 468 1
原创 认识python和数据存储
认识python和数据存储为什么使用、发明计算机?开始为了存储、计算数据数据存储在哪里? 内存内存是什么?是与CPU沟通的桥梁;计算机中所有程序的运行都是在内存中进行的,因此内存的性能对计算机的影响非常大。https://baike.baidu.com/item/内存/103614?fr=aladdin数据存储在其中,其最小单位是字节;无数字节堆积而成的就是内存内存单位:虽然内存最小单位...
2019-01-30 13:40:01 230
原创 python概述
1.什么是python?1.1解释型、面向对象、动态数据类型的高级程序设计语言1.2由Gudio van Rossum于1989年底发明1.3像Perl语言一样,Python源代码同样遵循GPL(General Public Licence)协议2.简介2.1解释型语言 开发过程没有编译这个环节,类似于PHP和Perl语言2.2交互式语言 可以在一个Python提示...
2019-01-29 10:18:14 147
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人