- 博客(5)
- 收藏
- 关注
原创 反爬虫的一二三四
一、通过User-Agent来控制访问: 无论是浏览器还是爬虫程序,在向服务器发起网络请求的时候,都会发过去一个头文件:headers,比如知乎的requestsheaders: Accept:text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,/;q=0.8 Accept-Encoding:gzip, defl...
2019-04-02 21:57:33 208 1
转载 python的基本常识
1. 字符串(string) 1.1 输入字符串 编写字符串时,既可以用单引号( ’ )也可以用双引号( ” ): 对于带有换行符的多行字符串,可以使用三重引号(即 ”’ 或 “”” ): 1.2 访问字符串中的值 Python访问子字符串,可以使用方括号来截取字符串,如下实例: 以上实例执行结果: 1.3 字符串的修改 Python中已存在的字符串本身不可以改变: ...
2019-04-01 14:46:51 425
转载 Chrome + Python 抓取动态网页内容
用Python实现常规的静态网页抓取时,往往是用urllib2来获取整个HTML页面,然后从HTML文件中逐字查找对应的关键字。如下所示: 按 Ctrl+C 复制代码 按 Ctrl+C 复制代码 但是,在动态页面中,所显示的内容往往不是通过HTML页面呈现的,而是通过调用js等方式从数据库中得到数据,回显到网页上。以发改委网站上的“备案信息”(http://beian.hndrc.go...
2019-04-01 10:35:18 439 1
原创 认识python和数据存储
认识python和数据存储 为什么使用、发明计算机?开始为了存储、计算数据 数据存储在哪里? 内存 内存是什么?是与CPU沟通的桥梁;计算机中所有程序的运行都是在内存中进行的,因此内存的性能对计算机的影响非常大。https://baike.baidu.com/item/内存/103614?fr=aladdin数据存储在其中,其最小单位是字节;无数字节堆积而成的就是内存 内存单位:虽然内存最小单位...
2019-01-30 13:40:01 210
原创 python概述
1.什么是python? 1.1解释型、面向对象、动态数据类型的高级程序设计语言 1.2由Gudio van Rossum于1989年底发明 1.3像Perl语言一样,Python源代码同样遵循GPL(General Public Licence)协议 2.简介 2.1解释型语言 开发过程没有编译这个环节,类似于PHP和Perl语言 2.2交互式语言 可以在一个Python提示...
2019-01-29 10:18:14 128
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人