自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 反爬虫的一二三四

一、通过User-Agent来控制访问: 无论是浏览器还是爬虫程序,在向服务器发起网络请求的时候,都会发过去一个头文件:headers,比如知乎的requestsheaders: Accept:text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,/;q=0.8 Accept-Encoding:gzip, defl...

2019-04-02 21:57:33 208 1

转载 python的基本常识

1. 字符串(string) 1.1 输入字符串 编写字符串时,既可以用单引号( ’ )也可以用双引号( ” ): 对于带有换行符的多行字符串,可以使用三重引号(即 ”’ 或 “”” ): 1.2 访问字符串中的值 Python访问子字符串,可以使用方括号来截取字符串,如下实例: 以上实例执行结果: 1.3 字符串的修改 Python中已存在的字符串本身不可以改变: ...

2019-04-01 14:46:51 425

转载 Chrome + Python 抓取动态网页内容

用Python实现常规的静态网页抓取时,往往是用urllib2来获取整个HTML页面,然后从HTML文件中逐字查找对应的关键字。如下所示: 按 Ctrl+C 复制代码 按 Ctrl+C 复制代码 但是,在动态页面中,所显示的内容往往不是通过HTML页面呈现的,而是通过调用js等方式从数据库中得到数据,回显到网页上。以发改委网站上的“备案信息”(http://beian.hndrc.go...

2019-04-01 10:35:18 439 1

原创 认识python和数据存储

认识python和数据存储 为什么使用、发明计算机?开始为了存储、计算数据 数据存储在哪里? 内存 内存是什么?是与CPU沟通的桥梁;计算机中所有程序的运行都是在内存中进行的,因此内存的性能对计算机的影响非常大。https://baike.baidu.com/item/内存/103614?fr=aladdin数据存储在其中,其最小单位是字节;无数字节堆积而成的就是内存 内存单位:虽然内存最小单位...

2019-01-30 13:40:01 210

原创 python概述

1.什么是python? 1.1解释型、面向对象、动态数据类型的高级程序设计语言 1.2由Gudio van Rossum于1989年底发明 1.3像Perl语言一样,Python源代码同样遵循GPL(General Public Licence)协议 2.简介 2.1解释型语言   开发过程没有编译这个环节,类似于PHP和Perl语言 2.2交互式语言   可以在一个Python提示...

2019-01-29 10:18:14 128

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除