自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 案例:爬取名言网数据

爬虫练习者网站这是一个国外的网站专门用来供爬虫学习者练习的网站,里面的源代码格式非常的规范,没有现在类似诸多网站的CSS渲染,适合爬虫初学者练习。进入网站后空白处电机右键,选择查看网页源代码或者在网站上点击ctrl+U查看源代码。1.python向服务器发送请求首先调用urlopen,re和csv模块from urllib.request import urlopenimport re,...

2019-08-15 19:33:59 712

原创 爬虫

需要的步骤1.使用python发送服务器请求2.请求响应之后,会得到相应对象response(源码,以及其他的响应信息),response.read( )-------源码信息-----字节如果需要的是网页的源码信息字节.decode() 转换成字符串,默认按照utf-8编码,将字节转换成字符串3.使用抓取工具(正则表达式)来对字符串信息进行处理4.保存抓取一、使用python发送...

2019-08-15 15:53:43 127

原创 简单自定义字符串html信息爬取

htmlhtml的概念:超文本标记语言(hyper text markup language)练习html=""" <a target="_blank" href="http://www.baidu1.com">我的链接1</a> <A href="http://www.baidu2.com" target="_blank">我的链接2</...

2019-08-15 11:15:43 323

原创 正则表达式

正则表达式使用特定的表达式来表示一个模板,使待匹配字符串来进行匹配。正则表达式不属于python中的知识点,只是在python中可以使用正则表达式正则表达式可以分为两种:(1)普通字符串(2)特殊规则的字符串re.py模块支持正则表达式的使用import re# re.search()方法可以使用正则表达式来进行匹配待匹配字符串re.search(ex,带匹配字符串)# 第一个...

2019-08-14 22:00:05 203

原创 python中的文件操作

文件二进制文件:MP3,jpg,docx 使用字节操作文本文件:文本信息 txt,bat,py…,使用字符串操作(1)获得文件对象函数open(路径,模式)路径:相对路径(当前操作的文件夹开始)、绝对路径(带盘符的路径例如C:)模式:读写:r(读) ,w(覆盖写),a(追加写)单独的操作r:文件必须存在(默认模式)w:如果文件不存在,则新建,如果文件存在,则...

2019-08-14 19:32:21 124

原创 循环中的break和continue的差别

break,continuebreak和continue作为循环中经常用到的函数,是有所差别的break:跳出当前循环,再也不回来continue:跳出本次循环,继续执行下一次练习:输出所有的偶数(1,100):# for 循环for i in range(1,101): if i%2==0: print(i)# while 循环i=1while i<=100: ...

2019-08-14 19:08:43 165

原创 python基本数据类型

数值,布尔类型,字符串(字节),列表,元组,字典,集合(1)数值类型:整数,浮点数,复数,布尔类型(其中浮点数具有不精确性,例如0.1+0.2==0.3,输出结果为False)(2)字符串和字节字符串类型是不可变的,有序的,元素可重复的类型x=‘abc’y=123索引 字符串名字[index]index取值范围:正数,0:从左到右 负数:从右到左-len()----l...

2019-08-14 18:53:19 124

原创 位运算符计算中的原码,反码,补码

1.原码,反码,补码今天呢,刚开始学习python的一些基础知识,在位运算符中,通常使用以下几个符号:& | ^ << >>,其中涉及到了原码,反码,补码的理解。下面简单介绍一下&,<<原码:正数的原码就是本身的二进制码,比如5,原码就是0101,而负数的话要在首位也就是符号位变成1,表示负数,即 -5 的原码为1101。反...

2019-08-14 14:54:24 656

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除