自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 收藏
  • 关注

原创 python爬虫学习第三节:BeautifulSoup模块

1:beautifulsoup模块作用是为了完成爬虫工作中的解析数据和提取数据2:我们平时用浏览器上网,浏览器会把服务器返回的html源代码翻译为我们能看动的样子,之后我们才能在网页上做各种操作,爬虫工作也是一样,要使用能读懂html的工具,才能提取想要的数据3:beautifulsoup如何解析数据:这里面的解析器,python由一个内置的库:html.parser(他不是唯一的解析器)解析代码结构为:在第6行代码中,第一个参数必须是字符串,到这里,我们就完成了数据解析,且把解析到的数据转换成

2021-01-31 15:06:31 500

原创 python爬虫学习第二节:html基础

1:HTML的学习顺序,读懂,修改,编写,只有读懂了HTML才能看的懂网页的结构,而看懂网页的结构,是获取数据最关键的一步,如果你不知道自己需要的数据在网页的什么地方,那你怎么获取呢2:html叫做超文本标记语言,专业用于编写前端的语言html之于网页,就相当于建筑图纸之于建筑3:如何查看网页的源代码:又两种方式这种方法打开的网页源代码结构不清晰,很难看懂,另一种方式是快捷键:ctrl+shift+i4:HTML的层级每一个小三角就是一个层级5:HTML的组成:标签和元素,如图每一对&lt

2021-01-30 21:46:03 119

原创 python爬虫学习第一节:获取数据

1:浏览器工作原理:我们输入要访问的网址(URL)-浏览器向服务器发出请求,服务器响应浏览器,把数据给浏览器,浏览器再解析数据,然后返回给我们,我们提取自己需要的数据,然后存储起来,这就是整个流程 2:爬虫的工作原理:爬虫向浏览器发起请求,浏览器返还数据给爬虫,爬虫解析数据,解析数据,提取数据,存储数据第一步:获取数据:爬虫程序根据我们提供的网址,向服务器发起请求,然后返回数据第二步:解析数据:爬虫程序把服务器返回的数据解析成我们能读懂的格式第三步:提取数据:爬虫程序从解析的数据中

2021-01-30 20:37:25 253

原创 python学习第十三节:模块

1:什么是模块:模块是最高级比的程序组织单元,之前学习的类,可以封装属性和方法,函数,可以封装方法,而模块,可以封装一切2:定义变量要用赋值语句,封装函数要用def语句,封装类需要用class语句,但是封装模块不需要用任何语句,每一份单独的python文件(后缀名为.py的文件)就是一个单独的模块3:封装模块的目的,是为了把程序代码和数据存放起来方便以后再次使用,且文件形式更方柏霓共享给他人4:import语句,是用于导入模块的,是为了利用其他模块中已经封装好的,变量,函数,类5:再导入模块后,当我

2021-01-30 13:30:43 113

原创 python学习第十二节:编码与文件读写

1:编码:编码的本质就是让只认识0和1的计算机能够理解我们人类使用的语言符号,并且将数据转换为二进制进行储存和传输,这种人类语言到计算机的转换形式,就叫做编码表,让让人类语言和计算机语言能够一一对应起来2:二进制3:计算机里最小的存储单位叫做尾,用来存放一个0或1,也叫比特(bit),8个比特构成一个字节(byte)二进制中,有多少位,就能构成2的多少次方种状态关于流量的计算方式4:编码表,由于计算机只认识0或1,因此我们要告诉计算机那个数字代表那个字符,数字和字符对应的表,就叫编码表,因此,如果

2021-01-30 12:33:14 242

原创 python学习第十一节:类继承和定制

1:什么时类的继承如图A类时B类的子类,B类时A类的父类(或者超类),我们就说A继承于B,那么A就拥有B类的属性和方法2:什么时类的定制,如上图,广东人说普通话,他也说广东话,广东话就是广东人独有的,这个时候就要给广东人单独定义一个属性:说广东话,这就是定制,定制基本可以理解为子类与子类之间的区别,子类可以在继承父类的基础上创建新属性新方法,也可修改继承到的属性和方法,这就是类的定制3:类的继承,代码结构为:子类继承的属性和方法,会传递给子类创建的实例对象4:我们在创建类的时候,都没有带括号,这不

2021-01-27 19:30:10 111 2

原创 python学习第十节:类与对象

1:什么是类(class)一个类下面都会包含无数和相似的个列,这无数个个列组合起来就叫类2:类与实例;无数个个列的整体叫做类,类下面的每一个个体叫做实例3:什么是对象;万事万物都是对象(object),类可以看做对象,实例也可看做对象,list是个类对象,[1,2]是个实例对象4:如何创建类:类的个列都又很多种相同点,我们把这些相同点分为两种,一种叫属性,另一种叫方法,比如:类的创建代码格式为:类的方法的创建与函数的定义非常相似,不同的是,类的方法的创建,方法的定义中又个必须要放在首位的参数se

2021-01-27 16:44:25 68

原创 python学习第九节:函数

1:函数的定义2:len()函数,可用于查询数据的长度3:如何定义一个函数def的意思是定义(define)比如要定义y=3x+2这个函数,首先要给你需要定义的函数体一个命名,其次要找到这个函数中的变量是什么,例如,命名上面函数为math,则定义函数的代码结构为:def math(x):y=3*x+2(函数体,为该函数要实现的功能)return y(返回值为Y,返回值可以是多个,可以自定义需要返回什么)3:参数类型:设置与传递参数是函数定义中最重要的部分,常用的参数类型有:位置参数,默认参

2021-01-27 13:27:43 313

原创 python学习第九节:break,continue,pass,else语句

1:break语句这个语句的作用就是,如果满足了某一条件,就提前结束循环2:continue语句这个语句的作用是,当满足某一条件的时候,直接进入下一轮循环,而当前条件下continue后的指令不再执行3:pass语句,就是跳过的意思4:总结...

2021-01-26 12:57:34 106

原创 python学习第八节:布尔运算

1:计算机做判断的时候,时根据布尔值来进行判断的,计算机的逻辑判断,只有两种结果;true(真),fals(假),这两个值,就叫布尔值,只有当计算机判断布尔值为真时,指令才会被执行,基于布尔值的运算,就叫做布尔运算2:python中比较运算符3:python中真假的判断4:bool()函数可以用来查看一个数据的真假,代码为:print(bool(要查询的数据))5:布尔值之间的运算6:not运算7:in和not in运算,in时判断一个数据是否在一堆数据中,not in的作用相反,代码结构为

2021-01-26 12:18:45 775

原创 python学习第七节:while循环

1:while循环语序一般用于不知道需要循环多少次的情况下2:while循环语句代码结构while循环时在满足一定的条件下重复执行指令

2021-01-26 11:49:57 128

原创 python学习第六节:for循环

1:循环语句的特性是能够让计算机重复地,自动地执行指令2:for循环语句的代码结构其中i为变量,是变量就必须要赋值,这个语句就相当于把in后面的列表的值一次一次的赋值给i,然后执行下面的指令,直到in后面所有的值都已经赋值过一次为止,这个过程叫做遍历,遍历字典时,赋值的时每一个键,而不是值,遍历列表时,赋值的是值,遍历字符串时,赋值的是字符串中的每一个文本3:整数,浮点数,不能用在for循环中,其他数据类型都可以,字典,列表,字符串,函数,都可以4:range(x)函数,可以生成一个0-x-1的整

2021-01-26 11:43:33 764

原创 python学习第五节:列表和字典

1:计算机利用数据的三种方式2:列表的代码格式一个列表需要用[]把里边的所有元素框起来,里面的每一个数据叫做元素,每个元素之间要用英文逗号隔开3:列表中的每个元素都是有自己位置的,这个位置就叫偏移量,偏移量是从0开始计数的4:如何从列表中提取单个元素上面这个例子提取的就是’小明‘这个元素,提取的时候,我们是通过偏移量来索引(搜索定位)读取到我们需要的元素的,只需要列表名[偏移量]就可以取到我们需要的元素5:如何从列表中提取多个元素:提取多个元素叫做切片图片中代码切取的列表片段对应在后面,规则为

2021-01-26 11:04:21 395

原创 python学习第四节:input()函数

1:input()函数是用于收集信息的,并且一定要在终端处输入数据2:input()函数通常用作变量赋值3:input的用法:函数结果赋值给变量,使用函数收集信息,然后输出结果4:input()函数收集到的数据,无论输入的是什么,其数据类型都是字符串...

2021-01-25 17:42:04 626

原创 python学习第三节:计算机的沟通逻辑,条件判断

1:条件判断有三种形式,单向判断,双向判断,多向判断2:单向判断3:双向判断4:多向判断5:if嵌套语句

2021-01-25 15:46:58 61

原创 python学习第二节:数据类型

1:python里最常用的数据类型有三种:字符串(str),整数(int),浮点数(float)2:字符串3:整数4:浮点数5:python里的数据运算跟数学的运算基本是相同的6:字符串的拼接,目的是为 了数据整合7:当需要查询某一个变量的数据类型的时候用print(type(查询的变量名))就可以了8:数据类型之间的转换...

2021-01-25 15:33:50 50

原创 python学习第一节:基础语法,变量与赋值

python学习笔记-基础语法1:爬虫工作分4步:获取数据,解析数据,提取数据,存储数据2:我们通过python与计算机沟通的过程:向计算机发出指令-python把代码编译成计算机能听懂的机器语言-计算机执行指令,在这个过程中,python其实就相当于一个翻译官3:print()函数的功能,打印内容4:计算机在运行代码过程中,只能理解数字,不能理解文字,因为数字的运算法则是标准化、有固定格式的,而文字却千变万化5:单引号和双引号的作用是差不多的,三引号有跨行的作用比如print(’‘’哈哈哈哈

2021-01-25 14:56:43 170

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除