自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(19)
  • 收藏
  • 关注

原创 第五讲----bs4

bs4简介基本概念Beautiful Soup 是可以从HTML或XML文件中提取数据的网页信息提取库安装。pip install lxml。pip install bs4# @File : bs4快速入门.py# import bs4from bs4 import BeautifulSouphtml_doc = """<html><head><title>The Dormouse's story</title></head>

2020-10-31 16:22:45 419 1

原创 第四讲----- xpath和lxml模块

xpath介绍基本概念。xpath(XML Path Language)是一种xml的查询语言,它能在xml树状结构中寻找节点,XPath用于在XML文档中通过元素和属性进行导航。xml是一种标记语法的文本格式,xpath可以方便的定位xml中的元素和其中的属性值。lxml是python中的一个第三方模块,它包含了将html文本转成xml对象,和对对象执行xpath的功能# @File : 节点的关系.pyxml_content = '''<bookstore><book&g

2020-10-31 14:21:11 189

原创 第三讲----正则表达式

1.正则表达式的简介1.1 概念正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定的字符,及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑1.2 正则表达式的运用场景。表单验证(例如:手机号,邮箱,身份证…)。爬虫2. 正则表达式对python的支持2.1 普通字符字母、数字、汉字、下划线,以及没有特殊定义的符号,都是“普通字符”。正则表达式中的普通字符,在匹配的时候,只匹配与自身相同的一个字符。例如:表达式c,在匹配abcde

2020-10-31 13:06:26 377

原创 爬虫网络请求模块

1. urllib.request模块python2 :urllib2、urllibpython3 :把urllib和urllib2合并,urllib.request1.2 常用方法。urllib.request.urlopen(“网址”) 作用:向网站发起一个请求并获取响应。字节流 = response.read()。字符串 = response.read().decode(‘utf-8’)。urllib.request.Request("网址“,headers=“字典”) urlopen(

2020-10-19 22:29:46 1093

原创 01---爬虫简介

爬虫简介1.通讯协议1.1端口我们想要进行数据通讯分几步?1.找到对方ip2.数据要发送到对方指定的应用程序上。为了标识这些应用程序,所以给这些网络应用程序都用数字进行了标识。为了方便称呼这个数字,就把这个数字叫做”端口“,这里的端口我们一般叫做逻辑端口。3.定义通讯规则。这个通讯规则我们一般称之为协议。1.2通讯协议。国际组织定义了通用的通讯协议TCP/IP协议。所谓协议就是指计算机通讯网络中两台计算机之间进行通讯所必须共同遵守的规则或规定。HTTP又叫做超文本传输协议(是一种通讯协议

2020-10-13 21:29:01 262

原创 第十四讲——模块

1.模块。模块化指将一个完整的程序分解成一个个的小模块。通过将模块组合,来搭建出一个完整的程序。模块化的优点。方便开发。方便维护。模块可以复用模块的创建。在Python当中一个py文件就是一个模块。在一个模块中引入外部模块 import模块名(模块名就是py文件)。可以引入同一个模块多次,但是模块的实例只会创建一次。import 模块名 as 模块别名。在⼀个模块内部都有⼀个__name__。通过它我们可以获取模块的名字。如果py⽂件直接运⾏时,那么__name__默认等于字符串’

2020-08-31 16:00:43 154

原创 第十三讲——面向对象三

1. 继承简介。继承是面向对象的三大特性之一。通过继承我们可以使一个类获取到其他类中的属性和方法。在定义类时,可以在类名后面的括号中指定当前类的父类(超累、基类)。继承提高了类的复用性。让类与类之间产生关系。有了这个关系,才有了多态的特性# @File : 继承的简介.py# 继承# 1. 让类与类之间产生了关系,有了这个关系看,才有了多态的特性# 2. 提高代码的复用性class Person: name = '' age = ''class Doctor: n

2020-08-31 15:45:29 200

原创 第十二讲—面向对象二

1.特殊方法。在类中可以定义一些特殊方法也称为魔术方法。特殊方法都是形如–xxx–()这种形式。特殊方法不需要我们调用,特殊方法会在特定的时候自己调用# @Author : PanHui# @File : 类的特殊方法.py# 第一个 name 是必须的 第二个 name是不同的 第三个 这种添加方式容易出错# 我们希望在创建对象的时候,必须设置name属性,如果不设置对象都无法创建class Person: # print('Person代码中的代码') # name

2020-08-31 14:53:17 137

原创 第十一讲---面向对象

1. 面向对象简介。python是一门面向对象的编程语言。所谓面向对象的语言,简单理解就是语言中的所有操作都是通过对象来进行的。面向过程. 面向过程指将我们的程序分解为一个一个步骤,通过对每个步骤的抽象来完成程序. 这种编程方式往往只适用一个功能,如果要实现别的功能往往复用性比较低. 这种编程方式符合人类的思维,编写起来比较容易1.妈妈穿⾐服穿鞋出⻔2.妈妈骑上电动⻋3.妈妈到超市⻔⼝放好电动⻋4.妈妈买⻄⽠5.妈妈结账6.妈妈骑电动⻋回家7.到家孩⼦吃⻄⽠。面向对象的编程语言,

2020-08-16 15:51:41 133

原创 第十讲---函数下

1. 高阶函数# @Time : 2020/8/12 14:29# @Author : PanHui# @File : 高阶函数.py# 高阶函数# 特点一 接收一个或多个函数作为参数# 特点二 将函数作为返回值代码# 当我们使用一个函数作为参数的时候,实际上是将指定的代码传递了目标函数# 需求:将一个指定列表中的偶数,保存到一个新的列表中返回lst = [1,2,3,4,5,6,7,8,9,10]# 定义一个函数用来检测任意数的偶数def fn(lst): def fn2(i

2020-08-13 08:38:00 124

原创 第九讲---函数中

1. 函数的返回值# @Time : 2020/8/11 18:20# @Author : PanHui# @File : 函数的返回值.py# 返回值就是返回函数执行的结果# 通过return来指定函数的返回值# 求任意数的和# def fn(*args):# r = 0# for n in args:# r += n# print(r)# return r# r = fn(1,2,3)# print(r-3-3)#可以直接使

2020-08-12 11:33:31 139

原创 第八讲—函数上

1.函数简介。函数也是一个对象。函数用来保存一些可执行的代码,并且可以在需要时,对这些语句进行 多次调用1 语法2 def 函数名([形参1,形参2,形参3....]):3 代码块注意:函数名必须符合标识符的规范(可以包含字母、数字、下划线但是不能以数字开头)print是函数对象,print()是调用函数2. 函数的参数2.1 形参和实参。形参(形式参数)定义形参就相当于在函数内部声明了变量,但并不是赋值。实参(实际参数)指定了形参,那么在调用函数时必须传递实参,实参将会赋值给对应

2020-08-11 18:17:34 218

原创 第七讲—元组&字典&集合

元组快速入门# @Time : 2020/7/31 13:53# @Author : PanHui# @File : 元组快速入门.py# 元组 tuple# 元组是一个不可变序列# 一般情况下不希望这个数据改变的时候就用元组,其余情况都用列表# [] ()#my_tuple = 1,2,3,4,5#print(my_tuple,type(my_tuple))#my_tuple[3] = 8 # TypeError: 'tuple' object does not support ite

2020-08-01 14:31:07 139

原创 第六讲—列表

1.序列1.1 基本概念。序列是Python中最基本的一种数据结构。序列用于保存一组有序的数,所有的数据在序列当中都有一个唯一的位置(索引)并且序列中的数据会按照添加的顺序来分配索引。数据结构指计算机中数据存储的方式1.2 序列的分类。可变序列(序列中的元素可以改变):例如列表(list) 字典(dict)。不可变序列(序列中的元素不能改变):例如字符串(str) 元组(tuple)2. 列表。列表是python中的一个对象。列表的作用。列表中可以保存多个有序的数据。列表是用来存储对象

2020-07-15 17:28:47 168

原创 第五讲—条件控制语句

1.条件判断语句(if语句)。执行的流程:。if语句在执行时,会先对条件表达式进行求值判断,。如果为True则执行if后的语句如果为False,则不执行语法:if条件表达式:代码块代码块中保存着一组代码,同一个代码块中的代码要么都执行要么都不执行代码块以缩进开始,直到代码恢复到之前的缩进级别时结束代码块就是一种为代码分组的机制2. input() 函数。该函数用来获取用户的输入。input调用后,程序会立即暂停,等待用户输入。用户输入完内容以后,点击回车程序才会继续向下执行。用户

2020-07-13 16:40:42 658

原创 第四讲—运算符

1. 运算符1.1.运算符的概念。运算符用于执行程序代码运算,会针对一个以上操作数项目来进行运算。例如:2+3,其操作数是2和3,而运算符则是“+”运算符的分类。算术运算符。赋值运算符。比较运算符(关系运算符)。逻辑运算符。条件运算符(三元运算符)2.算数运算符。加法运算符 表现形式 +。减法运算符 表现形式 -。乘法运算符 表现形式 *。除法运算符 表现形式 /。// 整除,只会保留计算后的整数位,总会返回一个整形。% 取模,求两个数相除的余数。幂运算,求一个值

2020-07-13 11:37:20 208

原创 第三讲—基本数据类型

1.几个概念1.1 表达式表达式,是由数字、算符、数字分组符号(括号)、自由变量和约束变量等以能求得数值的有意义排列方法所得的组合.表达式特点。表达式一般仅仅用于计算一些结果,不会对程序产生实质性的影响。如果在交互模式中输入一个表达式,解释器会自动将表达式的结果输出1.2 语句。一个语法自成体系的单位,它由一个词或句法上有关联的一组词构成。语句的执行一般会对程序产生一定的影响,在交互模式中不一定会输出语句的执行结果1.3 程序(program)。程序就是由一条一条的语句和一条一条的表达式

2020-07-12 22:43:26 151

原创 Python要点

1.Python语言1.1 Python语言的基本概念Python 是⼀种极少数能兼具 简单 与 功能强⼤ 的编程语⾔。你将惊异于发现你正在使⽤的这⻔编程语⾔是如此简单,它专注于如何解决问题,⽽⾮拘泥于语法与结构官⽅对 Python 的介绍如下:Python 是⼀款易于学习且功能强⼤的编程语⾔。 它具有⾼效率的数据结构,能够简单⼜有效地实现⾯向对象编程。Python 简洁的语法与动态输⼊之特性,加之其解释性语⾔的本质,使得它成为⼀种在多种领域与绝⼤多数平台都能进⾏脚本编写与应⽤快速开发⼯作

2020-07-09 23:26:13 203

原创 python基础知识铺垫

1. 计算机基本概念1.1 计算机是什么**.**计算机(computer)俗称电脑,是现代⼀种⽤于⾼速计算的电⼦计算机器. 特点 : 数值计算 逻辑计算 存储记忆功能总结 : 能够按照程序运⾏、⾃动、⾼速处理数据的现代化智能电⼦设备1.2 计算机的组成硬件:⿏标 键盘 显示器 CPU 硬盘… 看的⻅摸的着.软件:PyCharm QQ 浏览器 英雄联盟… 看不⻅摸不着2. 计算机语⾔2.1 计算机语⾔的基本概念概念 :计算机语⾔(Computer Language)指⽤于⼈与

2020-07-09 11:45:30 224

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除