自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(42)
  • 收藏
  • 关注

原创 055/056_爬虫_urllib_下载/请求对象的定制

下载案例import urllib.request# 网页下载url_page = "http://www.baidu.com"urllib.request.urlretrieve(url_page,"baidu.html")# 图片下载url_img = "https://pic2.zhimg.com/v2-a4619293e8e376f5ee1fc1dd616b4197_r.jpg?source=1940ef5c"urllib.request.urlretrieve(url_img,

2022-05-15 10:16:07 240

原创 053/054_爬虫_urllib_基本使用/一个类型六个方法

urllib基本使用使用urllib来获取百度首页源代码import urllib.request# 定义一个url 你需要访问的网址url = "http://www.baidu.com"# 模拟浏览器向服务器发送请求 response = 响应response = urllib.request.urlopen(url)# 获取响应种的页面的源码 content = 内容# read方法 返回的是字节形式的二进制数据# 二进制--》字符串 解码 decode("编码类型

2022-05-14 18:56:19 241

原创 049_爬虫_文件_文件的序列化和反序列化

对象——》字节序列化==序列化字节序列化——》对象==反序列化默认情况下我们只能将字符串写入到文件中fp = open("testa.txt","w")fp.write("hello worid")fp.close()序列化的两种方式dunps创建一个文件fp = open("testb.txt","w")定义一个列表name_lits = ['zs','ls']导入json模块到文件中import json序列化将python对象 变成json字符串

2022-05-14 14:52:45 321

原创 052_爬虫_爬虫相关概念(引用《尚硅谷Python爬虫教程(小)小 白零基础速通》052章)

爬虫解释:通过程序,根据url(http://taobao.com)进行网页的爬取 获取有用的信息实用程序模拟浏览器,去向服务发送请求,获取响应信息爬虫的核心爬取网页:爬取整个网页 包含了网页中所的内容解析数据:将网页中得到的数据 进行解析难点:爬虫和但爬虫之间的博弈爬虫的类型实例通用爬虫百度,360,Google,搜狗等搜索引擎功能访问网页-》抓取数据-》数据储存-》数据处理-》提供检索服务robots协议...

2022-05-14 14:52:15 335

原创 050/051_爬虫_异常/网页结构的介绍

异常的格式:try:可能出现异常的代码except 异常代码有好的提示try: fp = open("text.txt","r") fp.read()except FileNotFoundError: print("你个derder...")

2022-05-14 14:16:04 160

原创 048爬虫_文件_文件的读写

写数据write方法fp = ("test1.txt","a")如果模式变成a 那么会执行追加的操作fp = open("test1.txt","w")如果模式变为w 会覆盖原来的数据fp.write("hello worid,i am here" *5)重复五次同一行上fp.write("hello worid,i am here\n",*5)重复五次五行fp.close()读数据fp = ("test1.txt","r")默认情况下 read是一字节一字

2022-05-13 15:52:34 80

原创 047_爬虫——文件的打开和关闭

创建一个"test.txt"文件open("文件模式","路径")w 可读r 可写open('test.txt','w')创建一个“test.txt”的文件 并写入"hello worid"fp = open("test.txt","w")fp.write("hello worid")手动创建一个"demo"的文件夹,在里面创建一个"test.txt"的文本文档里输入"hello worid"文件夹是不可创建的 暂时需要手动创建)...

2022-05-13 15:11:40 134

原创 045/46_爬虫——函数的返回值/局部变量、全局变量

函数返回的值def sum(a,b): c = a + b# 返回的关键字在return 存在函数 return c# 使用一个变量来接受函数返回的值a = sum(12,23)print(a)局部变量# 局部变量: 在函数的内容部定义的函数,我们愿称之为局部变量# 特点: 只能在函数内部使用,而函数的外部不能使用def a1(): a =1print(a)#全局变量:在函数的外部定义的函数,我们愿称之为全局变量# 特点: 作用范围在函数的外部,也

2022-03-26 21:46:59 1290

原创 043/044_爬虫——函数的定义和调用/函数参数

函数的定义:函数定义使用函数# 函数定义def a1(): print("欢迎光临") print("请问喝什么") print("欢迎下次光临")# 使用函数a1()a1()函数参数位置参照关键字参照def sum(a,b): c = a +b print(c)# 位置参照sum(1,2)sum(100,200)# 关键字参照sum(b = 2,a = 1)...

2022-03-26 20:23:56 1046

原创 042_爬虫——字典高级_历遍

字典高级_历篇person = {'name':'王五','age':'18','sex':'男'}print(person)# 历遍字典中的keyfor key in person.keys(): print(key)# 历遍字典中的valuesfor values in person.values(): print(values)# 历遍字典中的key和valuesfor key,values in person.items(): print(key,va

2022-03-26 19:35:51 74

原创 040/041_爬虫——列表高级_添加/删除

列表高级_添加# 给字典添加一个新的key# 如果使用变量名称[“键”] = 数据时 如果键在字典中不存在 那么就会变成新增元素person = {'name':'王五'}print(person)# 给字典添加一个新的key# 如果使用变量名称['键'] = 数据时 如果键在字典中不存在 那么就会变成新增元素person['age'] = 18print(person)# 给字典添加一个存在的键person ['name'] = '王老五'print(person)

2022-03-25 23:04:48 279

原创 038/039_爬虫——字典的高级_查询/修改

字典的高级_查询person = {'name':'张三','age':'18'}print(person ['name'])print(person ['age'])# 当使用[]的时候查找字典中不存在的元素,书写是不是发生异常,运行时会发生报错# print(person ['key'])print(person.get('name'))print(person.get('age'))# 当使用gat查找字典中不存在的元素时,书写不会发生异常,运行时会返回noneprint(p

2022-03-25 22:43:34 66

原创 037_爬虫——切片

切片[1][0:4][0:][:4][0:6:3]a = 'hello worid'print(a)# 在切片中直接输入下标print(a[2])# 左闭右开区间,包含左边的数据 不包含右边的数据print(a[0:4])# 起始值开始到结尾print(a[0:])# 下边为0索引的元素开始 到第二个参数为止 左闭右开区间print(a[:4])# 从下表为0的位置开始 到下标为6的元素结束 每次增加3个单位长度print(a[0:6:

2022-03-25 21:30:17 407

原创 036_爬虫——元组高级

1 列表中的元素是可以修改的,元组内的元素是不可修改的2 当元祖只有一个元素时,那么他是整型数据 定义一个元素的元组 要在元祖元素后添加一个“ ,”# 例子a_puple = {'1,2,3,4}print(a_puple[2])print(a_puple[3])a_puple[2] = 2print(a_puplre)# 输入是不会报错,但运行会发生错误# 当元祖只有一个元素时,那么他是整型数据# 点定义一个元素的元组 要在元祖元素后加添加一个 ,b_...

2022-03-25 21:13:37 1177

原创 035_列表高级——高级_删除

高级_删除del 根据下标进行删除motion 删除最后一个元素remove 根据元素的值删除# del 根据下标进行删除ball_lits = ['篮球','足球','排球','台球']print(ball_lits)del ball_lits[2]print(ball_lits)# pop 删除最后一个元素jogging_lits = ['长跑','短跑','马拉松','冲刺']print(jogging_lits)jogging_lits.pop()print(j

2022-03-25 21:01:11 54

原创 032_爬虫——列表高级_添加

列表高级_添加append————追加-在列表最后添加一个数据/对象insert(index,object)————通过extend可以将另一个合集中的元素逐一添加到列表中index前面插入元素objectextend———通过extend可以将另一个合集中的元素逐一添加到列表中# appendnumber_lits= ["赵","钱","孙"]number_lits.append('李')print(number_lits)# insertname_lits=["赵","孙"

2022-03-25 20:24:39 93

原创 033/034_爬虫——高级列表_修改/查询

高级列表_修改toponym_list=['北京','上海','广州','深圳','杭州']print(toponym_list)toponym_list[4] = ['成都']print(toponym_list) 高级列表_查询in (存在)如果存在结果为true,不存在则为falsenot in (不存在)如果不存在结果为true,存在则为false# inmotion_lits = ['慢跑','长跑','马拉松']project = input('请输入你喜

2022-03-24 19:44:30 258

原创 031_爬虫——字符串的高级

# 获取长度:len len函数可以获取字符长串的长度# 查找内容:find 查找指定内容在字符串中是否存在,如果存在则返回该内容在字符串中第一次出现的开始位置索引值,如果不存在,则返回-1# 判断:star tswith,endswith 判断字符串是不是以谁谁开头/结尾# 计算出现次数:count 返.

2022-03-22 22:38:35 87

原创 030_爬虫——流程语句练习_for循环

for循环:循环字符串range(5)range(1,6)range(1,10,3)循环一个列表循环字符串range(5)range(1,6)range(1,10,3)循环一个列表一个一个的输出 叫循环,也叫历遍for格式:for 变量 in 要遍历的数据:# 循环字符串s = 'china'for i in s :# i 是字符串中一个又一个的字符的变量# s 是要遍历的数据

2022-03-22 21:49:46 320

原创 028/029_爬虫——if else联系案例/elif

if else案例练习time = int(input("你的驾龄几个月了:"))if time >= 12: print("你可以上高速了")else: print("你还不可以上高速哟")elif 再次判断的意思number = int (input("请输入你的分数:"))if number >= 90: print("优秀")elif number >= 80: print("良好")elif number >= 70

2022-03-22 20:55:39 100

原创 026/027_爬虫_流程控制语句联系_if/else案例练习

案例演示if演示# 控制input台输入age = input ("请输入你的年龄:")# 判断类型print(type(age))# 强制转换类型# int和str无法比较if int(age) >= 18: print ("你可以去网咖了")else# else 判断条件为false的代码age = input('请输入你的年龄:')# 判断类型print(type(age))# 转换格式并比较if int(age) >= 18:

2022-03-22 20:32:24 62

原创 025_爬虫——if关键词

if判断条件如果判断为true的时候将执行if下面的内容age = 19if age > 18print("你可以去网咖了")true代表男孩,false代表女孩gender = Trueif gender == True:print("你得去男厕")

2022-03-22 20:11:33 123

原创 023/024_爬虫——输出——输入

输入:%s代表字符串,%d代表数值#普通输入print("你好")#格式化输入# %s代表字符串,%d代表数值age = 18name = 真猪奶茶print ("你好我是 %s ,我今年%d岁了"%(age,name))

2022-03-22 19:33:26 294

原创 022_爬虫——逻辑计算符的性能优化

逻辑计算符的性能优化:and 的性能优化,当and的前面的结果是false的情况下,那么后面的代码就不需要进行了or 当or的前面的结果为false的情况下,那么结果就是true了# and 的性能优化,当and的前面的结果是false的情况下,那么后面的代码就不需要进行了a = 10a < 5 and print("hello,woeds")# 无显示a <15 and print("hello worid")or 只要有一端是true,那么结果就是truea

2022-03-22 19:28:29 45

原创 021_Python——逻辑运算符

逻辑运算符:andand 两端都是true,则返回的是true, 一端或两端包含false则返回falseoror 其中一端包含true,则返回true, 两端包含false则返回falsenotnot 取反# andprint( 10 > 5 and 10 > 11) # falseprint( 10 > 11 and 10 > 5) # falseprint(10 > 10 and 10 > 11) ...

2022-03-22 18:50:49 972

原创 020_Python——比较运算符

比较运算符: 恒等 不等 大于 大于等于 小于 小于等于 == != > >= < <= # 恒等print( 10 == 10)print( 10 == 20)# 不等print( 10 != 20)print

2022-03-21 13:24:05 272

原创 019_Python——复合斌值运算符

复合斌值运算符例:+= -= *= /= //= %= **=# += -= *= /= //= %= **=a = 1# a 加上一个2打印结果# a = a + 2a += 2print(a)b = 2# b 减去1打印结果# b = b - 1b -= 1print(b)c = 3# c 乘以2打印结果# c = c * 2c *= 2print(c)d =...

2022-03-21 13:13:14 65

原创 018_Python——负值运算符号

负值运算符号:a = 1b = c =2# 多个变量斌值(使用逗号隔开)d , e , f = 3 , 4 , 5print(a)print(b)print(c)print(d)print(e)print(f)

2022-03-21 12:34:59 232

原创 017_Python——运算运算符

运算运算符假设一下变量为:a = 6, b = 5+ 略 略 - 略 略 * 略 略 / 略 略 // 取整除 - 返回整数部分(向下取整) >>> 6 // 5 4 % 取模 - 返回除法的余数 a % b 输出结果为0 ** 幂 - 返回x的y次幂 a ** b 6的5次方,结果为7776 () 略 略...

2022-03-21 11:37:02 418

原创 016_Python——转换为布尔类型

转换为布尔类型例:a = 1print(type(a))b = bool(a)print(b)print(type(b))a = 2print(type(a))b = bool(a)print(b)print(type(b))a = -1print(type(a))b = bool(a)print(b)print(type(b))# 在整数的范围中内,0强制转换为bool类型的结果是falsea = 0print(type(a))b = bool(a)pri

2022-03-21 11:06:53 2307

原创 015_Python——转换为字符串

转换为字符串例:a = 12print(type(a))b = str(a)print(b)print(type(b))a = 1.12print(type(a))b = str(a)print(b)print(type(b))

2022-03-21 10:34:41 734

原创 014_Python——转换为浮点数

转换浮点数例:a = '12.34'print(type(a))b = float(a)print(b)print(type(b))a = 666print(type(a))b = float(a)print(b)print(type(b))

2022-03-21 10:31:01 2326

原创 013_Python——数据类型转换

# int 有符号整数# float 浮点型# boolean 布尔类型# string 字符串# list 列表# tuple 元组# dict 字典a = '123'print(type(a))b = int(a)print(type(b))a = 1.23print(type(a))b = int(...

2022-03-21 10:24:23 58

原创 Python——变量的命名规范

1 标识符有字母、数字、下划线组成2 严格区分大小写3 不能去使用关键词false def if raise none del import return true elif in try and else is while as except lambda with assert finally nonlocal yield break for not

2022-03-21 10:18:58 1290

原创 Python入门——查看数据变量的数据类型

Python入门——查看数据变量的数据类型

2022-03-21 10:00:19 931

原创 超链接/相对路径

超链接使用a标签来定义超链接 属性: href指定跳转目标路径 值可以是一个内部页面的地址 值可以是一个外部页面的地址在a标签中能嵌套出它自身外的任何元素相对路径当我们需要跳转到服务器内部的页面时,一般都会使用相对路径相对路径都会使用./或.././可省略不写../省略不写则会默认为././表示当前文件所在的目录../表示当前文件所在目录的上一级目录...

2021-12-05 12:01:37 886

原创 列表-HTML

HTML列表一共三种:1有序列表 2无序列表 3定义列表有序列表:使用ol标签创建有序列表 使用li表示列表项无序列表:使用ul标签创建无序列表 使用li表示列表项定义列表:使用dl标签创建定义列表 使用dt表示定义的内容 ...

2021-12-05 11:09:21 94

原创 结构化语义化标签

header表示网页的头部main表示网页的主体部分(一个网页中只有一个main)footer表示网页的底部nav表示网页中的导航aside表示和主体相关的其他内容(侧边栏)article表示一个独立的文章section表示一个独立的块,上边的标签都不能使用时使用sectiondiv没有语义,就用来表示一个区块,目前来讲div还是我们主要的布局元素span行内元素,没有任何语义,一般用于网页中选中文字...

2021-12-04 18:39:37 112

原创 块元素和行内元素

块元素(block element) 在网页中一般通过块元素来对网页进行布局行内元素(online element) 行内元素主要用来包裹文字一般情况下会在块元素中放行内元素,而不会在行内元素中放块元素块元素中任何元素都能放p元素不能放块元素浏览器在解析网页时,会自动对网页中的不符合规范的内容进行修正例: 标签写在根元素外部 p元素中放入块元素 ...

2021-12-04 18:04:04 53

原创 meta标签

meta主要设置网页中的一些元数据,元数据是不给用户看的 charset指定网页中的字符集 mane指定的数据昵称content指定数据的内容keyword 表示网站的关键字,可以同时指定多个关键字,关键字间使用,隔开 例:<meta name="keywords" content="网上购物,网上商城,家电,手机,电脑,服装,居家,母婴,美妆,个护,食品,生鲜,京东"/>description用于...

2021-12-04 12:35:50 87

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除