爬虫系列一:十天python爬虫基础学习实战第七天——python字符串及列表

知识回顾:

1.python字符串

2.python列表

"""
案例1:如何定义一个字符串
"""
a = 'hello'
a1 = "hello"
a2 = """hello"""
a3 = '''hello'''

"""
案例2:如何定义一个列表
"""
a1_list = []

 

Python转义字符

在需要在字符中使用特殊字符时,python用反斜杠(\)转义字符。如下表:

转义字符描述
\(在行尾时)续行符
\\反斜杠符号
\'单引号
\"双引号
\a响铃
\b退格(Backspace)
\e转义
\000
\n换行
\v纵向制表符
\t横向制表符
\r回车
\f换页
\oyy八进制数,yy代表的字符,例如:\o12代表换行
\xyy十六进制数,yy代表的字符,例如:\x0a代表换行
\other其它的字符以普通格式输出
"""
案例3:字符串的转义\
\n:换行符合
\t:制表符Tab
"""
a_str = 'hello I\'m Liudehua'
a_str1 = "hell\'o I\"m Liudehua"
a_str2 = "hello I\\\\'m Liudehua"
a_str3 = 'https://mbd.baidu.com/newspage/data/landingsuper?context=%7B%22nid%22%3A%22news_9220683932666622769%22%7D&' \
         'n_type=1&p_from=4super?context=%7B%22nid%22%3A%22news_9220683932666622769%22%7D&n_type=1&p_from=4super?conte' \
         'xt=%7B%22nid%22%3A%22news_9220683932666622769%22%7D&n_type=1&p_from=4super?context=%7B%22nid%22%3A%22news_92' \
         '20683932666622769%22%7D&n_type=1&p_from=4'
a_str4 = 'hello 哈哈\nhello 呵呵'
a_str5 = 'hello哈哈\thello呵呵'
# print(a_str)
# print(a_str1)
# print(a_str2)
# print(a_str3)
print(a_str4)
print(a_str5)

 

Python字符串运算符

下表实例变量 a 值为字符串 "Hello",b 变量值为 "Python":

操作符描述实例
+字符串连接

>>>a + b 'HelloPython'

*重复输出字符串

>>>a * 2 'HelloHello'

[]通过索引获取字符串中字符

>>>a[1] 'e'

[ : ]截取字符串中的一部分

>>>a[1:4] 'ell'

in成员运算符 - 如果字符串中包含给定的字符返回 True

>>>"H" in a True

not in成员运算符 - 如果字符串中不包含给定的字符返回 True

>>>"M" not in a True

r/R原始字符串 - 原始字符串:所有的字符串都是直接按照字面的意思来使用,没有转义特殊或不能打印的字符。 原始字符串除在字符串的第一个引号前加上字母"r"(可以大小写)以外,与普通字符串有着几乎完全相同的语法。

>>>print r'\n' \n >>> print R'\n' \n

%格式字符串请看下一章节
"""
案例4:
+,*	,[ : ]	,in	,not in	,r/R	
"""
a1 = 'hello'
a2 = 'python'
a3 = r'哈哈\t呵呵'
print(a1 + a2)  # + hellopython
print(a1 * 3)  # + hellohellohello
print(a1[2:])  # [ : ]
print(a1[1:3])  # [ : ]
print('thon' in a2)
print(a3)

 

Python 字符串格式化

Python 支持格式化字符串的输出 。尽管这样可能会用到非常复杂的表达式,但最基本的用法是将一个值插入到一个有字符串格式符 %s 的字符串中。

在 Python 中,字符串格式化使用与 C 中 sprintf 函数一样的语法。

python字符串格式化符号:

    符   号描述
      %c 格式化字符及其ASCII码
      %s 格式化字符串
      %d 格式化整数
      %u 格式化无符号整型
      %o 格式化无符号八进制数
      %x 格式化无符号十六进制数
      %X 格式化无符号十六进制数(大写)
      %f 格式化浮点数字,可指定小数点后的精度
      %e 用科学计数法格式化浮点数
      %E 作用同%e,用科学计数法格式化浮点数
      %g %f和%e的简写
      %G %f 和 %E 的简写
      %p 用十六进制数格式化变量的地址

Python2.6 开始,新增了一种格式化字符串的函数 str.format(),它增强了字符串格式化的功能。

"""
案例5:
需求:	根据用户输入的名字进行问候语打印
尽量不要使用+连接字符串
"""
name = input('請輸入你的名字:')
place = '清华大学'
print('hello %s, welcome to %s!' % (name, place))
"""
案例5:
需求:	根据用户输入的名字进行问候语打印
使用str.format(),建议使用.format函数的方式
"""
name = input('請輸入你的名字:')
place = '清华大学'
print('hello {a1}, welcome to {a2}!'.format(a2=place, a1=name))

 

Python 列表(List)

序列是Python中最基本的数据结构。序列中的每个元素都分配一个数字 - 它的位置,或索引,第一个索引是0,第二个索引是1,依此类推

Python有6个序列的内置类型,但最常见的是列表和元组。

序列都可以进行的操作包括索引,切片,加,乘,检查成员

此外,Python已经内置确定序列的长度以及确定最大和最小的元素的方法。

列表是最常用的Python数据类型,它可以作为一个方括号内的逗号分隔值出现。

列表的数据项不需要具有相同的类型创建一个列表,只要把逗号分隔的不同的数据项使用方括号括起来即可。

 

1.访问列表中的值

2.查看列表元素个数

 len(list)

3.更新列表

4.删除列表元素

list.pop([index=-1])

del list[index]

 list.remove(obj)

5.Python列表截取

6.列表的部分函数
 list.append(obj)
 list.count(obj)
 list.extend(seq)
 list.index(obj)
 list.insert(index, obj)
 list.reverse()
 list.sort(cmp=None, key=None, reverse=False)
"""
案例6:
访问列表的值:根据索引访问
1.访问列表中的值
2.查看列表元素个数
 len(list)
3.更新列表
4.删除列表元素
list.pop([index=-1])默认删除最后一个,如果指定index,就删除这个索引的值,建议使用
del list[index]
list.remove(obj)
5.Python列表截取
[:]
6.列表的部分函数
 list.append(obj)   在列表末尾追加元素
 list.count(obj)    统计某个元素在列表里面出现的次数
 list.extend(seq)   将一个列表的元素追加到另一个列表里面
 list.index(obj)    获取列表里面某个元素的索引
 list.insert(index, obj)往列表指定索引位置插入一个元素
 list.reverse() 列表反转
 list.sort(cmp=None, key=None, reverse=False)
"""
a_list = ['劉德華', '周星馳', '成龍', '黄家驹', '赵丽颖', '成龍', '刘亦菲', '成龍', 12, 29.8, '成龍', ]
a_list1 = [1, 23, 4, 5, 7, 8]
# print(a_list[1])
# print(len(a_list))

# print(a_list)
# a_list[1] = '周润发'
# print(a_list)
# print(a_list)
# name = a_list.pop(1)
# del a_list[1]
# a_list.remove('周星馳')
# print(a_list)

# print(a_list[1:4])

# print(a_list)
# a_list.append('周润发')
# print(a_list)

# print(a_list.count('成龍'))

# print(a_list)
# a_list.extend(a_list1)
# print(a_list)

# print(a_list.index('赵丽颖'))

# print(a_list)
# a_list.insert(3, '周润发')
# print(a_list)

# print(a_list)
# a_list.reverse()
# print(a_list)

print(a_list1)
a_list1.sort()
# a_list1.sort(reverse=True)
print(a_list1)

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值