简介
字符串属于不可变的序列,由单引号、双引号或三引号包含。
创建
字符串
“Hello World”
‘Hello World’
字符(长度为1的字符串,文章后续的字符均指长度为1的字符串)
‘H’
‘H’
三引号
‘’‘he
… llo’‘’
‘he\nllo’
操作符
赋值(操作符=)
赋值操作符:=,使变量指向字符串。
s = “Hello World”
s
‘Hello World’
访问(序列操作符切片)
序列操作符切片有三种形式:[index]、[start:stop]、[start:stop:step]
- [index]返回字符,也称为索引,部分教程与切片分开
- [start:stop]返回从start开始,到stop-1的字符串,不包含stop,start默认为0,stop默认为 最后一个index+1。
- [start:stop:step]返回从start开始,到stop-1的字符串,每step个取一个字符。step>0时,start默认为0,stop默认为最后一个index+1。step<0时,start默认为-1,stop默认为第一个index-1。start,stop>0时,step默认为1。start,stop<0时,step默认为-1。
注意:
- index超出范围时引发IndexError。start与stop一样或start在stop右边,返回空列表。step为0时引发ValueError。
- 在Pycharm中import builtins,选中builtins,按Ctrl+B,打开builtins.pyi,找到class slice,查看更多详细内容。
>=0时的index | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
字符串 | H | e | l | l | o | W | o | r | l | d | |
<0时的index | -11 | -10 | -9 | -8 | -7 | -6 | -5 | -4 | -3 | -2 | -1 |
s[2]
‘l’
s[-4]
‘o’
>>> s[2:5]
‘llo’s[1:]
‘ello World’
s[:7]
‘Hello W’
s[-2:]
‘ld’
s[:-3]
‘Hello Wo’
s[1:6:]
'ello ’
s[-8:-2:]
‘lo Wor’
s[:8:]
‘Hello Wo’
s[1::]
‘ello World’
s[::-1]
‘dlroW olleH’
小技巧:[::-1]常用来得到反转的字符串,原字符串不变
判断子串(成员操作符in,not in)
s = “Hello World”
“Hello” in s
True
“hello” not in s
True
“world” in s
False
拼接(连接符+)
“Hello”+“World”
‘HelloWorld’
重复(重复操作符*)
‘-’*10
‘----------’
操作符r在特殊字符后
比较(==、!=、>、<、>=、<=)
python中不像c++,有compare函数,直接使用比较运算符比较字符串即可。
“hello”==“hi”
False
“hello”!=“hi”
True
“hello”>“hi”
False
“hello”<“hi”
True
“hello”>=“hi”
False
“hello”<=“hi”
True
删除
使用关键字del,删除后不可再用,否则NameError。没必要显式删除,Python会自动处理的。
del s
s
Traceback (most recent call last):
File “”, line 1, in
NameError: name ‘s’ is not defined
格式化
%
格式化符号
符 号 | 描述 |
---|---|
%c | 格式化字符及其ASCII码 |
%s | 格式化字符串 |
%d | 格式化整数 |
%u | 格式化无符号整型 |
%o | 格式化无符号八进制数 |
%x | 格式化无符号十六进制数 |
%X | 格式化无符号十六进制数(大写) |
%f | 格式化浮点数字,可指定小数点后的精度 |
%e | 用科学计数法格式化浮点数 |
%E | 作用同%e,用科学计数法格式化浮点数 |
%g | %f和%e的简写 |
%G | %F 和 %E 的简写 |
%p | 用十六进制数格式化变量的地址 |
辅助符号
符号 | 功能 |
---|---|
* | 定义宽度或者小数点精度 |
- | 用做左对齐 |
+ | 在正数前面显示加号( + ) |
在正数前面显示空格 | |
# | 在八进制数前面显示零(‘0’),在十六进制前面显示’0x’或者’0X’(取决于用的是’x’还是’X’) |
0 | 显示的数字前面填充’0’而不是默认的空格 |
% | ‘%%‘输出一个单一的’%’ |
(var) | 映射变量(字典参数) |
m.n. | m 是显示的最小总宽度,n 是小数点后的位数(如果可用的话) |
‘grade:%f’ % 12.345678
‘grade:12.345678’‘grade:%.2f’ % 92.2354
‘grade:92.24’‘grade:%c’ % 66
‘grade:B’‘grade:%s’ % ‘good’
‘grade:good’
更多内容,读者自行尝试吧。
f"{}"
python版本>=3.6
比上面的,以及.format()效率要高。如果你的python版本高一点,建议使用这个。
同样,格式化符号有很多,博主不再黏贴,针对数字,字符串,时间之类的都有,黏贴的话文章太长。
例如,datetime的格式化符号。
举例
代码:
from datetime import datetime
now = datetime.now()
print(f’datetime_now:{now:%F %X}')
terminal:
datetime_now:2020-09-05 09:39:15
pycharm里面敲的,不是交互式。
转义字符
转义字符
转义字符 | 描述 |
---|---|
(在行尾时) | 续行符 |
\ | 反斜杠符号 |
’ | 单引号 |
" | 双引号 |
\a | 响铃 |
\b | 退格(Backspace) |
\e | 转义 |
\000 | 空 |
\n | 换行 |
\v | 纵向制表符 |
\t | 横向制表符 |
\r | 回车 |
\f | 换页 |
\oyy | 八进制数,yy代表的字符,例如:\o12代表换行 |
\xyy | 十六进制数,yy代表的字符,例如:\x0a代表换行 |
\other | 其它的字符以普通格式输出 |
代码:
print(‘hello\nworld’)
terminal:
hello
world
原始字符串(操作符r)
这个没有放到前面的操作符中,因为在转义字符后面讲比较好。r可以使字符串里面就是字符串内容本身,没有转义等。
代码:
print(r’hello\nworld’)
terminal:
hello\nworld
在pycharm中不加r时,字符串中的\n是橘色的,加了后就是绿色了。
方法
s = ‘hello world’
type(s)
<class ‘str’>
一个字符串是类str的一个对象,也就可以调用str类的方法。
拆分
split
(sep=None, maxsplit=-1)
返回一个由字符串内单词组成的列表,使用 sep 作为分隔字符串。 如果给出了 maxsplit,则最多进行 maxsplit 次拆分(因此,列表最多会有 maxsplit+1
个元素)。 如果 maxsplit 未指定或为 -1
,则不限制拆分次数(进行所有可能的拆分)。
如果给出了 sep,则连续的分隔符不会被组合在一起而是被视为分隔空字符串 (例如 '1,,2'.split(',')
将返回 ['1', '', '2']
)。 sep 参数可能由多个字符组成 (例如 '1<>2<>3'.split('<>')
将返回 ['1', '2', '3']
)。 使用指定的分隔符拆分空字符串将返回 ['']
。
sep没给的话是默认是空格,几个空格都可以。
“hello world,i’m lady_killer”.split(‘,’)
[‘hello world’, “i’m lady_killer”]
“hello wor ld,i’m lady_killer”.split()
[‘hello’, ‘wor’, “ld,i’m”, ‘lady_killer’]
rsplit方法参数相同,不同的是从右边开始
拼接
join
(iterable)
返回一个由 iterable (可迭代的对象)中的字符串拼接而成的字符串。 如果 iterable 中存在任何非字符串值包括bytes
对象则会引发TypeError
。 调用该方法的字符串将作为元素之间的分隔。
‘:’.join(“2020 09 05 13 54”.split())
‘2020:09:05:13:54’
替换
replace
(old, new[, count])
返回字符串的副本,其中出现的所有子字符串 old 都将被替换为 new。 如果给出了可选参数 count,则只替换前 count 次出现。
>>> “”.join(“hello world,i’m lady killer”[::-1]).replace(‘dlrow’,‘world’)
“rellik ydal m’i,world olleh”
移除前导、末尾字符
strip
([chars])
返回原字符串的副本,移除其中的前导和末尾字符。 chars 参数为指定要移除字符的字符串。 如果省略或为 None
,则 chars 参数默认移除空格符。 实际上 chars 参数并非指定单个前缀或后缀;而是会移除参数值的所有组合。
" hello world ".strip()
‘hello world’
"12.45 ".strip()
‘12.45’
“2323345623323”.strip(‘32’)
‘456’
32可以组合成2、3、23、32等。 你可以理解为前后遍历含chars中任一字符便删除,无法删除时停止。
统计子串
count
(sub[, start[, end]])
返回子字符串 sub 在 [start, end] 范围内非重叠出现的次数,默认是整个字符串。 可选参数 start 与 end, 会被解读为切片表示法。
‘www.example.com’.count(‘com’)
1‘www.example.com’.count(‘w’,1,7)
2
寻找子串索引
find
(sub[, start[, end]])
返回子字符串 sub 在 s[start:end]
切片内被找到的最小索引。 可选参数 start 与 end 会被解读为切片表示法。 如果 sub 未被找到则返回 -1
。
‘www.example.com’.find(‘w’,1,7)
1
‘www.example.com’.find(‘w’,3,7)
-1
rfind方法,参数相同,返回找到的最大的索引
index与rindex在未找到时会引发ValueError,不建议使用。
转换大小写
转为小写
lower
()
返回原字符串的副本,其所有区分大小写的字符均转换为小写。
‘WWW.example.com’.lower()
‘www.example.com’
转为大写
upper
()
返回原字符串的副本,其中所有区分大小写的字符均转换为大写。 请注意如果 s
包含不区分大小写的字符或者如果结果字符的 Unicode 类别不是 “Lu” (Letter, uppercase) 而是 “Lt” (Letter, titlecase) 则 s.upper().isupper()
有可能为 False
。
>>> ‘www.example.com’.upper()
‘WWW.EXAMPLE.COM’
判断字符串类型
全是字母
isalpha
()
如果字符串中的所有字符都是字母,并且至少有一个字符,返回 True
,否则返回 False
。字母字符是指那些在 Unicode 字符数据库中定义为 “Letter” 的字符,即那些具有 “Lm”、“Lt”、“Lu”、“Ll” 或 “Lo” 之一的通用类别属性的字符。 注意,这与 Unicode 标准中定义的"字母"属性不同。
‘www.example.com’.isalpha()
False
‘wwwexamplecom’.isalpha()
True
全是数字
isdecimal
()
如果字符串中的所有字符都是十进制字符且该字符串至少有一个字符,则返回 True
, 否则返回 False
。十进制字符指那些可以用来组成10进制数字的字符,例如 U+0660 ,即阿拉伯字母数字0 。 严格地讲,十进制字符是 Unicode 通用类别 “Nd” 中的一个字符。
‘1’.isdecimal()
True‘IV’.isdecimal()
False‘六六六’.isdecimal()
False
isdigit
()
如果字符串中的所有字符都是数字,并且至少有一个字符,返回 True
,否则返回 False
。 数字包括十进制字符和需要特殊处理的数字,如兼容性上标数字。这包括了不能用来组成十进制数的数字,如 Kharosthi 数。 严格地讲,数字是指属性值为 Numeric_Type=Digit 或 Numeric_Type=Decimal 的字符。
‘IV’.isdigit()
False
‘六六六’.isdigit()
False
isnumeric
()
如果字符串中至少有一个字符且所有字符均为数值字符则返回 True
,否则返回 False
。 数值字符包括数字字符,以及所有在 Unicode 中设置了数值特性属性的字符,例如 U+2155, VULGAR FRACTION ONE FIFTH。 正式的定义为:数值字符就是具有特征属性值 Numeric_Type=Digit, Numeric_Type=Decimal 或 Numeric_Type=Numeric 的字符。
‘IV’.isnumeric()
False‘六六六’.isnumeric()
True
本人从事网路安全工作12年,曾在2个大厂工作过,安全服务、售后服务、售前、攻防比赛、安全讲师、销售经理等职位都做过,对这个行业了解比较全面。
最近遍览了各种网络安全类的文章,内容参差不齐,其中不伐有大佬倾力教学,也有各种不良机构浑水摸鱼,在收到几条私信,发现大家对一套完整的系统的网络安全从学习路线到学习资料,甚至是工具有着不小的需求。
最后,我将这部分内容融会贯通成了一套282G的网络安全资料包,所有类目条理清晰,知识点层层递进,需要的小伙伴可以点击下方小卡片领取哦!下面就开始进入正题,如何从一个萌新一步一步进入网络安全行业。
学习路线图
其中最为瞩目也是最为基础的就是网络安全学习路线图,这里我给大家分享一份打磨了3个月,已经更新到4.0版本的网络安全学习路线图。
相比起繁琐的文字,还是生动的视频教程更加适合零基础的同学们学习,这里也是整理了一份与上述学习路线一一对应的网络安全视频教程。
网络安全工具箱
当然,当你入门之后,仅仅是视频教程已经不能满足你的需求了,你肯定需要学习各种工具的使用以及大量的实战项目,这里也分享一份我自己整理的网络安全入门工具以及使用教程和实战。
项目实战
最后就是项目实战,这里带来的是SRC资料&HW资料,毕竟实战是检验真理的唯一标准嘛~
面试题
归根结底,我们的最终目的都是为了就业,所以这份结合了多位朋友的亲身经验打磨的面试题合集你绝对不能错过!
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!