在python中语句结束不需要以分号结束,变量不需要提前定义
变量
现有变量a、变量b,可以通过以下的代码实现变量a、b值的交换
# 把4赋值给变量a
a = 4
# 把5赋值给变量b
b = 5
# 实现两个变量值的交换
# 将变量a的值赋值给t变量 a-->t
t = a
# 将变量b的值赋值给a变量 b-->a
a = b
# 将变量t的值赋值给b变量 t-->b
b = t
# 输出变量a, 变量b的值
print(a, b)
结果显示如下:
字符串的“加法”和“乘法”
字符串的“加法”最常用,因为我们在爬虫的过程中,取出来的Url需要拼装起来才能访问
a = 'I'
b = ' Love'
c = ' Python'
print(a + b + c)
运行结果如下:
字符串的“乘法”,就是将字符串复制这个数字的份数。
a = 'hello'
print(3 * a)
运行结果如下
字符串的切片和索引
在爬虫实战中,经常会通过字符串的切片和索引,提取需要的部分,剔除一些不需要的部分。
a = 'I Love Python!'
# 打印字符串的第一个字符
print(a[0])
# 打印2-6,共4个字符 love
print(a[2:6])
# 打印a数组的最后一个字符
print(a[-1])
运行结果如下:
字符串常用的方法
1.split()方法
通过给定的分隔符(在这里为'.'),将一个字符串分割为一个列表。
注:如果没有提供任何分隔符,程序会把所有的空格作为分隔符(空格、制表、换行等)
2.replace()方法
这种功能类似文本中的“查找和替换”功能。
3.strip()方法
strip()方法只能去除两侧的字符,在爬虫得到的文本中,文本两侧会有多余的空格,只需要用字符串的strip()方法即可去除多余的空格部分。
4.format()方法
将字符串进行格式化,在爬虫过程中,有些网页链接部分参数是可变的,这时使用字符串格式化符可以减少代码的使用量
a = 'www.baidu.com'
b = a.split('.')
print(a.split('.'))
print(b[1])
a = 'there is apples'
b = a.replace('is', 'are')
print(b)
a = ' python is cool '
print(a.strip())
a = '*#*#*#*#python *#is *#good*#**#*#*#*#'
print(a.strip('#*'))
a = '{} is my love'.format('python')
print(a)
context = input('请输入你要搜索的内容:')
url_path = 'https://www.pexels.com/search/{}/'.format(context)
print(url_path)
运行结果如下