1.Python属于强类型、动态语言,赋值即定义。如x=666就是定义int型变量x,将666赋值给它。变量类型在进行赋值操作时被确定。变量在程序执行过程中可以改变类型,但是不能进行隐式转换。
2.对字符串进行操作的运算符:+(进行字符串的连接)、*(进行字符串的重复)
3.在python代码中可以使用三引号或者#进行注释,三引号可以添加多行注释,注释在程序执行时自动略过。
4.range()函数一般在进行循环时使用,含有三个参数:初值(默认从0开始)、终值(不包括终值)、递增数(,默认为1,可以自己定义)。
5.在编写代码时经常需要导入模块,整体导入:import 模块名、from 模块名 import *,导入具体函数:from 模块名 import 具体函数名(可以一次导入多个)。
6.字符串的切片和索引:切片就是获取字符串连续的一部分,索引就是通过字符串的下标获取对应位置字符。一字符串的下标从前往后默认从0开始,从后往前从-1(倒数第一个)开始,s[x:y]中x为起始位置,y为结束位置(但不包括).
7.可以通过split()方法通过给定的分隔符将一个字符串分割为一个列表
8.可以通过replace(a,b,m)方法进行字符替换,a为原字符,b为新字符,m为替换次数
9.在爬虫得到的文本中,文本两侧常会有多余的空格,可以使用strip()方法去除多余的空格或者其他字符
10.format()方法进行字符串格式化符,在爬虫过程中,使用字符串格式化符可以减少代码使用量,如搜索同一类型不同名称的事物时,只需将改变的部分进行字符串格式化符操作,其他代码重复部分可以只使用一遍