爬虫常用函数及方法（一）

最新推荐文章于 2024-04-19 22:29:26 发布

pymysqll

最新推荐文章于 2024-04-19 22:29:26 发布

阅读量576

点赞数 2

分类专栏： python爬虫文章标签： servlet

本文链接：https://blog.csdn.net/pymysqll/article/details/127170981

版权

python爬虫专栏收录该内容

2 篇文章 0 订阅

订阅专栏

request.urlrestrieve(img,'/a'+name+'.jpg')  #request方法下载（图片地址，目录+获取名+后缀）

requests.get().content #解析图片，音频，视频用content

requests.get().text #解析文本用text

urllib.parse.urlencode(字典) #查询字符串字典进行编码

urllib.parse.quote(字符串) #只能编码字符串

urllib.parse.unquote(字符串) #对已编码字符串还原

np.arange(10).reshape(2,5) #numpy.np方法生成10个list，并排列成2行5列

os.path.exists(directory) #判断是否存在目录

os.makedirs(directory) #接上，如果没有则创建

url.format(params) #拼接url和params，params是编码url字符串

lower() #将英文字母字符串改为小写

print([s.lower() for s in lists]) #将list中每个元素改为小写

upper() #将英文字母字符串改为大写

print([s.upper() for s in lists]) #将list中每个元素改为大写

str=''.join(list) #将list转换为字符串

list=list(str) #将字符串转换为list

list1=list(dict.keys()) #将字典中的key转换为list

list2=list(dict.values()) #将字典中的value转换为list

i=['a','b']  l=[1,2] print(dict(zip(i,l))) #将列表i，l 转换为字典

for i in list:

        i.strip()                         #去空格

        lists.append(i.strip())   #去空格方法二，并加入lists列表

        lists.append(i.replace(' ','')) #去空格方法三，并加入lists列表



random.randint(0,100)  #随机生成0-100之间的一个整数

random.choice(list)       #随机挑选list元素中的一个

random.uniform(a,b)    #随机生成指定范围内的小数

random.sample(list,x)  #在list中取出x个值，不会修改原有序列

random.shuffle(p)        #将序列p中的元素顺序打乱