爬虫常用函数及方法(一)

request.urlrestrieve(img,'/a'+name+'.jpg')  #request方法下载(图片地址,目录+获取名+后缀)

requests.get().content #解析图片,音频,视频用content

requests.get().text #解析文本用text

urllib.parse.urlencode(字典) #查询字符串字典进行编码

urllib.parse.quote(字符串) #只能编码字符串

urllib.parse.unquote(字符串) #对已编码字符串还原

np.arange(10).reshape(2,5) #numpy.np方法生成10个list,并排列成2行5列

os.path.exists(directory) #判断是否存在目录

os.makedirs(directory) #接上,如果没有则创建

url.format(params) #拼接url和params,params是编码url字符串

lower() #将英文字母字符串改为小写

print([s.lower() for s in lists]) #将list中每个元素改为小写

upper() #将英文字母字符串改为大写

print([s.upper() for s in lists]) #将list中每个元素改为大写

str=''.join(list) #将list转换为字符串

list=list(str) #将字符串转换为list

list1=list(dict.keys()) #将字典中的key转换为list

list2=list(dict.values()) #将字典中的value转换为list

i=['a','b']  l=[1,2] print(dict(zip(i,l))) #将列表i,l 转换为字典

for i in list:

        i.strip()                         #去空格

        lists.append(i.strip())   #去空格方法二,并加入lists列表

        lists.append(i.replace(' ','')) #去空格方法三,并加入lists列表



random.randint(0,100)  #随机生成0-100之间的一个整数

random.choice(list)       #随机挑选list元素中的一个

random.uniform(a,b)    #随机生成指定范围内的小数

random.sample(list,x)  #在list中取出x个值,不会修改原有序列

random.shuffle(p)        #将序列p中的元素顺序打乱

  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值