爬虫常见问题。

最新推荐文章于 2024-05-16 17:02:23 发布

Gwiqudo

最新推荐文章于 2024-05-16 17:02:23 发布

阅读量365

点赞数

本文链接：https://blog.csdn.net/qq_35962520/article/details/83962786

版权

1.如果遇到带有中文的url怎么办

如果URL中存在中文，而你却不对它做任何处理，他不会达到你所想的那样，因此我们需要将中文部分进行处理，要用到urllib.parse模块中的quote将中文转化成URL所需的编码，url中的中文要单独处理，不能中英文全部合在一起处理（因为一部分的特殊字符也会被处理掉）。

import urllib.parse
 
word='龙'
word=urllib.parse.quote(word)
url='https://baike.baidu.com/search/word?word=%s'%word
print(url)

2.新建文件夹

	def mkdir(path):  ##这个函数创建文件夹
		path = path.strip()
		isExists = os.path.exists(os.path.join("D:\\爬虫练习\\aa", path))
		if not isExists:
			print(u'建了一个名字叫做', path, u'的文件夹！')
			os.makedirs(os.path.join("D:\\爬虫练习\\aa", path))
			os.chdir(os.path.join("D:\\爬虫练习\\aa", path))  ##切换到目录
			return True
		else:
			print(u'名字叫做', path, u'的文件夹已经存在了！')
			os.chdir(os.path.join("D:\\爬虫练习\\aa", path))  ##切换到目录
			return False