爬虫
Tanderick
这个作者很懒,什么都没留下…
展开
-
B站视频下载源码
最初源码# -*- coding: utf-8 -*-"""@author: tanderick"""import requestsimport reimport os out_ffmpeg = os.getcwd()out_fliepath = os.getcwd()+'/download'av_name = input('视频av号:')base_url = '原创 2020-07-04 00:51:46 · 1766 阅读 · 0 评论 -
微博关键词搜索并爬取前40页内容与图片
微博关键词搜索并爬取前40页内容与图片# -*- coding: utf-8 -*-"""@author: tanderick"""import requestsimport re import osimport urllib.parseimport time#header文件 headers ={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:76.0) Gecko/20100101 Firefox/76原创 2020-07-04 00:40:43 · 877 阅读 · 0 评论 -
唯美少女网页爬虫源码
唯美少女网页爬虫源码在这里插入代码片# -*- coding: utf-8 -*-"""@author: tanderick"""import requestsimport reimport timeimport osimport urllib.parsefilepath = str(r'C:/ml/data/image/vm/')if not os.path.exists(filepath): os.mkdir(filepath)keyword = '校园'#搜索名.原创 2020-07-04 00:35:20 · 449 阅读 · 0 评论