python爬虫：爬取百度云盘资料，保存下载地址、链接标题、链接详情

最新推荐文章于 2024-04-11 09:03:21 发布

weixin_30299539

最新推荐文章于 2024-04-11 09:03:21 发布

阅读量236

点赞数

文章标签：爬虫 python php

原文链接：http://www.cnblogs.com/miranda-tang/p/5584825.html

版权

在网上看到的教程，但是我嫌弃那个教程写的乱（虽然最后显示我也没高明多少，哈哈），就随手写了一个

主要是嫌弃盘搜那些恶心的广告，这样直接下载下来，眼睛清爽多了。

用pyinstall 打包成EXE文件，就可以安安静静的下载东西了。。。。

#refer:http://upvup.com/html/python/2015-12-13/21.html

#!/usr/bin/python
# -*- encoding:utf-8 -*-

import requests
from bs4 import BeautifulSoup
import sys
reload(sys)
sys.setdefaultencoding('utf-8')

def yunpan_search(key):
 url='http://www.wangpansou.cn/s.php?q='+key
 html=requests.get(url)
 soup=BeautifulSoup(html.text,"lxml")
 url_get=soup.find_all('a',{'class':'cse-search-result_content_item_top_a'})
 info_get=soup.find_all('div',{'class':'cse-search-result_content_item_mid'})
 f = open('baidu_source.txt','w')
for i in range(len(url_get)):
 href=url_get[i]['href']
 title=''
 for c in url_get[i].children:
 title+=c.string.strip()

 information=''
 for info in info_get[i].children:
 information+=info.string.strip().replace('\n','')

print str(i+1)+'_'*60
 print '下载地址--'+href+'\n'+'链接标题--'+title+'\n'+'链接详情--'+information+'\n\n'
 f.write(str(i+1)+'. _____________________________________________________________________\n')
 f.write('下载地址--'+href+'\n'+'链接标题--'+title+'\n'+'链接详情--'+information+'\n\n')
 f.close()


if __name__=='__main__':
 key=raw_input('please input what you want to look for:')
 yunpan_search(key)
print('finish')

转载于:https://www.cnblogs.com/miranda-tang/p/5584825.html

weixin_30299539

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
python爬虫：爬取百度云盘资料，保存下载地址、链接标题、链接详情

在网上看到的教程，但是我嫌弃那个教程写的乱（虽然最后显示我也没高明多少，哈哈），就随手写了一个主要是嫌弃盘搜那些恶心的广告，这样直接下载下来，眼睛清爽多了。用pyinstall 打包成EXE文件，就可以安安静静的下载东西了。。。。#refer:http://upvup.com/html/python/2015-12-13/21.html#!/usr/bin/python# -*-...
复制链接

扫一扫