![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
爬虫
diamonds-
这个作者很懒,什么都没留下…
展开
-
爬取财富网(沪深个股)数据以及单个公司的上市后的开盘数据
某某公司的上市后的股票开盘数据折线图 #爬取上海股票以及单个公司的上市后的开盘价格折线图 import urllib import urllib.request import requests import re from bs4 import BeautifulSoup import xlwt import json import numpy as np import matplotli...原创 2020-02-26 17:30:08 · 356 阅读 · 0 评论 -
爬取千千音乐的歌词、歌曲到本地
#爬取千千音乐的歌词 import urllib import urllib.request from bs4 import BeautifulSoup def getHtml(url,kname): headers={"User-Agent":"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like G...原创 2020-02-21 17:50:26 · 457 阅读 · 0 评论 -
学习编写爬虫(二)--------re/os库
正则表达式----(re库)下面是Python中正则表达式的一些匹配规则,图片资料来自CSDN# -*- coding: utf-8 -*-import re#1.match()# 将正则表达式编译成Pattern对象,注意hello前面的r的意思是“原生字符串”pattern = re.compile(r'hello')# 使用re.match匹配文本,获得匹配结果,无法匹配时将返回Nonere...原创 2018-02-23 20:24:47 · 327 阅读 · 0 评论 -
学习编写爬虫(一)-------urllib库
urllib库(常用)学习:一、urllib.urlopen()#爬取百度网页代码import urllib2#用rullib2.urlopen()方法打开网址response = urllib2.urlopen("http://www.baidu.com")#设置编码为utf-8print response.read().decode('utf8','ignore').encode('gbk',...原创 2018-02-23 16:53:02 · 165 阅读 · 0 评论