- 博客(3)
- 收藏
- 关注
原创 day4-房价信息
from lxml import etree import time import random import requests,csv #爬取链家网前10页嘉兴市二手房的房价 #一开始是字典格式,想写进csv,这样好像不行。然后想换成列表,用pandas写进csv,但是也不行,不能解决列表覆盖原数据的问题,想了得有2个小时 #搞不定,只能用原来的方法,如果有人知道怎么改,还请教一下。 class LianjiaSpider(object): def __init__(self): self..
2021-12-19 20:04:26 166
原创 Day2-爬取豆瓣250
原本是爬取猫眼电影的,但是爬不到数据,怀疑跟要验证图片有关,临时换成豆瓣250 #豆瓣250 import requests,time,random import requests import re import csv class maoyan_film(object):#定义一个类 def __init__(self):#初始化实例,使得定义的变量可以通用 self.url = 'https://movie.douban.com/top250?s
2021-12-06 18:05:38 511
原创 爬虫day1
#运用面向对象编写贴吧数据 import requests,time,random import csv import requests import re from lxml import etree class baiduspider(object):#定义一个类 def __init__(self):#初始化实例,使得定义的变量可以通用 self.url = 'https://tieba.baidu.com/f?kw={}&pn={}' .
2021-12-03 16:27:17 400
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人