INNOVATION111-CSDN博客

原创 day4-房价信息

from lxml import etree import time import random import requests,csv #爬取链家网前10页嘉兴市二手房的房价 #一开始是字典格式，想写进csv，这样好像不行。然后想换成列表，用pandas写进csv，但是也不行，不能解决列表覆盖原数据的问题，想了得有2个小时 #搞不定，只能用原来的方法，如果有人知道怎么改，还请教一下。 class LianjiaSpider(object): def __init__(self): self..

2021-12-19 20:04:26 166

原创 Day2-爬取豆瓣250

原本是爬取猫眼电影的，但是爬不到数据，怀疑跟要验证图片有关，临时换成豆瓣250 #豆瓣250 import requests,time,random import requests import re import csv class maoyan_film(object):#定义一个类 def __init__(self):#初始化实例，使得定义的变量可以通用 self.url = 'https://movie.douban.com/top250?s

2021-12-06 18:05:38 511

原创爬虫day1

#运用面向对象编写贴吧数据 import requests,time,random import csv import requests import re from lxml import etree class baiduspider(object):#定义一个类 def __init__(self):#初始化实例，使得定义的变量可以通用 self.url = 'https://tieba.baidu.com/f?kw={}&pn={}' .

2021-12-03 16:27:17 400

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 day4-房价信息

原创 Day2-爬取豆瓣250

原创 爬虫day1

空空如也

空空如也

原创爬虫day1