![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
爬虫
文章平均质量分 66
苏格拉底的石墩
这个作者很懒,什么都没留下…
展开
-
Java程序采集图片数据
Java爬虫采集网页数据 一、简单介绍爬虫 网络爬虫(又称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。 了解过爬虫的同学都知道,现在的爬虫,80%是用Python写的: 原因一:因为现在的网络协议大多基于HTTP/HTTPS ,而java的基本框架支持的是TCP/IP 网络协议,构建爬虫时需要导入大量底层库; 原因二:Python 具有很多的爬虫开源库,好用的飞起,Java的也有,但是java上手难度大; 原因三原创 2021-05-12 20:29:19 · 434 阅读 · 0 评论 -
爬虫学习计报存--报存图片
爬虫学习计之图片–妹子图 最近傻徒刚学了爬虫,问有什么好站阔以用来练手加愉悦心情! 既然说到愉悦!那必不可少妹子图了!给傻徒安排一波! # -*- coding: utf-8 -*- import requests import re import os import time from scrapy import Selector from fake_useragent import UserAgent # 替换随机请求头 ua = UserAgent() headers = {'User-Agent'原创 2020-07-23 21:16:28 · 369 阅读 · 0 评论