爬虫学习Day17 2023/7/25

今天学习了代理服务器的一些知识。爬虫时,我们可能会高频访问一个网页,可能会被网页检查到异常,封IP。这时我们使用代理功能。

代理的几种功能:

  1. 突破自身IP访问限制,访问国外站点
  2. 访问一些单位或团体内部资源。扩展: 某大学FTP(前提是该代理地址在该资源的允许访问范国之内),使用教育网内地址段免费代理服务器,就可以用于对教育网开放的各类FTP下载上传,以及各类资料查询共享等服务。
  3. 提高访问速度扩展。通常代理服务器都设置一个较大的硬盘缓冲区,当有外界的信息通过时,同时也将其保存到缓冲区中,当其他用户再访问相同的信息时, 则直接由缓冲区中取出信息,传给用户,以提高访问速度,
  4. 隐藏真实IP。扩展:上网者也可以通过这种方法隐藏自己的IP,免受攻击.

我们在使用代理时需要使用到handler请求定制

handler = urllib.request.ProxyHandler(proxy = x)
opener = urllib.request.build_opener(handler)
response = opener .open(request)

x的值以字典的形式存在,在网上得到代理IP以及PORT,'http':'ip:port'。

今天就这些,8

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
您可以使用正则表达式来解析日期字符串"2023/5/30"。以下是一个示例代码: ```java import java.time.LocalDate; import java.util.regex.Matcher; import java.util.regex.Pattern; public class DateParser { private static final Pattern PATTERN = Pattern.compile("(\\d{4})/(\\d{1,2})/(\\d{1,2})"); public static LocalDate parse(String dateString) { Matcher matcher = PATTERN.matcher(dateString); if (matcher.matches()) { int year = Integer.parseInt(matcher.group(1)); int month = Integer.parseInt(matcher.group(2)); int day = Integer.parseInt(matcher.group(3)); return LocalDate.of(year, month, day); } else { throw new IllegalArgumentException("Invalid date format: " + dateString); } } } ``` 在这个示例中,我们使用`java.util.regex.Pattern`类来创建一个正则表达式模式对象,该对象指定了日期格式为"yyyy/M/d",其中"\\d{4}"表示4位数的年份,"\\d{1,2}"表示1位或2位数的月份和日期,"()"是用来捕获匹配的子字符串。 然后我们调用`Pattern.matcher()`方法来创建一个用于匹配输入字符串的`java.util.regex.Matcher`对象,并使用`Matcher.matches()`方法来检查输入字符串是否与正则表达式匹配。 如果匹配成功,则使用`Matcher.group()`方法获取每个捕获组的值,并使用`LocalDate.of()`方法创建一个`LocalDate`对象,该对象表示解析后的日期。 如果匹配失败,则抛出一个`IllegalArgumentException`异常。 您可以使用以下代码来解析"2023/5/30": ```java LocalDate date = DateParser.parse("2023/5/30"); System.out.println(date); // 输出:2023-05-30 ``` 请注意,以上代码假设输入的日期字符串是有效的,并且符合指定的日期格式。如果输入的日期字符串不符合指定的日期格式,将会抛出`IllegalArgumentException`异常。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值