UN Comtrade（联合国商品贸易统计数据库）数据爬取Python代码——使用动态IP

最新推荐文章于 2024-09-05 15:13:05 发布

王蛋糕cake

最新推荐文章于 2024-09-05 15:13:05 发布

阅读量7.4k

点赞数 7

CC 4.0 BY-SA版权

文章标签： python 爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_37194582/article/details/115294087

本文介绍了如何通过Python使用代理IP爬取UNComtrade（联合国商品贸易统计数据库）大量数据，以避免访问限制。主要方法包括虚拟专用网络（VPN）和代理服务器，重点讲解了代理服务器的使用，并提供了代码示例，演示了如何动态获取并切换代理IP，以及如何测试代理IP是否生效。

目录

Virtual Private Network

代理服务器

测试代理IP是否生效

上一篇博文UN Comtrade（联合国商品贸易统计数据库）数据爬取Python代码讲了如何使用Python爬取UN comtrade数据，适用于少量数据爬取，由于网站对访问频率和访问量的限制，大量下载数据时访问会被限制，不过访问量限制是针对每个IP的，所以在上一篇文章也提到使用动态改变IP的方法来解决该问题，本文讲述两种改变IP的方法。

Virtual Private Network

虚拟专用网络，不懂的保留首字母大写，虚拟专用网络允许你将计算机连接到远程网络，实现改变IP的功能，通过虚拟专用网络切换上海和南京的IP：

（PS：百度直接输入IP可以查看本机IP）

改变了IP就可以刷新UN comtrade网站访问限制。虚拟专用网络有的话可以试试，但是我更推荐使用下面要讲的代理服务器方法。其实现在很多代理都是同时提供代理服务和虚拟专用网络服务。

代理服务器

这是爬虫常用的方法，可以理解为远程有另一台电脑（代理服务器）帮你访问网站。当你需要访问UN数据库时，代理服务器代替你进行访问，收集你需要的信息，随之将其返送给你。通过不断的切换代理服务器，就可以达到不断使用新IP的目的，从而刷新UN comtrade网站的访问限制。

下面基于上一篇博客代码基础上添加使用代理ip功能，使用时需要根据具体代理来补充Get_new_ip_port函数，这里不具体推荐代理品牌，需要推荐可以私信，也可以参考爬虫代理哪家强？十大付费代理详细对比评测出炉！进行选择。

最低0.47元/天解锁文章

评论 11

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。