业余时间用Ruby写个爬取亚马逊爆品，让自己有机会挣点外快

本文链接：https://blog.csdn.net/super_ip_/article/details/134686030

作为混迹于互联网的人，除了正常上班外，剩下的就是想着怎么着利用业余时间兼职或者找机会挣点外快。今天就随便分享一下，个人在亚马逊开店，有部分人在上面寻找一些热门或者爆款的产品，然后放到自己店铺，有用户需要的话就直接去别处下单，然后邮寄过去。大概思路就是这养，但是对于一个普通人来说，只能靠自己去搜索记录到表格里。

但是有更专业的公司，都是爬虫来进行数据整理，批量搞的模式，更高端，咱个人就随便搞搞了，爬一些热门的放上面，然后就等着呗，闲暇之余用ruby写了个简单的代码，仅供参考。

require 'net/http'
require 'nokogiri'
require 'uri'

# 设置代理信息
proxy_host = 'www.duoip.cn'
proxy_port = 8000

# 构建代理服务器地址
proxy_addr = URI.parse("http://#{proxy_host}:#{proxy_port}")

# 构建URL
url = URI.parse('https://origin-www.amazon.cn/gp/browse.html?node=2031274071&ref_=nav_cs_new') # 亚马逊的产品列表页面

# 使用Net::HTTP::Proxy代理发送HTTP请求
http = Net::HTTP::Proxy(proxy_addr.host, proxy_addr.port).new(url.host, url.port)
http.use_ssl = true

# 发送GET请求
response = http.get(url.request_uri)

# 使用Nokogiri解析HTML内容
doc = Nokogiri::HTML(response.body)

# 抽取需要的数据
# 假设产品名称在class为'product-title'的div元素中，产品价格在class为'product-price'的div元素中
products = doc.css('.product')
products.each do |product|
  title = product.css('.product-title').text
  price = product.css('.product-price').text
  puts "Product Title: #{title}"
  puts "Product Price: #{price}"
end

大概思路也整理下：