玩蛇网python爬虫与数据分析,本文结合python爬虫与K-means算法的使用,来分析图片主基色。色彩斑斓的一张图片,哪种颜色是它的主色调呢?今天就来讲讲如何用Python爬虫与K-means聚类分析图片主色方法。
今天我们拿电影的海报来举例吧。都知道第当一部电影要上映的时候,都会出许许多多漂亮的海报,不知道你有没有注意到。每种不同类别的电影海报图片,用的色调都是有自己的特定方向颜色。那么不同风格的电影海报对颜色有什么样的偏好呢?这就是我们今天要用Python爬虫与K-means聚类分析的重点所在。
首先用Python 爬虫从网页中抓取电影海报数据,同时将其储存到本地的电脑中,做为基础数据为下面做计算做准备。下载的图片种类分别为:惊悚片、喜剧、动画片和动作片。图片数据为112张,也就是112个数据源。
Python爬虫与K-means算法分析多数据图片主色方法,抓取图片部分源码如下:
#代码格式请自行调整!www.iplaypy.com
from bs4 import BeautifulSoup
import requests
import re
import urllib2
import os
import numpy as np
def get_soup(url):
return BeautifulSoup(requests.get(url).text)
image_type = “action movies”
query = “movie 2014 action movie