统计手机品牌的市场占有率

最新推荐文章于 2021-11-28 17:23:00 发布

masbbx123

最新推荐文章于 2021-11-28 17:23:00 发布

阅读量4k

点赞数

分类专栏：机器学习文章标签： python

本文链接：https://blog.csdn.net/masbbx123/article/details/79352486

版权

机器学习专栏收录该内容

16 篇文章 0 订阅

订阅专栏

首先在kaggle上得到一组数据，https://www.kaggle.com/c/talkingdata-mobile-user-demographics，比赛是2016年开始，所以数据估计是2015左右的。
直接下载phone_brand_device_model.csv.zip，然后统计每个手机品牌出现的次数的比例，作为市场占有率，最后绘制柱状图：

#coding=utf-8
import pandas as pd
from pandas import Series,DataFrame 
import random
import numpy as np
import time
from datetime import date
import datetime as dt
from numpy import nan as NA
from sklearn.tree import DecisionTreeRegressor  
from sklearn.ensemble import RandomForestRegressor  
from sklearn.ensemble import RandomForestClassifier
from sklearn.ensemble import GradientBoostingRegressor
from sklearn.decomposition import PCA  
from sklearn.linear_model import LogisticRegression

from sklearn import metrics
from sklearn.metrics import auc
from sklearn.preprocessing import StandardScaler

import matplotlib.pyplot as plt  

import warnings
warnings.filterwarnings("ignore")

#读取数据
gdata = pd.read_csv("phone_brand_device_model.csv",header=0)

print(gdata.shape)#观察数据情况
print(gdata.head(5))

a = gdata.phone_brand.value_counts(normalize=True)
#print(a.shape)
b = a[:10]
c = b.index
print(c)
d = b.values
print(d)

import matplotlib.pyplot as plt  

import matplotlib
matplotlib.rcParams['font.sans-serif'] = 'WenQuanYi Micro Hei'

name_list = c
num_list = d 
plt.bar(range(len(num_list)), num_list,align="center",color='rgb',tick_label=name_list)  
plt.show()