深度学习 用户画像_机器学习入门之kaggle之数据分析从业者用户画像分析

本文主要向大家介绍了机器学习入门之kaggle之数据分析从业者用户画像分析,通过具体的内容向大家展现,希望对大家学习机器学习入门有所帮助。

数据为kaggle社区发布的数据分析从业者问卷调查分析报告,其中涵盖了关于该行业不同维度的问题及调查结果。本文的目的为提取有用的数据,进行描述性展示。帮助新从业的人员更全方位地了解这个行业。

变量说明

数据中包含228个变量,提取其中的一些较有价值的变量进行描述性分析

数据处理

survey 

class(survey)

table(survey$Country) #统计每个国家参与人数

查看国家时,发现国家中中国被切分成共和国,民国,台湾,此处自行统一为中国

#将大陆,中华民国,台湾统一为中国

survey$Country 

| survey$Country==‘Republic of China‘

| survey$Country==‘Taiwan‘

,‘China‘,survey$Country)

数据描述性展示

探索数据从业者中年龄最小(中位数)的十个国家

#将数据按国家分类,并求年龄的中位数

Country_age % group_by(Country) %>%

summarise(Age_median=median(Age,na.rm = T)) %>%

arrange(Age_median)

head(Country_age)

#绘图,探索数据科学从业者年龄中位数最小的十个国家

p1 

geom_bar

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值