点击上方"数据大宇宙",设为星标,干货资料,第一时间送到!
前言
本号之前就已经有一篇文章关于探索《泰坦尼克号》的生还数据案例,文章中完全使用 Python 分析出一系列数据背后的逻辑。
但是,在探索分析中需要经常在不同维度中输出数据可视化,说实在的,我连一句代码都不想写!
今天,我使用极少量 Python 代码(就3句 pandas 相关代码) 加上 微软的商业智能分析神器 Power BI ,再次探索此数据。像侦破案件一样,一步步通过可视化动态关联图表,找到数据之间的关系。
由于文章篇幅太长,为了文章的阅读性和连贯性,因此案例分为3篇文章完成(分析,实现,思路),此文是分析篇,虽然不涉及代码和实现,但内容是3篇文章的核心。
数据说明
本文案例数据来自于一份公开的关于"泰坦尼克号遇难事件"的数据。部分记录如下图:
survived ,1:生还;2:没有生还
sex ,male:男;female:女
我很喜欢用描述来表示一份数据,这数据反应的信息, 如下,其中括号中的是对应的字段:
船上的一位乘客 jack(name)
男性(sex),20岁(age)
他拿着价值35美元(fare)船票(