零基础的话先看:
西瓜霜:R语言之【从安装说起&遇到问题怎么办】zhuanlan.zhihu.com正文开始。
因为数据可视化一定要用到数据,所以要先说说怎么导入数据和清洗数据。
-----------------------------导入数据--------------------------------
估计很少会有人会选择把一个一个的数据点手动录入,我就跳过这个可能性,直接讲怎么把现成的表格导入了。
现在数据表格的格式主要有两种:xlsx和csv. 虽然大部分人更熟悉前者,但熟悉编程的人大概都更多用后者一点吧。csv全程逗号分隔值(comma-separated values),其实就是xlsx的脱水版,去掉了所有的格式、图表、公式、筛选标准等等。
下图右边是我原始的xlsx文件(《哪吒之魔童降世》上映后前半个月的票房情况,高亮的是周末,原始数据是累计票房,单日票房是我用公式计算的结果)。下图左边就是原始xlsx文件保存成csv文件后再打开的样子。数据没问题,但高亮、计算公式和图表都不存在了。
“逗号分隔”的特点在excel里是看不出来的,但用记事本打开csv文件的话就很明显,如下图。
其实除了为了展示一下这些个逗号&#