10 28 数据可视化自学笔记(主要是给csy的)

先谈谈  json文本文件,Douglas crockford为了寻找一种简便的数据交换格式,能够在服务器之间交换数据,提出了一种简化格式  json 。

1.并列的数据之间用逗号(,)分隔

2.映射用冒号(:)表示

3.并列数据的集合(数组)用方括号([])表示

4.映射的集合(对象)用大括号({})表示

以上四条规则,就是json格式的所有内容。

json是一种数据交换格式!!!!

接下来是作业驱动学习阶段:

综合实践 数据:

行动1.xlsx          行动2.xlsx

任务:1.删除列(空值)     2.合并数据     3.删除重复行     4.计算每一列空值数据所占的比例,并处理空值     5.增加并计算【战争持续时间】数据列     6.统计数据分布情况     7.保存文件(csv和json)

这个任务顺序是需要调整的,我做的顺序是2,3,4,1,5,6,7,

首先,导入并合并数据,合并之后总共有373列

                      

 然后是根据经度数据删除重复的行

                        

通过计算每一列的控制数据所占比例,选出需要处理的数据

 

 然后处理伤亡人数,歼灭人数,战果,用到

DataFrame.fillna(value=None, method=None, axis=None, inplace=False, limit=None, downcast=None, **kwargs)

###

      函数作用:填充缺失值

      value:需要用什么值去填充缺失值 

      axis:确定填充维度,从行开始或是从列开始

      method=ffill:用缺失值前面的一个值代替缺失值,如果axis =1,那么就是横向的前面的值替换          后面的缺失值,如果axis=0,那 么则是上面的值替换下面的缺失值。

      backfill/bfill,缺失值后面的一个值代替前面的缺失值。注意这个参数不能与value同时出现              limit:确定填充的个数,如果limit=2,则只填充两个缺失值。

### 

 

 关于第五问,有几种实现函数:直接赋值、df.apply、df.assign,这里就直接赋值了

 

                     

                           然后是统计数据分布情况

卷王们都做了地图的可视化,那么,我也操作操作。(有点拉跨了)

 

 

 

 

 

 把世界各地发生的交战显示出来了,然后就是看图说话?

 接下来,

 

 

 太晚了,先睡了

 

 

 

 

 

 

 

 

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

carrymybaby

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值