先谈谈 json文本文件,Douglas crockford为了寻找一种简便的数据交换格式,能够在服务器之间交换数据,提出了一种简化格式 json 。
1.并列的数据之间用逗号(,)分隔
2.映射用冒号(:)表示
3.并列数据的集合(数组)用方括号([])表示
4.映射的集合(对象)用大括号({})表示
以上四条规则,就是json格式的所有内容。
json是一种数据交换格式!!!!
接下来是作业驱动学习阶段:
综合实践 数据:
行动1.xlsx 行动2.xlsx
任务:1.删除列(空值) 2.合并数据 3.删除重复行 4.计算每一列空值数据所占的比例,并处理空值 5.增加并计算【战争持续时间】数据列 6.统计数据分布情况 7.保存文件(csv和json)
这个任务顺序是需要调整的,我做的顺序是2,3,4,1,5,6,7,
首先,导入并合并数据,合并之后总共有373列
然后是根据经度数据删除重复的行
通过计算每一列的控制数据所占比例,选出需要处理的数据![](https://i-blog.csdnimg.cn/blog_migrate/8f4fe7f5e87b9d849158153aebf245a7.png)
然后处理伤亡人数,歼灭人数,战果,用到
DataFrame.fillna(value=None, method=None, axis=None, inplace=False, limit=None, downcast=None, **kwargs)
###
函数作用:填充缺失值
value:需要用什么值去填充缺失值
axis:确定填充维度,从行开始或是从列开始
method=ffill:用缺失值前面的一个值代替缺失值,如果axis =1,那么就是横向的前面的值替换 后面的缺失值,如果axis=0,那 么则是上面的值替换下面的缺失值。
backfill/bfill,缺失值后面的一个值代替前面的缺失值。注意这个参数不能与value同时出现 limit:确定填充的个数,如果limit=2,则只填充两个缺失值。
###
关于第五问,有几种实现函数:直接赋值、df.apply、df.assign,这里就直接赋值了
然后是统计数据分布情况
卷王们都做了地图的可视化,那么,我也操作操作。(有点拉跨了)
把世界各地发生的交战显示出来了,然后就是看图说话?
接下来,
太晚了,先睡了