数据清洗
xiaosongshupy
一个爱好Python的重邮学子!愿与互联网的广大朋友一起成长!
展开
-
numpy 切片心得
对于一个二维矩阵,从中取出一个二维数组a[1:4,2:4]其中1:4代表从二维矩阵中取出1至3行2:4代表从二维矩阵中取出2至3列a[::2,::2]即对于二维矩阵行而言,步长为2对于二维矩阵列而言,步长也为2np.amax(score,axis=0)求每列的最大值axis的值为0,1,2...从矩阵的最内部不断向外增大。np.amin(array,axis=0...原创 2018-07-20 19:07:23 · 471 阅读 · 1 评论 -
处理海量数据思想准备
一、分而治之 对于上亿数据的排序,可以先依次读取10000个数据,将其排好序后,写入对应的文件,而后,只需将每个小文件的最小值进行比较,就能将上亿数据完成排序。...原创 2018-10-04 17:06:20 · 247 阅读 · 0 评论