![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据清洗
xiaosongshupy
一个爱好Python的重邮学子!愿与互联网的广大朋友一起成长!
展开
-
numpy 切片心得
对于一个二维矩阵,从中取出一个二维数组 a[1:4,2:4] 其中1:4代表从二维矩阵中取出1至3行 2:4代表从二维矩阵中取出2至3列 a[::2,::2] 即对于二维矩阵行而言,步长为2 对于二维矩阵列而言,步长也为2 np.amax(score,axis=0)求每列的最大值 axis的值为0,1,2...从矩阵的最内部不断向外增大。 np.amin(array,axis=0...原创 2018-07-20 19:07:23 · 461 阅读 · 1 评论 -
处理海量数据思想准备
一、分而治之 对于上亿数据的排序,可以先依次读取10000个数据,将其排好序后,写入对应的文件,而后,只需将每个小文件的最小值进行比较,就能将上亿数据完成排序。...原创 2018-10-04 17:06:20 · 238 阅读 · 0 评论