![](https://img-blog.csdnimg.cn/20201014180756757.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python数据分析
文章平均质量分 60
小张的Blog
这个作者很懒,什么都没留下…
展开
-
Python pandas使用小技巧(二)
大型数据集如何先随机读取1% # 使用skiprows参数,x > 0确保首行读入,np.random.rand() > 0.01 import numpy as np import pandas as pd # 假设读取的bigdata.csv文件有100G df = pd.read_csv('bigdata.csv',skiprows=lambda x: sx>0 and np.random.rand()>0.01) # 查看 df.shape() 如何通过标准差找出异常值原创 2022-01-06 10:00:35 · 1129 阅读 · 0 评论 -
Python-- pandas使用小技巧(一)
pandas使用小技巧(一) 使用map对某些列做特征工程 import pandas as pd data = { 'color':['red','blue','black','white'], 'num':[11,23,21,32] } df = pd.DataFrame(data) df # 对color列进行映射 f = {'red':1,'blue':2,'black':3,'white':4} df['color2'] = df['color'].map(f) df 使原创 2022-01-04 18:16:00 · 618 阅读 · 0 评论