- 博客(3)
- 问答 (1)
- 收藏
- 关注
原创 Python pandas使用小技巧(二)
大型数据集如何先随机读取1% # 使用skiprows参数,x > 0确保首行读入,np.random.rand() > 0.01 import numpy as np import pandas as pd # 假设读取的bigdata.csv文件有100G df = pd.read_csv('bigdata.csv',skiprows=lambda x: sx>0 and np.random.rand()>0.01) # 查看 df.shape() 如何通过标准差找出异常值
2022-01-06 10:00:35
1129
原创 Python-- pandas使用小技巧(一)
pandas使用小技巧(一) 使用map对某些列做特征工程 import pandas as pd data = { 'color':['red','blue','black','white'], 'num':[11,23,21,32] } df = pd.DataFrame(data) df # 对color列进行映射 f = {'red':1,'blue':2,'black':3,'white':4} df['color2'] = df['color'].map(f) df 使
2022-01-04 18:16:00
618
原创 python内置函数万字详解
python内置函数万字详解 内置函数 Python解释器内置了很多函数和类型,可以在任何时候使用它们。以下按照字母表顺序列出它们。 abs(x) 返回一个数的绝对值。参数可以是整数、浮点数或任何实现了__abs__()的对象。如果参数是一个复数,则返回它的模。 all(iterable) 如果iterable的所有元素均为真值(或可迭代对象为空),则返回True,等价于: def all(iterable): for element in iterable: if not ele
2022-01-01 16:15:08
699
1
空空如也
SQL怎么实现这个要求?
2022-01-06
TA创建的收藏夹 TA关注的收藏夹
TA关注的人