自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 问答 (1)
  • 收藏
  • 关注

原创 Python pandas使用小技巧(二)

大型数据集如何先随机读取1% # 使用skiprows参数,x > 0确保首行读入,np.random.rand() > 0.01 import numpy as np import pandas as pd # 假设读取的bigdata.csv文件有100G df = pd.read_csv('bigdata.csv',skiprows=lambda x: sx>0 and np.random.rand()>0.01) # 查看 df.shape() 如何通过标准差找出异常值

2022-01-06 10:00:35 1129

原创 Python-- pandas使用小技巧(一)

pandas使用小技巧(一) 使用map对某些列做特征工程 import pandas as pd data = { 'color':['red','blue','black','white'], 'num':[11,23,21,32] } df = pd.DataFrame(data) df # 对color列进行映射 f = {'red':1,'blue':2,'black':3,'white':4} df['color2'] = df['color'].map(f) df 使

2022-01-04 18:16:00 618

原创 python内置函数万字详解

python内置函数万字详解 内置函数 Python解释器内置了很多函数和类型,可以在任何时候使用它们。以下按照字母表顺序列出它们。 abs(x) 返回一个数的绝对值。参数可以是整数、浮点数或任何实现了__abs__()的对象。如果参数是一个复数,则返回它的模。 all(iterable) 如果iterable的所有元素均为真值(或可迭代对象为空),则返回True,等价于: def all(iterable): for element in iterable: if not ele

2022-01-01 16:15:08 699 1

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除