python
文章平均质量分 70
小张的Blog
这个作者很懒,什么都没留下…
展开
-
Python pandas使用小技巧(二)
大型数据集如何先随机读取1%# 使用skiprows参数,x > 0确保首行读入,np.random.rand() > 0.01import numpy as npimport pandas as pd# 假设读取的bigdata.csv文件有100Gdf = pd.read_csv('bigdata.csv',skiprows=lambda x: sx>0 and np.random.rand()>0.01)# 查看df.shape()如何通过标准差找出异常值原创 2022-01-06 10:00:35 · 1158 阅读 · 0 评论 -
Python-- pandas使用小技巧(一)
pandas使用小技巧(一)使用map对某些列做特征工程import pandas as pddata = { 'color':['red','blue','black','white'], 'num':[11,23,21,32]}df = pd.DataFrame(data)df# 对color列进行映射f = {'red':1,'blue':2,'black':3,'white':4}df['color2'] = df['color'].map(f)df使原创 2022-01-04 18:16:00 · 624 阅读 · 0 评论 -
python内置函数万字详解
python内置函数万字详解内置函数Python解释器内置了很多函数和类型,可以在任何时候使用它们。以下按照字母表顺序列出它们。abs(x)返回一个数的绝对值。参数可以是整数、浮点数或任何实现了__abs__()的对象。如果参数是一个复数,则返回它的模。all(iterable)如果iterable的所有元素均为真值(或可迭代对象为空),则返回True,等价于:def all(iterable): for element in iterable: if not ele原创 2022-01-01 16:15:08 · 707 阅读 · 1 评论