101个Python数据分析提速操作-基于datatable

本文介绍了Python的datatable库,作为pandas的有力竞争者,重点展示了101个常用操作,包括安装、创建Frame、数据处理、统计计算、排序、数据转换等功能,旨在帮助用户快速掌握datatable的使用。
摘要由CSDN通过智能技术生成

Python的datatable,在一定程度上不乏为pandas有力竞争者,其模仿R中data.table的核心算法和接口,致力于更快的、处理size更大的数据。 

图片

 这里分享datatable的101个常用操作 ,助快速上手datatable。

0、安装

pip install datatable

1、加载datatable、查看版本号

import datatable as dt
dt.__version__

2、三种方式创建datatable.Frame

import pandas as pd
import numpy as np
import datatable as dt

# Inputs
my_list = list('abcedfghijklmnopqrstuvwxyz')
my_arr = np.arange(26)
my_df = pd.DataFrame(dict(col1=my_list, col2=my_arr))

# Solution
dt_df1 = dt.Frame(my_list) #list创建
dt_df2 = dt.Frame(my_arr) #numpy.ndarray
dt_df3 = dt.Frame(my_df) #pandas.DataFrame
dt_df4 = dt.Frame(A=my_arr, B=my_list)

 3、读取csv文件为datatable.Frame

import datatable as dt

df = dt.fread(
    'https://raw.githubusercontent.com/selva86/datasets/master/BostonHousing.csv'
)
df.head(5)

 左下方会默认显示行列数,这是pandas不具有的~

4、 读取csv文件前5行

import datatable as dt

df = dt.fread(
    'https://raw.githubusercontent.com/selva86/datasets/master/BostonHousing.csv',
    max_nrows=5)
df

 5、为datatable.Frame新增一列

# Input
import datatable as dt

df = dt.fread(
    'https://raw.githubusercontent.com/selva86/datasets/master/BostonHousing.csv',
    max_nrows=5)

# Solution
df[:, "new_column"] = dt.Frame([1, 2, 3, 4, 5]) #新增一列new_column
df

 6、取已有列创建新列

# Input
import datatable as dt

df = dt.fread('datasets-master/BostonHousing.csv')

# Solution
df[:, "new_column"] = df[:, dt.f.age + dt.f.rad]
df.head()

 7、取已有列整数部分创建新列

# Input
import datatable as dt

df = dt.fread('datasets-master/BostonHousing.csv')
# Solution
df[:, "new_column"] = df[:, dt.int32(dt.f.dis)]
df.head(5)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值