[datalab]数据分析

前言

使用GCP的datalab,把资料放在bigtable中调用,必须先把资料上传到云端硬碟,再使用bigtable汇入。

datalab中使用bigquery

  • 查看有哪些表
    %bq tables list
  • 显示表部分内容
    %bq tables view -n (table)
  • 合并两张表
    %bq query -n -Concat
    下面接要加入的表与插入的表,及所要栏位
    INSERT
    FROM
    可以用%bq dryrun -q Concat先看要用多少资源后,再execute
  • 删除表
import google.daatalab.bigquery as bq
usr = bq.Table(要删掉的表).delete()

pandas

读入pandas资料处理

query = """
			SELECT
			FROM
			"""
df = pd.read+gbq(query, project_id=" ")
df_ = df.reset_index().rename(columns={})

资料分布

分位数
APPROX_QUANTILES(栏位, 3)

save

结果存到storage中

%bq extract -f csv -H -p 'gs://路径/名.csv' -q query --verbose

读取

%gcs read --object gs://路径/.csv -v 读入后的名

使用魔术指令把storage档案读入,透过stringIO

storage

from google.datalab import Context
import google.datalab.bigquery as bq
try:
  from StringIO import StringIO
except ImportError:
  from io import BytesIO as StringIO
  
df_ft = pd.read_csv(StringIO(读入后的名))
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值