Spark+Python lab1

目标:Python review + Intro to PySpark

Part 1: Math review

Part 2: Numpy

求逆矩阵方法:

# Invert AAt with np.linalg.inv()
AAtInv = np.linalg.inv(AAt)

可参见资料:Numpy

Part 3: Additional NumPy and Spark linear algebra

  • 切片和重组
    重组方法:hstack(), vstack()
    zeros = np.zeros(8)
    ones = np.ones(8)

zerosThenOnes = np.hstack((zeros,ones))   # A 1 by 16 array
zerosAboveOnes = np.vstack((zeros,ones))  # A 2 by 8 array
  • PySpark’s DenseVector
    PySpark用来存放vector的对象

Part 4: Python lambda expressions

NB. lambda 表达式的参数意义一定记清楚
例子,lambda拿来给tuples进行排序:

#two ways, same result
swap1 = lambda x: (x[1],x[0])
swap2 = lambda (x0, x1): (x1, x0)
print 'swap1((1, 2)) = {0}'.format(swap1((1, 2)))
print 'swap2((1, 2)) = {0}'.format(swap2((1, 2)))

相关资料:
lambda tutorial
lambda function

Part 5: CTR data download

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值