数据分析一遍通之numpy -- --附带源数据

1.前言

python之所以流行,原因之一是因为,python让编程变得容易。当执行python代码时,python解释器将代码转化为计算机能理解的二进制code,并执行。当我们运行Python程序时,我们不需要担心内存如何管理, 也不需要了解处理器如何执行。python将替我们处理这些事情。

python作为一门高级语言,编写Python程序会变得特别快速,因为python解释器帮我们决定如何执行程序。相反,类似C等的低级语言, 内存管理和处理器执行操作都需要你自己定义。这就意味着,使用低级语言编程将花费更多的时间和精力,但是同样的,程序的运行也更加的有效率。

语言类型语言书写效率执行效率
高级语言Python
低级语言C

在高级语言和低级语言中选择的时候,你将面临着,是让程序书写快,还是让程序运行快。

幸运的是,有两个包:NumpyPandas,能同时满足要求。Numpy和pandas使用向量化,可以在不牺牲性能的情况下,快速编程数据分析程序。

正常的计算会通过for循环遍历,但是向量化使得计算同时进行。能使得计算速度成倍增加。

2. 创建一个Ndarray对象 

import csv
import numpy as np

# 读取csv成list of list
f = open("nyc_taxis.csv", "r")
taxi_list = list(csv.reader(f))

# 去除header
taxi_list = taxi_list[1:]

# 转换数据类型为float
converted_taxi_list = []
for row in taxi_list:
    converted_row = []
    for item in row:
        converted_row.append(float(item))
    converted_taxi_list.append(converted_row)

# 创建ndarray对象

taxi = np.array(converted_taxi_list)

3. 元素的选取

-- shape属性 

taxi.shape

-- 元素切片 

taxi[row_list, column_list] 

# eg 
row_0 = taxi[0]
rows_391_to_500 = taxi[391:501]
row_21_column_5 = taxi[21, 5]

4. 向量计算

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值