9.2 输入数据简单处理与NumPy
数据读到 pandas 的 DataFrame 里面以后, 有时要对一个 Series中所有值做些简单 处理。 比如说,对房屋面积这个 Series 中的每个值取个对数 Log值。 这会使用另一个 Python工具包 NumPy 。
import numpy as np
np.log(area)
看到这里,一切显得那么自然,很简单吧。 我问一个问题,为什么pandas 生成的 数据 area 可以直接被另一个 NumPy工具使用? 这么说,有些小白可能不明白。 我问 一个类似的问题。 你听说 Word 软件生成的 DOCX 文件可以用PPT 软件PowerPoint打 开吗? pandas和NumPy可是两个不同的开发团队,完全不同的程序员开发的。 我在这 里其实想说的是,在大部分的软件包之间, 这种方便的数据交换方式是不存在的。1
一个最通常的回答是,它们的数据格式或数据结构不一样。 这时,我们又引出了 另一个所有程序员都耳熟能详的概念, 「数据结构(Data Structure)」。 在大学的 课程里,你可能学的知识点是下面这些: 链表、二叉树、图、排序等等。 你要仔细琢 磨的话,