024-机器学习背后的思维-针对入门小白的概念算法及工具的朴素思考

本文讨论了在机器学习中如何使用NumPy对pandas DataFrame中的数据进行简单处理,如取对数。作者指出,不同软件包间的数据交换通常不那么顺畅,但pandas和NumPy能够实现这样的交互是因为NumPy内部进行了数据转换。文章强调了数据结构在解决现实世界数字化和数据关联性问题中的重要性,并提醒读者在实际工作中重视数据的前期处理工作。
摘要由CSDN通过智能技术生成

9.2 输入数据简单处理与NumPy

数据读到 pandas 的 DataFrame 里面以后, 有时要对一个 Series中所有值做些简单 处理。 比如说,对房屋面积这个 Series 中的每个值取个对数 Log值。 这会使用另一个 Python工具包 NumPy 。

import numpy as np
np.log(area)

看到这里,一切显得那么自然,很简单吧。 我问一个问题,为什么pandas 生成的 数据 area 可以直接被另一个 NumPy工具使用? 这么说,有些小白可能不明白。 我问 一个类似的问题。 你听说 Word 软件生成的 DOCX 文件可以用PPT 软件PowerPoint打 开吗? pandas和NumPy可是两个不同的开发团队,完全不同的程序员开发的。 我在这 里其实想说的是,在大部分的软件包之间, 这种方便的数据交换方式是不存在的。1

一个最通常的回答是,它们的数据格式或数据结构不一样。 这时,我们又引出了 另一个所有程序员都耳熟能详的概念, 「数据结构(Data Structure)」。 在大学的 课程里,你可能学的知识点是下面这些: 链表、二叉树、图、排序等等。 你要仔细琢 磨的话,

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值