数据科学入门~读书笔记 第一章导论

本文介绍了数据科学家如何利用Python的Counter和defaultdict函数进行数据预处理,包括计数和默认值设置。通过实例演示了如何使用解析式创建集合和字典。核心内容围绕数据清洗和Python库在实际项目中的应用。
摘要由CSDN通过智能技术生成

第一章 导论:

A data scientist is someone who extracts insights from messy data.(数据科学家是能从数据中剥离出洞见的人。)

1..

from collections import Counter #Counter 首字母要大写

Counter()函数用于对序列进行统计,返回值为一个元素类型为键值对的特殊序列。

具体参考:Python collections.Counter()用法_qwe1257的博客-CSDN博客_collections.counter 排序

2.

from collection import defaultdict

defaultdit() 函数用于创建一个value默认为给定参数类型的空字典,例如d = defaultdict(int/list/tuple/set...)分别产生一个value默认值为int(),list(),tuple(),set()的空字典。

具体参考:Python中的defaultdict方法_yeal-CSDN博客_defaultdict

3.集合、字典等在创建时也可以类似列表采用解析式的方式:如:

d = { x : y for x,y in {'a':1,'b':2}.items()}

4.for  in 循环语句中for后变量可以是若干个,与in后iteration中的每个元素要一一对应。如

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值