pandas 知识点总结(part2)

# 主要就是第六章的内容

6.1 读写文本格式的数据

        将表格型数据读取为DataFrame对象的函数

         pd.read_csv('路径',header=None)表示读取这个文件的时候没有标题

                pandas默认列名是0开始

        index_col='列名'        表示以哪一轴做索引

                如果想做层次化索引        index_col=['列名1','列名2'...]

        pd.read_table('路径',sep='正则表达式')        这样可以去掉表格中的换行符

        缺失值处理是文件解析任务中的一个重要组成部分。缺失数据经常是要么没有(空字符串),要么 用某个标记值表示。默认情况下, pandas 会用一组经常出现的标记值进行识别,比如NA及 NULL:

        pd.isnull(frame)        判断表格中某一行是否为空值,结果为布尔数组

逐块读取文本文件

        想读取几行,里面的参数nrows就等于几

                pd.read_csv('examples/ex6.csv', nrows=5)

        还有一种办法,是读取很多行,但是返回的是个迭代,不是具体的数,具体看书

                参数chunksize=行数

将数据写出到文本格式

        data.to_csv('路径')        如果sep

        

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
Pandas的重点知识点主要包括以下几个方面: 1. Pandas与NumPy的关系:Pandas是基于NumPy实现的,它们互为补充。Pandas的核心数据结构与NumPy的ndarray相似,但Pandas在数据处理方面更强大和智能,而NumPy更基础和强大。 2. 数据分析中的Data Frame操作:Data Frame是Pandas中最常用的数据结构,类似于Excel中的表格。对Data Frame进行各种操作是进行数据分析的基础操作,比如数据筛选、排序、切片等。 3. 分组聚合:利用Pandas进行数据分析时,经常需要根据某些特征将数据分组,并对每个分组进行聚合计算,如求和、计数、均值等。这种分组聚合操作可以帮助我们快速统计和分析数据。 4. Series:Series是Pandas中的一维数据结构,类似于Excel中的列。它由一组数据和与之关联的索引组成,可以对数据进行标签化的访问和操作。 总结来说,Pandas的重点知识点包括Pandas与NumPy的关系、Data Frame的操作、分组聚合以及Series的使用。掌握这些知识点可以帮助你更好地进行数据分析和处理。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [Pandas知识点超全总结](https://blog.csdn.net/Itsme_MrJJ/article/details/126101002)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值