python 的pandas模块学习

最新推荐文章于 2024-09-15 22:31:42 发布

wangwng158

最新推荐文章于 2024-09-15 22:31:42 发布

阅读量168

点赞数

文章标签： python pandas 数据抽取

本文链接：https://blog.csdn.net/wangwng158/article/details/90742955

版权

最近编程需要用到pandas包，今天就简单分享一下自己的学习心得。分享的内容主要是pandas数据的调取。

比如我们要导入一个数据

可以使用以下代码导入数据

#!/usr/bin/env python
# -*- coding:utf-8 -*-
import pandas as pd

readspath=r"data\hetrec2011-delicious-2k\user_taggedbookmarks.dat"
reads_Data = pd.read_table(readspath,sep = '\t', engine='python')

在pd.read_table函数中间可以设置分隔符，行名字、列名等等。具体的函数大家有兴趣可以自己搜索。

导入数据之后我们要对数据进行行数据提取。如果我们要提取userID为8的数据，我们可以使用下面的代码提取数据。

Single_data=reads_Data.loc[reads_Data['userID']==8]

这里面我们主要用到的是loc函数（iloc函数也可以进行切片提取，大家有兴趣自己查资料啊~~我觉得这个没有loc好用，就不分享了！）。函数使用是loc[行数,列名]。行数列数如果是数字，要用[]括起来。比如loc[[1,3,6],[‘userID’,'tagID']]，连续的数可以这样调用loc[3:65,[‘userID’,'tagID']]。如果要根据值提取数据，就可以用上面的函数进行数据提取。如果以后还有更多知识再分享吧！