python/pandas中一行转多行（列值分割）

最新推荐文章于 2023-11-01 17:23:58 发布

还是小小白

最新推荐文章于 2023-11-01 17:23:58 发布

阅读量3.4k

点赞数 6

分类专栏： python pandas 文章标签： python

本文链接：https://blog.csdn.net/kelanj/article/details/124117687

版权

9 篇文章 2 订阅

订阅专栏

2 篇文章 1 订阅

订阅专栏

movielens中的genres列有多个值，由“|”隔开，在统计的时候需要将其分割，以便统计每个电影类型，这就涉及到python中的一行转多行了。。（不知道学名叫啥。。）

test = [{"a":1,"b":9,"genres":"Animation|Children's|Musical"},{"a":2,"b":9,"genres":"Musical|Romance"}]
test = pd.DataFrame(test)
test

test["genres"].str.split('|',expand=True).stack().reset_index(level=1,drop=True).reset_index(name='genres')

看看每一步都在干啥

（1） .str.split('|', expand=True)；分割并展开，缺失的为None

（2）.stack()；堆叠成一列

（3）.reset_index(level=1)；将序列转换成dataframe，，level也能为0，看看

后面就容易理解了。

比如：

代码：

(test.set_index("a"))["genres"].str.split('|',expand=True).stack().reset_index(level=1,drop=True).reset_index(name='genres')

(test.set_index(["a","b"]))["genres"].str.split('|',expand=True).stack().reset_index(level=2,drop=True).reset_index(name='genres')

关注

专栏目录