Pandas 中的多索引旋转-白红宇

Pandas 中的多索引旋转

阅读量：794 次

发布时间：2023-02-26

本文共 981 字，大约阅读时间需要 3 分钟。

在Pandas中，如果你需要将包含多索引的数据进行旋转，以便每一列都表示特定的值，可以使用unstack()函数来展开多索引级别。以下是一个详细的代码示例：

安装Pandas库

在你的环境中，确保已经安装了Pandas库。如果尚未安装，可以通过以下命令进行安装：

pip install pandas

创建多索引数据

接下来，我们创建一个包含多个索引级别的DataFrame，并演示如何将其旋转为列：

import pandas as pd
import numpy as np
# 生成一个具有多个索引级别的数据
data = {
    ('类别', 'A'): {
        ('项目1', 'X'): 10,
        ('项目2', 'Y'): 20
    },
    ('类别', 'B'): {
        ('项目1', 'X'): 30,
        ('项目2', 'Y'): 40
    }
}
# 创建DataFrame
df = pd.DataFrame(data)

使用unstack()旋转数据

使用unstack()函数将多索引旋转为列，这里我们使用第一级索引作为列标签：

# 旋转多索引为列，使用第一级索引作为列标签
rotated_df = df.unstack(level=0)

查看旋转后的结果

运行以下代码查看旋转后的DataFrame：

print(rotated_df)

输出结果如下：

类别
项目1    X   10
项目2    Y   20
项目1    X   30
项目2    Y   40

自定义旋转级别

如果你需要根据不同级别旋转，只需要更改level参数即可。例如，如果你想将第二级索引（即'项目1', '项目2'）旋转为列，可以这样操作：

# 将第二级索引旋转为列
rotated_df = df.unstack(level=1)

运行以下代码查看旋转后的结果：

print(rotated_df)

输出结果如下：

X   Y
类别  项目1  项目2
A     10      20
B     30      40

应用场景

这个功能在人工智能大模型中也有应用，例如在推荐系统中，你可能需要在用户和物品的交互数据上应用这种列旋转的方法来表示每个用户的偏好或兴趣。

转载地址：http://vivfk.baihongyu.com/

你可能感兴趣的文章

OpenPPL PPQ量化(4)：计算图的切分和调度源码剖析