pandas的合并和重塑

  1. 使用concat函数合并两个DataFrame
    例子:
df1 = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
df2 = pd.DataFrame({'A': [7, 8, 9], 'B': [10, 11, 12]})
df_combined = pd.concat([df1, df2])
  1. 使用merge函数根据键合并两个DataFrame
    例子:
df1 = pd.DataFrame({'key': ['A', 'B', 'C'], 'value': [1, 2, 3]})
df2 = pd.DataFrame({'key': ['A', 'B', 'D'], 'value': [4, 5, 6]})
df_combined = pd.merge(df1, df2, on='key')
  1. 使用join函数根据索引合并两个DataFrame
    例子:
df1 = pd.DataFrame({'A': [1, 2, 3]}, index=['a', 'b', 'c'])
df2 = pd.DataFrame({'B': [4, 5, 6]}, index=['b', 'c', 'd'])
df_combined = df1.join(df2)
  1. 使用pivot函数进行数据透视
    例子:
df = pd.DataFrame({'A': ['foo', 'bar', 'foo', 'bar'],
                   'B': ['one', 'one', 'two', 'two'],
                   'C': [1, 2, 3, 4]})
df_pivoted = df.pivot(index='A', columns='B', values='C')
  1. 使用melt函数进行数据的“长格式”转换
    例子:
df = pd.DataFrame({'A': ['foo', 'bar'], 'B': [1, 2]})
df_melted = df.melt(id_vars='A', value_vars='B')
  1. 使用stack和unstack函数进行DataFrame和Series之间的转换
    例子:
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
stacked = df.stack()
unstacked = stacked.unstack()
  1. 使用groupby函数进行数据分组
    例子:
df = pd.DataFrame({'A': ['foo', 'bar', 'foo', 'bar'],
                   'B': ['one', 'one', 'two', 'two'],
                   'C': [1, 2, 3, 4]})
grouped = df.groupby('A').sum()
  1. 使用pivot_table函数进行透视表操作
    例子:
df = pd.DataFrame({'A': ['foo', 'bar', 'foo', 'bar'],
                   'B': ['one', 'one', 'two', 'two'],
                   'C': [1, 2, 3, 4]})
pivot_table = pd.pivot_table(df, values='C', index='A', columns='B')
  1. 使用cut函数进行数据的分箱处理
    例子:
ages = [18, 25, 30, 35, 40, 45, 50, 55, 60, 65]
bins = [18, 35, 60, 100]
labels = ['青年', '中年', '老年']
categories = pd.cut(ages, bins=bins, labels=labels)
  1. 使用get_dummies函数进行one-hot编码
    例子:
df = pd.DataFrame({'A': ['foo', 'bar', 'foo', 'bar'],
                   'B': ['one', 'one', 'two', 'two']})
one_hot_encoded = pd.get_dummies(df)

已发布

分类

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注