pandas的索引怎么用

  1. 通过行索引获取数据:df.loc[row]
df.loc[5]
  1. 通过列索引获取数据:df.loc[:, column]
df.loc[:, 'column_name']
  1. 通过行和列索引获取数据:df.loc[row, column]
df.loc[5, 'column_name']
  1. 通过条件筛选数据:df.loc[df[‘column_name’] > 0]
df.loc[df['column_name'] > 0]
  1. 通过位置索引获取数据:df.iloc[position]
df.iloc[5]
  1. 获取多个列的数据:df.loc[:, [‘column1’, ‘column2’]]
df.loc[:, ['column1', 'column2']]
  1. 获取多个行的数据:df.iloc[[row1, row2]]
df.iloc[[5, 10]]
  1. 获取指定行的指定列的数据:df.loc[[row1, row2], [‘column1’, ‘column2’]]
df.loc[[5, 10], ['column1', 'column2']]
  1. 通过行索引筛选数据:df.loc[df.index.isin([row1, row2])]
df.loc[df.index.isin([5, 10])]
  1. 通过条件筛选并获取指定列的数据:df.loc[df[‘column1’] > 0, ‘column2’]
df.loc[df['column1'] > 0, 'column2']
  1. 通过列索引筛选数据并获取指定行的数据:df.loc[‘row1′:’row2’, [‘column1’, ‘column2’]]
df.loc['row1':'row2', ['column1', 'column2']]
  1. 通过条件筛选数据并获取指定列的数据:df.loc[df[‘column1’] > 0, [‘column2’, ‘column3’]]
df.loc[df['column1'] > 0, ['column2', 'column3']]
  1. 通过条件筛选数据并赋予新的值:df.loc[df[‘column’] > 0, ‘column’] = new_value
df.loc[df['column'] > 0, 'column'] = new_value
  1. 通过多个条件筛选数据:df.loc[(df[‘column1’] > 0) & (df[‘column2’] < 10)]
df.loc[(df['column1'] > 0) & (df['column2'] < 10)]
  1. 复制满足条件的数据到新的DataFrame:new_df = df.loc[df[‘column’] > 0]
new_df = df.loc[df['column'] > 0]
  1. 根据指定列的值排序数据:df.sort_values(‘column’)
df.sort_values('column')
  1. 重置索引:df.reset_index()
df.reset_index()
  1. 设置新的索引:df.set_index(‘column’)
df.set_index('column')
  1. 检查是否存在缺失值:df.isnull().any()
df.isnull().any()
  1. 删除指定的行或列:df.drop([‘row1’, ‘row2’], axis=0/1)
df.drop(['row1', 'row2'], axis=0)
df.drop(['column1', 'column2'], axis=1)

已发布

分类

标签:

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注