pandas时间处理

  1. 将字符串转换为时间戳:使用to_datetime()函数将时间字符串转换为Unix时间戳。
   import pandas as pd
   df['timestamp'] = pd.to_datetime(df['date']).values.astype(int) // 10 ** 9
  1. 将时间戳转换为日期字符串:使用to_datetime()函数将Unix时间戳转换为日期字符串。
   import pandas as pd
   df['date'] = pd.to_datetime(df['timestamp'], unit='s').dt.strftime('%Y-%m-%d')
  1. 提取日期中的年、月、日:使用.dt.year.dt.month.dt.day属性从日期中提取年、月、日。
   import pandas as pd
   df['year'] = pd.to_datetime(df['date']).dt.year
   df['month'] = pd.to_datetime(df['date']).dt.month
   df['day'] = pd.to_datetime(df['date']).dt.day
  1. 计算日期之间的差异:使用pd.Timestamp()函数计算两个日期之间的差异。
   import pandas as pd
   start_date = pd.Timestamp('2022-01-01')
   end_date = pd.Timestamp('2022-01-10')
   diff = end_date - start_date
   print(diff.days)
  1. 提取日期中的小时、分钟、秒:使用.dt.hour.dt.minute.dt.second属性从日期中提取小时、分钟和秒。
   import pandas as pd
   df['hour'] = pd.to_datetime(df['timestamp'], unit='s').dt.hour
   df['minute'] = pd.to_datetime(df['timestamp'], unit='s').dt.minute
   df['second'] = pd.to_datetime(df['timestamp'], unit='s').dt.second
  1. 根据时间戳进行排序:使用sort_values()函数根据时间戳对数据进行排序。
   import pandas as pd
   df = df.sort_values('timestamp')
  1. 根据日期筛选数据:使用pd.to_datetime()将字符串日期转换为pandas的日期对象,并使用比较运算符进行筛选。
   import pandas as pd
   df_selected = df[pd.to_datetime(df['date']) > pd.Timestamp('2022-01-01')]
  1. 将日期设置为索引:使用set_index()函数将日期列设置为数据框的索引。
   import pandas as pd
   df = df.set_index('date')
  1. 将日期转换为指定格式的字符串:使用strftime()函数将日期转换为指定格式的字符串。
   import pandas as pd
   df['formatted_date'] = pd.to_datetime(df['date']).dt.strftime('%Y-%m-%d %H:%M:%S')
  1. 对日期进行偏移:使用pd.DateOffset()函数对日期进行偏移,例如增加或减少指定的天数。
import pandas as pd
start_date = pd.Timestamp('2022-01-01')
end_date = pd.Timestamp('2022-01-10')
diff = end_date - start_date
print(diff.days)

已发布

分类

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注