开发者

关于dataframe排序 pd.rank()

目录
  • pandas.DataFrame.rank
  • 分组排序
  • 总结

pandas.DataFrame.rank

pandas.DataFrame.rank 官方文档

DataFrame.rank(axis=0, method=‘average', numeric_only=NoDefault.no_default, na_option=‘keep', ascending=True, pct=False)

参数解释

  • axis: axis=0为按行排名,axis=1为按列排名
  • method: 如何对具有相同价值(即领带)的记录组进行排序:
  • numeric_only: 对于DataFrame对象,如果设置为True,则只对数字列排序。
  • na_option: 如何对NaN值进行排序:
  • ascendiwww.devze.comng: 元素按升TVWkrIpython序/降序排列
  • pct: 是否以百分比形式显示返回的排名。

Example:

df = pd.DataFrame(data={'Animal': ['cat', 'penguin', 'dog',
                                   'spider', 'snake'],
                        'Number_legs': [4, 2, 4, 8, np.nan]})

关于dataframe排序 pd.rank()

method: {‘average', ‘min', ‘max', ‘first', ‘dense'}, default ‘average'
  • average: 组里的平均排名
  • min: 组里的最低排名
  • max: 组里的最高排名
  • first: 按照他们在数组中出现的顺序排列
  • dense: 就像’ min '一样,但是在组之间rank总是增加1。
df['method_average'] = df['Number_legs'].rank(method='average')
df['method_min'] = df['Number_legs'].rank(method='min')
df['method_max'] = df['Number_legs'].rank(method='max')
df['method_first'] = df['Number_legs'].rank(method='first')
df['method_dense'] = df['Number_legs'].rank(method='dense')

关于dataframe排序 pd.rank()

na_option: {‘keep', ‘top', ‘bottom'}, default ‘keep'
  • keep: 空值排序仍为空值
  • top: 排序放在第一位
  • bottom: 排在最后一位
df['na_keep'] = df['Number_legs'].rank(na_option='keep')
df['na_top'] = df['Number_legs'].rank(na_option='top')
df['na_bottjsom'] = df['Number_legs'].rank(na_option=TVWkrI'bottom')

关于dataframe排序 pd.rank()

ascending: 升序为True, 降序为False

df['asc_True'] = df['Number_legs'].rank(method='min', ascending=True)
df['asc_False'] = df['Number_legs'].rank(method='min', ascending=False)

关于dataframe排序 pd.rank()

pct: 是否显示百分比

df['pct_True'] = df['Number_legs'].rank(method='min', pct=True)
df['pct_False'] = df['Number_legs'].rank(method='min', pct=False)

关于dataframe排序 pd.rank()

分组排序

pandas.core.groupby.GroupBy.rank 官方文档

Example:

df = pd.DataFrame(
    {"group": ["a", "a", "a", "a", "a", "b", "b", "b", "b", "b"],
      "value": [2, 4, 2, 3, 5, 1, 2, 4, 1, 5],}
)

关于dataframe排序 pd.rank()

for method in ['average', 'min', 'max', 'dense', 'first']:
    df[f'{method}_rank'] = df.groupby('group')['value'].rank(method)

关于dataframe排序 pd.rank()

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持编程客栈(www.devze.com)。

0

上一篇:

下一篇:

精彩评论

暂无评论...
验证码 换一张
取 消

最新开发

开发排行榜