pandas中count(),value_counts(),unique)区别
count()
不管是Series还是DateFrame,两个类都有这个方法。
对于DateFrame,返回的是每一列中非空的元素的个数,可以指定是以行去统计还是以列去统计。
对于Series,返回的是Series中非空元素的个数。
对于groupby,返回的是每一组中元素的个数,这里的个数不包含空字段。
value_counts()
对于DateFrame,返回的是unique行的个数,这里的unique行指的是只要其中一个column的值不一样就算不一样的行。
对于Series,返回的是每一个unique元素的个数,也就是每一个unique的元素,它会统计它在Series中出现了多少次。
unique()
对于Series,返回的是所有unique的元素们,如果你想统计所有不一样的元素有多少个,可以统计list中元素的个数,如:
1 | len(df['a'].unique().tolist()) |