您现在的位置是:网站首页> 编程资料编程资料
python pandas中的agg函数用法_python_
2023-05-26
455人已围观
简介 python pandas中的agg函数用法_python_
pandas中的agg函数
python中的agg函数通常用于调用groupby()函数之后,对数据做一些聚合操作,包括sum,min,max以及其他一些聚合函数
如下所示:
>>> df = pd.read_excel(r"D:/myExcel/1.xlsx") >>> df A B C 0 bob 12 45 1 millor 15 23 2 bob 34 88 3 bob 98 23
(1)获取按A分组后B列的最大值
>>> df.groupby(by='A').agg({'B':'max'}) B A bob 98 millor 15(2)获取按A分组后B列的最大值和最小值
>>> df.groupby(by='A').agg({'B':['max','min']}) B max min A bob 98 12 millor 15 15(3)获取按A分组后B列的最大值和最小值以及C列的最大值
>>> df.groupby(by='A').agg({'B':['max','min'], 'C':'min'}) B C max min min A bob 98 12 23 millor 15 15 23(4)默认是以函数名称命名的,可以修改
>>> df.groupby(by='A').agg( b_min=pd.NamedAgg(column='B', aggfunc='min'), b_max=pd.NamedAgg(column='B', aggfunc='max')) b_min b_max A bob 12 98 millor 15 15
通常在调用完agg函数后需要reset_index,因为pandas会默认将groupby()的列也做为index传到结果中
>>> df.groupby('A').B.agg(['min', 'max']) min max A bob 12 98 millor 15 15 >>> df.groupby('A').B.agg(['min', 'max']).reset_index() A min max 0 bob 12 98 1 millor 15 15这就是python小工具关于agg函数的介绍,挺有用 的一个函数。
pandas详解 聚合运算agg()
在数据分析中,分组聚合二者缺一不可。对数据聚合(求和、平均值等)通常是不可避免的。pd.agg()很方便进行聚合操作。
1. 创建DataFrame对象
import pandas as pd df1 = pd.DataFrame({'sex':list('FFMFMMF'),'smoker':list('YNYYNYY'),'age':[21,30,17,37,40,18,26],'weight':[120,100,132,140,94,89,123]}) 
grouped = df1.groupby(['sex','smoker']) # sex有 F M 二值,smoker有 Y N 二值,故分成四组。
2. 单列聚合
grouped['age'].agg('mean') sex smoker F N 30.0 Y 28.0 M N 40.0 Y 17.5 Name: age, dtype: float64
3. 多列聚合
grouped.agg('mean') 
4. 多种聚合运算
grouped['age'].agg(['min','max'])

5. 多种聚合运算并更改列名
grouped['age'].agg([('A','mean'),('B','max')]) 
6. 不同的列运用不同的聚合函数
grouped.agg({'age':['sum','mean'], 'weight':['min','max']}) 
7. 使用自定义的聚合函数
def Max_cut_Min(group): return group.max()-group.min() grouped.agg(Max_cut_Min)

8. 方便的descibe
grouped.describe()

以上为个人经验,希望能给大家一个参考,也希望大家多多支持。
您可能感兴趣的文章:
相关内容
- Pytorch卷积神经网络resent网络实践_python_
- pandas如何统计某一列或某一行的缺失值数目_python_
- python函数运行内存时间等性能检测工具_python_
- 利用Python制作一个简单的天气播报系统_python_
- Python Word文件自动化实战之简历筛选_python_
- python根据照片获取地理位置及泄露防御_python_
- 关于Pandas count()与values_count()的用法及区别_python_
- Python+matplotlib实现折线图的美化_python_
- 使用python计算方差方式——pandas.series.std()_python_
- python标准库turtle海龟绘图实现简单奥运五环_python_
