pandas数据统计:5个常用函数帮你快速掌握基础分析
pandas是Python处理表格数据的强大工具,文章介绍5个基础统计函数,助初学者快速掌握数据分析技能。 **sum()**:计算总和,自动忽略缺失值(NaN),`axis=1`可按行求和,用于统计总量(如总分)。 **mean()**:求平均值,反映集中趋势,但易受极端值影响,适合无极端值场景。 **median()**:计算中位数,抗极端值干扰,更能反映“大多数数据真实水平”。 **max()/min()**:分别返回最大/最小值,用于统计极值(如最高分、最低分)。 **describe()**:一站式统计,输出count(数量)、mean(均值)、std(标准差)、分位数等,全面了解数据分布与波动。 这些函数可回答“总量、平均、中间水平、极值”等基础问题,是数据分析的“基本功”。后续可进阶学习分组统计(groupby)等技能。
阅读全文