pandas排序操作:sort_values函数入门与实战
本文介绍pandas中`sort_values`函数的排序方法,适用于DataFrame/Series数据排序。核心参数:`by`指定排序列(必填),`ascending`控制升/降序(默认升序True),`inplace`决定是否修改原数据(默认False,返回新数据)。 基础用法:单列排序,如按“语文”升序(默认)或“数学”降序;多列排序,可传入列名列表及对应升序/降序方向(如先语文升序、再数学降序)。`inplace=True`直接修改原数据,建议优先保留原数据(默认False)。 实战示例:新增“总分”列后按总分降序排序,清晰展示综合成绩排名。注意事项:多列排序需保证`by`和`ascending`列表长度一致;操作数据安全,避免意外覆盖原数据。 通过示例掌握核心参数和常见场景,排序是数据处理基础,结合后续分析(如TopN)更显重要。
阅读全文pandas数据统计:5个常用函数帮你快速掌握基础分析
pandas是Python处理表格数据的强大工具,文章介绍5个基础统计函数,助初学者快速掌握数据分析技能。 **sum()**:计算总和,自动忽略缺失值(NaN),`axis=1`可按行求和,用于统计总量(如总分)。 **mean()**:求平均值,反映集中趋势,但易受极端值影响,适合无极端值场景。 **median()**:计算中位数,抗极端值干扰,更能反映“大多数数据真实水平”。 **max()/min()**:分别返回最大/最小值,用于统计极值(如最高分、最低分)。 **describe()**:一站式统计,输出count(数量)、mean(均值)、std(标准差)、分位数等,全面了解数据分布与波动。 这些函数可回答“总量、平均、中间水平、极值”等基础问题,是数据分析的“基本功”。后续可进阶学习分组统计(groupby)等技能。
阅读全文pandas DataFrame入门:3步快速上手数据选择与筛选
本文介绍pandas DataFrame数据选择与筛选的3个核心步骤,适合初学者快速掌握。 第一步:列选择。单列用`df['列名']`返回Series,多列用`df[['列名1','列名2']]`返回DataFrame。 第二步:行选择。提供`iloc`(按位置,整数索引)和`loc`(按标签,自定义索引):`df.iloc[行范围]`或`df.loc[行标签]`。 第三步:条件筛选。单条件用`df[条件]`,多条件用`&`(且)/`|`(或)连接,每个条件需加括号。 关键提醒:多条件筛选必须用`&`/`|`代替`and`/`or`,且条件加括号。通过三步操作可完成基础数据提取,为后续分析奠基。
阅读全文