标签 "pandas入门" 下的文章

pandas排序操作：sort_values函数入门与实战

2025-12-09 570 阅读 pandas教程 pandas sort_values 数据排序 Python数据分析 DataFrame排序 pandas入门

本文介绍pandas中`sort_values`函数的排序方法，适用于DataFrame/Series数据排序。核心参数：`by`指定排序列（必填），`ascending`控制升/降序（默认升序True），`inplace`决定是否修改原数据（默认False，返回新数据）。基础用法：单列排序，如按“语文”升序（默认）或“数学”降序；多列排序，可传入列名列表及对应升序/降序方向（如先语文升序、再数学降序）。`inplace=True`直接修改原数据，建议优先保留原数据（默认False）。实战示例：新增“总分”列后按总分降序排序，清晰展示综合成绩排名。注意事项：多列排序需保证`by`和`ascending`列表长度一致；操作数据安全，避免意外覆盖原数据。通过示例掌握核心参数和常见场景，排序是数据处理基础，结合后续分析（如TopN）更显重要。

阅读全文

pandas数据统计：5个常用函数帮你快速掌握基础分析

2025-12-09 520 阅读 pandas教程 pandas数据分析 Python数据处理 pandas统计函数数据基础分析 pandas入门

pandas是Python处理表格数据的强大工具，文章介绍5个基础统计函数，助初学者快速掌握数据分析技能。 **sum()**：计算总和，自动忽略缺失值（NaN），`axis=1`可按行求和，用于统计总量（如总分）。 **mean()**：求平均值，反映集中趋势，但易受极端值影响，适合无极端值场景。 **median()**：计算中位数，抗极端值干扰，更能反映“大多数数据真实水平”。 **max()/min()**：分别返回最大/最小值，用于统计极值（如最高分、最低分）。 **describe()**：一站式统计，输出count（数量）、mean（均值）、std（标准差）、分位数等，全面了解数据分布与波动。这些函数可回答“总量、平均、中间水平、极值”等基础问题，是数据分析的“基本功”。后续可进阶学习分组统计（groupby）等技能。

阅读全文

pandas DataFrame入门：3步快速上手数据选择与筛选

2025-12-09 565 阅读 pandas教程 pandas DataFrame教程 Python数据分析数据选择筛选 iloc loc用法 pandas入门

本文介绍pandas DataFrame数据选择与筛选的3个核心步骤，适合初学者快速掌握。第一步：列选择。单列用`df['列名']`返回Series，多列用`df[['列名1','列名2']]`返回DataFrame。第二步：行选择。提供`iloc`（按位置，整数索引）和`loc`（按标签，自定义索引）：`df.iloc[行范围]`或`df.loc[行标签]`。第三步：条件筛选。单条件用`df[条件]`，多条件用`&`（且）/`|`（或）连接，每个条件需加括号。关键提醒：多条件筛选必须用`&`/`|`代替`and`/`or`，且条件加括号。通过三步操作可完成基础数据提取，为后续分析奠基。

阅读全文