Pandas 18招:超强图解数据处理技巧!

Pandas作为数据挖掘中常见的工具,在掌握其函数使用过程中至关重要。本文将通过可视化的方式,详细讲解Pandas的各种操作。

sort_values

<code>(dogs[dogs['size'] == 'medium'] .sort_values('type') .groupby('type').median() )</code>

执行步骤:

  1. 筛选出size列为’medium’的部分行;
  2. 对行的类型进行排序;
  3. 按照type列进行分组,计算中位数。
图片[1]-Pandas 18招:超强图解数据处理技巧!-山海云端论坛
图片[2]-Pandas 18招:超强图解数据处理技巧!-山海云端论坛
图片[3]-Pandas 18招:超强图解数据处理技巧!-山海云端论坛
图片[4]-Pandas 18招:超强图解数据处理技巧!-山海云端论坛

selecting a column

<code>dogs['longevity']</code>
图片[5]-Pandas 18招:超强图解数据处理技巧!-山海云端论坛

groupby + mean

<code>dogs.groupby('size').mean()</code>

执行步骤:

  1. 将数据按照size进行分组;
  2. 在分组内进行聚合操作。
图片[6]-Pandas 18招:超强图解数据处理技巧!-山海云端论坛

grouping multiple columns

<code>dogs.groupby(['type', 'size'])</code>
图片[7]-Pandas 18招:超强图解数据处理技巧!-山海云端论坛

groupby + multi aggregation

<code>(dogs .sort_values('size') .groupby('size')['height'] .agg(['sum', 'mean', 'std']) )</code>

执行步骤:

  1. 按照size列对数据进行排序;
  2. 按照size进行分组;
  3. 对分组内的height进行求和、平均值和标准差计算。

filtering for columns

<code>df.loc[:, df.loc['two'] <= 20]</code>

filtering for rows

<code>dogs.loc[(dogs['size'] == 'medium') & (dogs['longevity'] > 12), 'breed']</code>

dropping columns

<code>dogs.drop(columns=['type'])</code>

joining

<code>ppl.join(dogs)</code>

merging

<code>ppl.merge(dogs, left_on='likes', right_on='breed', how='left')</code>

pivot table

<code>dogs.pivot_table(index='size', columns='kids', values='price')</code>

melting

<code>dogs.melt()</code>

pivoting

<code>dogs.pivot(index='size', columns='kids')</code>

stacking column index

<code>dogs.stack()</code>

unstacking row index

<code>dogs.unstack()</code>

resetting index

<code>dogs.reset_index()</code>

setting index

<code>dogs.set_index('breed')</code>

通过以上内容的图解,希望您能更加深入理解Pandas的各种操作。

© 版权声明
THE END
喜欢就支持一下吧
点赞13 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容