Pandas作为数据挖掘中常见的工具,在掌握其函数使用过程中至关重要。本文将通过可视化的方式,详细讲解Pandas的各种操作。
sort_values
<code>(dogs[dogs['size'] == 'medium'] .sort_values('type') .groupby('type').median() )</code>
执行步骤:
- 筛选出size列为’medium’的部分行;
- 对行的类型进行排序;
- 按照type列进行分组,计算中位数。
selecting a column
<code>dogs['longevity']</code>
groupby + mean
<code>dogs.groupby('size').mean()</code>
执行步骤:
- 将数据按照size进行分组;
- 在分组内进行聚合操作。
grouping multiple columns
<code>dogs.groupby(['type', 'size'])</code>
groupby + multi aggregation
<code>(dogs .sort_values('size') .groupby('size')['height'] .agg(['sum', 'mean', 'std']) )</code>
执行步骤:
- 按照size列对数据进行排序;
- 按照size进行分组;
- 对分组内的height进行求和、平均值和标准差计算。
filtering for columns
<code>df.loc[:, df.loc['two'] <= 20]</code>
filtering for rows
<code>dogs.loc[(dogs['size'] == 'medium') & (dogs['longevity'] > 12), 'breed']</code>
dropping columns
<code>dogs.drop(columns=['type'])</code>
joining
<code>ppl.join(dogs)</code>
merging
<code>ppl.merge(dogs, left_on='likes', right_on='breed', how='left')</code>
pivot table
<code>dogs.pivot_table(index='size', columns='kids', values='price')</code>
melting
<code>dogs.melt()</code>
pivoting
<code>dogs.pivot(index='size', columns='kids')</code>
stacking column index
<code>dogs.stack()</code>
unstacking row index
<code>dogs.unstack()</code>
resetting index
<code>dogs.reset_index()</code>
setting index
<code>dogs.set_index('breed')</code>
通过以上内容的图解,希望您能更加深入理解Pandas的各种操作。
© 版权声明
THE END
暂无评论内容