Pandas是数据处理的核心库,它不仅可以进行数据处理,还能进行简单的可视化。Pandas自带的可视化方法基于matplotlib的函数接口,通常在Jupyter中静态展示。
本次介绍一个可视化工具-LUX,它能自动地将DataFrame数据转化为统计图表,让你可以一目了然地看到相关性、分布、频率等信息。LUX在Jupyter Notebook或Lab中进行交互,图表与数据可以同步显示。
使用LUX
在导入Pandas和LUX库后,就能直接使用图表功能。以美国各大学信息表为例,加载数据后,除了显示的数据表外,你还会看到数据集上方出现一个按钮,可以进行数据/图表的交换显示。
三种类型的图表
LUX显示有三种类型的图表,分别是:相关性、直方分布、事件频次。
除了全表的可视化探索外,你还可以研究特定变量间的关系。比如,想要看SAT平均值和收入中位数的关联性,只需指定相应的变量即可。
导出图表
LUX支持图表的导出,既可以导出图表文件,也可以导出相应的matplotlib、altair代码。导出的代码可以直接运行。
安装设置
lux安装过程和其他库一样,可以通过pip或conda安装。安装完毕后,需要激活luxwidget拓展才能在Jupyter生态中显示交互式窗口。
如果你是在Jupyter Notebook或VSCode中使用,使用下面代码激活拓展:
<code>jupyter nbextension install --py luxwidget jupyter nbextension enable --py luxwidget</code>
如果你使用的是Jupyter Lab,则激活lab拓展:
<code>jupyter labextension install @jupyter-widgets/jupyterlab-manager jupyter labextension install luxwidget</code>
总结
LUX是一个强大的数据可视化分析工具,能智能地辅助Pandas进行数据探索,省去了很多不必要的操作。它提供了简单易用的接口,使得数据分析变得更加高效和直观。
暂无评论内容