提升Python代码书写优雅程度的方法

图片[1]-提升Python代码书写优雅程度的方法-山海云端论坛

一些熟悉pandas的读者朋友经常会使用query()、eval()、pipe()、assign()等pandas的常用方法,书写可读性很高的链式数据分析处理代码,从而更加流畅地组织代码逻辑。但在原生Python中并没有提供类似shell中的管道操作符|、R中的管道操作符%>%等语法,也没有针对列表等数组结构的可进行链式书写的快捷方法,例如javascript中数组的map()、filter()、some()、every()等。

正所谓“标准库不够,三方库来凑”,Python原生对链式写法支持不到位没关系,我们可以使用一些简单方便且轻量的第三方库来协助我们在Python代码中实现链式写法。今天的文章中我将介绍一种简单易用的库——Pipe库,它可以帮助我们在Python中实现链式写法。

在Python中配合Pipe库实现链式写法

我们将使用到Pipe这个第三方库,它内置了很多实用的「管道操作函数」,还提供了将常规函数快捷「转换」为管道操作函数的方法。首先使用 pip install pipe 对其进行安装。

Pipe的用法非常方便,类似shell中的管道操作:以你的数组变量为起点,使用操作符|衔接Pipe内置的各个常见管道操作函数,组装起自己所需的计算步骤即可。

<code>import pipe list( range(10) | pipe.filter(lambda x: x % 2 == 0) | pipe.select(lambda x: x ** 2) )</code>
图片[2]-提升Python代码书写优雅程度的方法-山海云端论坛

因为Pipe搭建的管道默认都是惰性运算的,直接产生的结果是生成器类型,所以最外层需要套上list()来取得实际计算结果。更优雅的方式是配合pipe.Pipe(),将list()也改造为管道操作函数:

<code>from pipe import Pipe ( range(10) | pipe.filter(lambda x: x % 2 == 0) | pipe.select(lambda x: x ** 2) | Pipe(list) )</code>
图片[3]-提升Python代码书写优雅程度的方法-山海云端论坛

在上面的例子中,我们使用到了filter()select()等常见的管道操作函数,实际上Pipe库提供了丰富的管道操作函数,下面我们来展示其中一些常用的。

Pipe库中常用的管道操作函数

使用traverse()展平嵌套数组

如果你想要将任意嵌套数组结构展平,可以使用traverse()

<code>( [1, [2, 3, [4, 5]], 6, [7, 8, [9, [10, 11]]]] | pipe.traverse | Pipe(list) )</code>
图片[4]-提升Python代码书写优雅程度的方法-山海云端论坛

使用dedup()进行顺序去重

如果我们需要对包含若干重复值的数组进行去重,且希望保留原始数据的顺序,则可以使用dedup(),其还支持key参数,实现自定义去重规则:

<code>( [-1, 0, 0, 0, 1, 2, 3] | pipe.dedup | Pipe(list) ) ( [-1, 0, 0, 0, 1, 2, 3] | # 基于每个元素的绝对值进行去重 pipe.dedup(key=abs) | Pipe(list) )</code>
图片[5]-提升Python代码书写优雅程度的方法-山海云端论坛

使用filter()进行值过滤

与javascript中的filter()方法类似,filter()基于传入的lambda函数对每个元素进行条件判断,并保留结果为True的元素:

<code>( [1, 4, 3, 2, 5, 6, 8] | # 保留大于5的元素 pipe.filter(lambda x: x > 5) | Pipe(list) )</code>
图片[6]-提升Python代码书写优雅程度的方法-山海云端论坛

使用groupby()进行分组运算

groupby()功能相当于管道操作版本的itertools.groupby(),基于lambda函数运算结果对原始输入数组进行分组,通过groupby()操作后直接得到的结果是分组结果的二元组列表:

<code># 基于奇偶性进行分组 ( [1, 2, 3, 4, 5, 6, 7, 8, 9, 10] | pipe.groupby(lambda x: 'even' if x % 2 == 0 else 'odd') | Pipe(list) )</code>

使用sort()进行排序

sort()相当于内置函数sorted()的管道操作版本,同样支持keyreverse参数:

<code>( [3, 1, 4, 1, 5, 9, 2, 6, 5] | # 根据值大小降序排序 pipe.sort(reverse=True) | Pipe(list) )</code>

上述内容足以支撑大部分日常操作需求,你也可以在Pipe库的GitHub页面查看更多功能介绍。

© 版权声明
THE END
喜欢就支持一下吧
点赞6 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容