基于joblib的批处理并行加速

本文介绍一行命令加速python中for循环速度的方法。

这里以单反相机RAW格式的文件转换为JPG图像为例，介绍如何使用joblib 提供的库来加速图像批量转换。

Pasted-image-20241109093119.png-50b4bbccf3.png

现在计算机的CPU都有多个计算核心，但python的for循环默认是使用单个核心来处理。所以要加速 for 循环，一个最简单的思路就是将多个计算核心都利用起来，这就是并行处理。python中的 joblib 提供了非常方便地并行处理的方式。核心命令如下：

1
from joblib import Parallel, delayed
2

3

4

5
results = Parallel(n_jobs=-1)(delayed(func)(item) for item in box)

上面这段代码，首先是从 joblib中导入必要的对象和函数，然后具体使用时，把用户自定义的函数 func 填入 delayed 中，并且使用列表推导式的方式，对 box 中的 item 进行遍历。结合此案例中批量将 raw 文件转换为 jpg 的需求，还需要额外使用 rawpy 模块，具体的代码如下：

1
from glob import glob
2
from PIL import Image
3
import numpy as np
4
import rawpy
5
from joblib import Parallel, delayed
6
import os, time
7

8

9

10

11
def raw2jpg(fp):
12
    fp2 = fp.replace("ARW", "jpg")
13
    if not os.path.exists(fp2):
14
        file = rawpy.imread(fp)
15
        data = file.postprocess(use_camera_wb=True,
16
                                half_size=False,
17
                                no_auto_bright=True,
18
                                output_bps=16)
19
        # 直接调用postprocess可能出现偏色问题，所以要指定一些参数
20
        # https://blog.csdn.net/weixin_38342946/article/details/105789291
21
        rgb = np.float32(data / 65535 * 255)
22
        rgb = np.asarray(rgb, np.uint8)
23
        output = Image.fromarray(rgb)
24
        fp2 = fp.replace("ARW", "jpg")
25
        output.save(fp2)
26
        file.close()
27

28

29

30

31
def timer(func):
32
  '''函数装饰器，用于统计函数执行耗时'''
33
    def func_wrapper(*args, **kwargs):
34
        time_start = time.time()
35
        result = func(*args, **kwargs)
36
        time_end = time.time()
37
        time_spend = time_end - time_start
38
        print(f"{func.__name__} cost time: {time_spend:.3f} s")
39
        return result
40
    return func_wrapper
41

42

43
@timer
44
def sequential_run():
45
    fps = glob('*/*.ARW')
46
    for fp in fps:
47
        raw2jpg(fp)
48
    t1 = time.time()
49

50

51
@timer
52
def parallel_run():
53
    fps = glob('*/*.ARW')
54
    Parallel(n_jobs=-1)(delayed(raw2jpg)(fp) for fp in fps)
55
    # n_jobs=-1时，使用最大数量的CPU
56

57

58

59

60
if __name__=='__main__':
61
    # 处理7张ARW图像耗时比较
62
    # sequential_run()
63
    # sequential_run cost time: 27.351 s
64
    parallel_run()
65
    # parallel_run cost time: 4.428 s

测试机器CPU有16核心，所以并行处理时速度提升还是非常明显的。