基于nanoscope模块快速提取AFM高度图像

利用nanoscope模块可以快速地将AFM成像原始数据转换为便于后续自己写代码分析的数据类型。

安装 nanoscope 模块可以使用 pip install nanoscope 命令即可。

然后这个模块附带了示例数据和代码，可以到该模块的安装目录中找到。

{anaconda3}\envs{afm}\Lib\site-packages\nanoscope

{anaconda3} 是 anaconda3 的安装目录， {afm} 是我创建的专门用于AFM成像数据分析的python虚拟环境

实际上这个部分内容要完成对AFM成像数据的预处理并导出为8-bit灰度图，具体效果如上。

获取高度数据的基础函数我已经封装如下：

1
import matplotlib.pyplot as plt
2
import numpy as np
3
from PIL import Image
4

5
def getHeightData(fp):
6
    from nanoscope import files
7
    from nanoscope.constants import METRIC
8
    data = {}
9
    with files.ImageFile(fp) as f:
10
        height = f[0]  #默认AFM成像第一个通道就是height
11
        image, ax_properties = height.create_image(METRIC)
12
        assert ax_properties['title']=='Height'
13
        data['data'] = image
14
        data['aspect_ratio'] = height.aspect_ratio
15
        data['scan_size'] = height.scan_size
16
        data['scan_size_unit'] = height.scan_size_unit
17
        data['z_sens_units'] = height.z_sens_units
18
    return data

这里面 .create_image 是 nanoscope 模块自带的方法把最原始的数值转换为了高度，高度的单位可以查看 z_sens_units，然后创建的 image，每一条 row 就是 AFM针尖扫描的 line，然后每条 line 上采样多少 number就对应了图像的 col。所以 scan_size 就对应着 x_range。然后根据 aspect_ratio（横纵比，一般为1）可以计算 y_range。

由于实际采集样品数据的类型比较单一（一般是正方形，扫描区域通常是微米级别，高度是纳米级别，可统一单位到纳米），所以进一步简化这个函数，避免各种单位判断和比例转换。

1
def getHeightData(fp):
2
    from nanoscope import files
3
    from nanoscope.constants import METRIC
4
    data = {}
5
    with files.ImageFile(fp) as f:
6
        height = f[0]
7
        image, ax_properties = height.create_image(METRIC)
8
        assert ax_properties['title']=='Height'
9
        assert abs(height.aspect_ratio-1)<0.01
10
        assert height.z_sens_units=='nm'
11
        assert height.scan_size_unit==r'µm'
12
        data['data'] = image[::-1]
13
        # y axis invert，保持和在 NanoscopeAnalysis中看到的效果一样
14
        data['row'], data['col'] = image.shape
15
        data['pixelsize'] = height.scan_size*1000/data['row']
16
    return data

需要注意的是，此时得到的高度数据没有对齐基线，所以还需要进行 flatten 处理。这里提供了两种方法。一个是 median 中值对齐方法，适用于视野中样品颗粒较低的情况。一种是 polyfit 对齐方法，一般情况下都能获得不错的抚平效果。

1
def flat_median(arr):
2
    box = []
3
    for line in arr:
4
        line_ = line - np.median(line)
5
        box.append(line_)
6
    box = np.array(box)
7
    return box
8

9
def flat_polyfit(arr, order=1):
10
    box = []
11
    for line in arr:
12
        coeff = np.polyfit(range(len(line)),
13
                           line,
14
                           order)
15
        correction = np.array(
16
        [sum([pow(i, n) * c
17
        for n, c in enumerate(reversed(coeff))])
18
        for i in range(len(line))])
19
        line_ = line - correction
20
        box.append(line_)
21
    box = np.array(box)
22
    return box

完成 AFM 高度数据的抚平之后，为了导出为图像，还需要一些工作，主要涉及高度数据到 8-bit 像素的映射，以及导出图像的 pixelsize有一个 rescale 的过程。具体函数代码如下：

1
def convert(hmap, z_range=[-10, 10]):
2
    data = hmap.copy()
3
    low, high = z_range
4
    data = (data - low)/(high - low)
5
    inds = np.where(data<0)
6
    data[inds] = 0
7
    inds = np.where(data>1)
8
    data[inds] = 1
9
    data = data*255
10
    data = data.astype('uint8')
11
    return data
12

13
def resize(data, pixelsize=2):
14
    # resize image, 1 pixel = 2 nm
15
    image = data['convert_flat_data']
16
    img = Image.fromarray(image)
17
    pixelsize0 = data["pixelsize"]
18
    width = data["col"]
19
    height = data["row"]
20
    w = int(width*pixelsize0/pixelsize)
21
    h = int(height*pixelsize0/pixelsize)
22
    img2 = img.resize((w,h))
23
    data['export_image'] = img2
24
    data["export_image_pixelsize"] = pixelsize
25
    return data

注意在这个地方，我根据实际情况，将高度映射的区间定到了 -10 到 10 nm，然后导出图像的 pixelsize 设置为了 1 pixel = 2 nm。

基于上述函数，对于单个AFM成像的原始数据，其预处理和导出函数再集成封装一下，就变成这样：

1
def single(fp, flat='median', pixelsize=2, z_range=[-10, 10]):
2
    assert fp.endswith(".spm")
3
    # 目前仅对Bruker Multimode VIII的采集到的spm数据文件进行过测试
4
    # 发现部分以 `.001`, `.002` 之类结尾的数据不能nanoscope模块不能正确解析
5
    # 后续可尝试另外一个 nanoscope 的开源项目以获得更好的兼容性
6
    # https://github.com/jmarini/nanoscope/
7
    data = getHeightData(fp)
8
    if flat=='polyfit':
9
        data['flat_data'] = flat_polyfit(data['data'])
10
    else:
11
        data['flat_data'] = flat_median(data['data'])
12
    data['convert_flat_data'] = convert(data['flat_data'],
13
                                        z_range=z_range)
14
    data = resize(data, pixelsize=pixelsize)
15
    fp2 = fp+".png"
16
    data['export_image'].save(fp2)
17
    return data

如果是要对比较多的数据文件进行批量处理，可以考虑使用 joblib 模块来并行：

1
from glob import glob
2
from joblib import Parallel, delayed
3

4
fps = glob("*.spm")
5
# 获取所有 spm 文件列表
6
flat_method='median'
7
pixelsize=2
8
z_range=[-10, 10]
9

10
res = Parallel(n_jobs=-1)\
11
      (delayed(single)(fp, flat_method, pixelsize, z_range)\
12
       for idx,fp in enumerate(fps))