本文介绍了如何使用Python语言处理一个文件夹下的大量栅格遥感影像文件,并根据它们的文件名,分别创建指定名称的新文件夹,并将对应的栅格遥感影像文件复制到不同的新文件夹中的方法。
首先,让我们来看看本文需要实现的需求。一个文件夹中包含大量.tif格式的栅格遥感影像文件,以及.xml、ovr等格式的遥感影像辅助信息文件,如下图所示。
每个遥感影像文件的文件名中都带有一个表示其编号的字段。我们希望根据这个编号字段,将具有相同编号的栅格遥感影像文件及其对应的辅助信息文件复制到一个结果文件夹中。这个结果文件夹如下图所示。
结果文件夹包含多个不同编号的子文件夹,这个编号就是栅格遥感影像所带编号的字段。例如,我们希望将所有文件名称中带有15字段的栅格遥感影像文件及其辅助信息文件复制到结果文件夹中名称为15的子文件夹中,以此类推。
知道了具体需求,我们即可开始代码的编写。本文所用到的代码如下所示。
# -*- coding: utf-8 -*-
"""
Created on Mon Feb 13 20:25:04 2023
@author: fkxxgis
"""
import os
import re
import shutil
tif_file_path = r"E:\02_Project\01_Chlorophyll\Fishnet\Result"
result_file_path = r"E:\02_Project\01_Chlorophyll\Fishnet\ResultFolder"
file_list = os.listdir(tif_file_path)
for file in file_list:
file_id_suffix = file.split("_")[2]
file_id = re.findall("\d+", file_id_suffix)[0]
if not os.path.exists(os.path.join(result_file_path, file_id)):
os.makedirs(os.path.join(result_file_path, file_id))
print("Make " + file_id + " path.")
shutil.copy(os.path.join(tif_file_path, file), os.path.join(result_file_path, file_id, file))
其中,tif_file_path是包含原始待复制遥感影像文件的文件夹,result_file_path表示最终的结果文件夹。
代码的整体思路也非常简单。首先,我们需要导入os、re和shutil等3个Python库,分别实现系统文件遍历、字符串匹配以及遥感影像文件的复制。接着,通过os.listdir()函数遍历待复制遥感影像文件所在的文件夹,获取其中的每一个文件。这里的文件既包括.tif格式的栅格遥感影像文件,也包括.xml、ovr等格式的遥感影像辅助信息文件。
随后,处理每个文件。基于每个文件的文件名规则,通过split()函数提取表示编号的字段及其之后的内容。然后,通过re.findall()函数,使用字符串匹配的方式提取表示编号的字段(即文件名中的数字部分)。
接下来,知道了当前文件的编号,我们就可以开始复制文件。但需要注意的是,由于我们需要将每个文件都放入结果文件夹中的子文件夹,因此需要首先判断当前子文件夹是否存在。如果不存在,则需要创建这个子文件夹。这一步骤通过if判断语句及内部代码实现,通过os.path.exists()函数判断是否存在指定的子文件夹,如果不存在,则新建这个子文件夹。
随后,即可开始文件的复制工作。这一步骤通过shutil.copy()函数实现。
运行上述代码后,我们即可在结果文件夹中看到各个编号对应的子文件夹,并在子文件夹中看到这一编号对应的所有文件。如下图所示,结果文件夹中名称为15的子文件夹内,包含文件名中带有15字段的所有遥感影像文件及其对应辅助信息文件。
至此,大功告成。