【医学图像预处理】

我不学机器也不学

已于 2023-11-22 18:40:11 修改

阅读量132

点赞数

分类专栏： med_image 文章标签：图像处理人工智能

于 2023-01-10 19:28:49 首次发布

本文链接：https://blog.csdn.net/weixin_46507502/article/details/128634964

版权

med_image 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

数据预处理

1 dicm数据变为jpeg或者ndarray
2 对文件夹的自动索引
3 关于pydicom的使用

1 dicm数据变为jpeg或者ndarray

这里使用的是pydicom函数库，但是也可以考虑使用simpleitk

    im = pydicom.dcmread(Database +'/'+name)
    im = im.pixel_array.astype(float)
    
    rescaled_image = (np.maximum(im,0)/im.max())*255 # float pixels
    
    final_image = np.uint8(rescaled_image) # integers pixels
    final_image = Image.fromarray(final_image)

2 对文件夹的自动索引

os.walk可以循环调用，直至读到文件
os.listdir只读到下一级文件夹，不会越级
os.path.join()可以进行路径合成，但是一般的加操作好像也是可以的
glob.glob可以使用正则表达式匹配
关于文件名的排序，可以使用sort：
f get_sort_key(string):
return int(re.search(r’\d+', string).group(0))
sorted_list = sorted(original_list, key=get_sort_key)

同时，实现对特定命名规则的文件间读取可以使用正则表达式：

#获取当前目录下的所有文件和文件夹的名称
dirs = os.listdir()

#使用正则表达式筛选出符合命名规则的文件夹
pattern = re.compile(r’^\d’)
selected_dirs = [d for d in dirs if pattern.match(d)]

#打印出结果
print(selected_dirs)

以下是通用的

def get_names_of_imgs_inside_folder(directory):
    names = []
    #basepth=os.listdir(directory)
    for root, dirnames, filenames in os.walk(directory):
        for filename in filenames:
            _, ext = os.path.splitext(filename) #分离扩展名  
            if ext in [".dcm"]:
                
                names.append(filename)

Database=r'/mnt/sda/data/FudanCancer/MRI'
# basepth=os.listdir(r'/mnt/sda/data/FudanCancer')
# for pth in basepth:
#Database=glob.glob('\\mnt\\sda\\data\\FudanCancer'+'\\'+pth+'\\'+'*-***-CT')
names = get_names_of_imgs_inside_folder(Database)

for name in names:
    image = convert(Database,name)
    rename=name.replace('.dcm','')
    image.save(rename+'.jpg')