image segmentation(图像分割)中的IOU,Dice的计算

Posted on 2022-08-22 Edited on 2023-02-08 In computer vision(cv) Symbols count in article: 2.1k Reading time ≈ 2 mins.

在图像分割任务中，通常需要将loss设置成dice或者IOU的值，这里总结一下他们的使用方式：

二分类问题（mask只有0或者1）

这种task网络的最后一层通常会加sigmoid激活函数，比如unet实现中最后一层就是一个卷积层：

1	conv10 = Conv2D(1, (1, 1), activation='sigmoid')(conv9)

因此输出的feature map中每一个pixel的值就是0~1之间的值。

dice loss可以如下计算：

from keras import backend as K
from keras.losses import binary_crossentropy
from tensorflow.keras.optimizers import Adam

SMOOTH = 1.

def dice_coef(y_true, y_pred):
    y_true_f = K.flatten(y_true)
    y_pred_f = K.flatten(y_pred)
    intersection = K.sum(y_true_f * y_pred_f)
    return (2. * intersection + SMOOTH) / (K.sum(y_true_f) + K.sum(y_pred_f) + SMOOTH)

def iou_coef(y_true, y_pred, smooth=1):
    intersection = K.sum(K.abs(y_true * y_pred), axis=[1,2,3])
    union = K.sum(y_true,[1,2,3])+K.sum(y_pred,[1,2,3])-intersection
    iou = K.mean((intersection + smooth) / (union + smooth), axis=0)
    return iou
  
def bce_dice_loss(y_true, y_pred):
    return 0.5 * binary_crossentropy(y_true, y_pred) - dice_coef(y_true, y_pred) # 这里也可以用 + (1-dice_coef)


model.compile(Adam(learning_rate=1e-4),
              bce_dice_loss,
              metrics=[binary_crossentropy, dice_coef])

多分类问题（mask有除了0和1以外的其他值）

def class_wise_metrics(y_true, y_pred):
  '''
  Computes the class-wise IOU and Dice Score.

  Args:
    y_true (tensor) - ground truth label maps
    y_pred (tensor) - predicted label maps
  '''
  class_wise_iou = []
  class_wise_dice_score = []

  smoothing_factor = 0.00001

  for i in range(n_classes):
    intersection = np.sum((y_pred == i) * (y_true == i)) # 计算true positive的pixel个数
    y_true_area = np.sum((y_true == i)) # 计算pixcel=i的像素个数
    y_pred_area = np.sum((y_pred == i))
    combined_area = y_true_area + y_pred_area
    
    iou = (intersection) / (combined_area - intersection + smoothing_factor)
    class_wise_iou.append(iou)
    
    dice_score =  2 * ((intersection) / (combined_area + smoothing_factor))
    class_wise_dice_score.append(dice_score)

  return class_wise_iou, class_wise_dice_score

在上述计算过程中需要注意的是，这里的y_pred是要经过np.argmax()的：

results = model.predict(test_dataset, steps=test_steps)
print(results.shape) # (192, 64, 84, 11)

results = np.argmax(results, axis=3)

integer_slider = 105 # 取第105个图片
iou, dice_score = class_wise_metrics(np.argmax(y_true_segments[integer_slider], axis=3), results[integer_slider])