top of page

Our Dataset - COSTA 

costa.png

​資料集介紹

本研究採用之資料集為 COSTA-Dataset-v1,其為專為腦部血管分割任務所設計的公開醫學影像資料集。其資料類型為 TOF-MRA(Time-of-Flight Magnetic Resonance Angiography),具備非侵入性、高解析度的優勢,特別適用於腦血管影像分析。

 

每筆樣本包含:

 

  • 一張軸向腦部 MRA 影像

  • 一張對應的血管標註遮罩(Ground Truth)

 

資料集切分如下:

 

  • 訓練集(80%) → 用於模型參數訓練與學習

  • 驗證集(20%) → 即時監控模型表現、防止過擬合

預處理

由於原始影像為 .nii.gz 格式,不便直接訓練模型,我們先將三維影像進行最大強度投影(MIP),轉為具診斷意義的二維影像,再擷取包含血管資訊的切片並轉存為灰階 PNG 檔,尺寸統一為 512×512。為提升血管邊緣的清晰度與對比,我們進一步結合 CLAHE 對比增強與 Gamma 校正等前處理技術,減少雜訊干擾,突顯影像重點。

 

接著,所有資料依 8:2 比例切分為訓練集與驗證集,並以標準化流程確保模型訓練的穩定性與資料一致性。這些處理大幅提升模型收斂速度與分割準確性,為後續分割工作建立穩固基礎。

模型設計

本專題採用典型的 U-Net架構作為血管分割的主要模型,並結合 ResNet34作為其編碼器(encoder),以提升模型特徵提取能力與整體表現。U-Net 作為一種對稱式卷積神經網路,特別適用於醫療影像中精細結構的像素級分割任務,其跳躍連接(skip connections)能有效保留空間資訊並促進高解析重建。透過引入ResNet34 encoder,可進一步強化模型對於低對比血管結構的辨識能力。

截圖 2025-06-07 下午4.13.11.png

程式碼是使用 Python 的 segmentation_models_pytorch (smp) 套件來建立一個 U-Net 分割模型

評估指標

為了有效處理醫療影像分割中常見的類別不平衡問題,本研究選用了 Dice Loss 作為主要損失函數。Dice Loss 透過最大化預測區域與實際標註區域之間的重疊程度,能夠顯著提升模型在小範圍結構(如血管)上的敏感度與準確性。

image.png

我是個段落。按一下這裡來新增您的文字和進行編輯。這很簡單。

在模型評估方面,我們採用多項指標進行整體效能驗證,包括Dice與IoU(Intersection over Union)等,多方面評估模型在血管偵測與輪廓擷取上的表現。

iou.png
Precision.png
Recall.png
F1.png
  • Dice Score:衡量預測結果與真實遮罩的重疊程度。

  • IoU(Intersection over Union):計算交集與聯集之比,用以評估區域重疊準確度。

  • Precision(精確率):反映模型在分割「正類」時的準確性。

  • Recall(召回率):評估模型對實際正類的覆蓋能力。

  • F1 Score:綜合 Precision 與 Recall 的表現,反映模型的穩定性與實用性。

bottom of page