LITTLE BY LITTLE

[4] 캐글 RSNA 2022 Cervical Spine Fracture Detection - EDA 본문

4-2/이미지 딥러닝

[4] 캐글 RSNA 2022 Cervical Spine Fracture Detection - EDA

위나 2022. 11. 8. 17:46
  1. Evaluation metric
    1. 전체 8개의 row
      1. 경추가 있으면 2, 없으면 1 부여
      2. 골절이 있으면 14, 없으면 7 부여
train shape: (2019, 9)
train bbox shape: (7217, 6)
test shape: (3, 3)
ss shape: (3, 2)
  1. Tabular data
    1. Fracture Analysis 골절 분포에 대한 분석
      1. class is balanced - there is ~ 50%-50% ratio between patients with and without fractures
      2. C7(19%) - this is the bone with the most frequent injuries
      3. C3(4%)  - this is the bone with the least number of injuries
      4. 몇몇 환자들은 두 개 이상 골절을 갖고 있음
      5. 한 환자에 여러 골절이 일어난 경우, 주로 가까이 위치한 경추가 골절된 경우가 많았음 (히트맵으로 상관계수 확인)
    2. Study ID
      1. 마지막 부분 (ex. 1.2.826.0.1.3680043.6200 => 6200) 만 unique하므로 편의를 위해서 바꾸면 좋을듯
    3. 이미지 분석
      1. DICOM
        1. 앞의 row와 column은 이미지 size
        2. Pixel Spacing : pixel size
        3. Image Position Patient : x,y,z 좌표를 알려준다. 왼쪽 상단에 위치
        4. Instance Number = Slice 넘버
      2. 이미지를 보면 어디가 경추인지 모르기 때문에, 후에 segmentation으로 경추만 추출하기
      3. Segmentation
        1. 주어진 segmentation은 nii포맷 
        2. Align orientation  (512, 512, 331) => (331, 512, 512)
        3. 경추만 추출된 모습을 볼 수 있다. 
        4. np.unique() 보면 어디 경추인지 알 수 있음
        5. 4.3%로 UNET이용, 나머지 추출하기
          1. dcm 이미지를 saggital view로 바꾸기
    4. meta data Cleaning (필요 컬럼만 추출, 나머지 drop)
      1. 이미지 사이즈는 다 동일
      2. content date 컬럼 drop
      3. 포함시켜야할 컬럼 
        1. Slice Thickness
        2. Number of slices per scan 
        3. Image Position Patient
        4. Image Orientation Patient : 방향 정렬 여부 알려줌 
    5. 질문
      1. Bounding Box 어디 쓸지
      2. UNet 쓰기 위해서 axial -> saggital view로 바꾸기
    6. 기타
      1. for the vast majority of patients with 2 fractures, the 2 fractured cervical vertebrae are next to each other => this information might be useful for postprocessing
        1. https://www.kaggle.com/code/samuelcortinhas/rnsa-2d-model-validate-pytorch
 

RNSA - 2D model [Validate] [PyTorch]

Explore and run machine learning code with Kaggle Notebooks | Using data from multiple data sources

www.kaggle.com

 

Comments