Powerline Segmentation using UNet++

1. TTPLA Dataset

Cấu trúc thư mục hiện tại mình đang có:

data_sample/
    im1.png
    im1.json

splitting_datatset_txt/
    test.txt 
    train.txt
    val.txt

scripts/
    xxxs.py

Trong đó data_sample sẽ chứa hình ảnh và annotation ở dưới dạng json.

File: 
    test.txt: 220 records
    train.txt: 905 records
    val.txt: 109 records 

Sum: 1234 records

Folder data_original:
    2484 records: images + json annotations => 1242 records

Redundant: 1242 - 1234 = 8 images

Tìm mối liên hệ giữa hình ảnh và json format. Sau đó tạo ground truth từ chúng xem sao !!! Gợi ý sử dụng file từ scripts á.

Kết quả đạt được:

Original	Sample	Mask (Power lines)

Kiểm tra label tạo ra được có đúng chuẩn hay không ? Tức là đọc dữ liệu ra là được bao nhiêu, mình expect là 0, 1. Thực sự thì dữ liệu đọc ra được là RGB value với line: (255, 255, 255), non-line: (0, 0, 0). Và thông qua phương thức map từ màu sang class trong DataSet của docExtractor thì sẽ chuyển sang map dạng 0, 1.
Tách hình ảnh thành kiểu cấu trúc đơn giản hơn (có thể là tương tự như là đối với DocExtractor vậy, để ta có thể tái sử dụng lại được cái loaddata của nó)

Cấu trúc dữ liệu train của DocExtractor:

DataSet
    test   
    train 
        seq1_xxxx_Labels.png
        seq1_xxxx.png
    val
        seq16_xxxx_Labels.png
        seq16_xxxx.png

Cấu trúc dữ liệu mới được tạo ra từ TTPLA dataset

TTPLA_PreprocesseData
    test 
        04_1234_Labels.png
        04_1234.jpg
    train 
        04_3456_Labels.png
        04_3456.jpg
    val
        04_789_Labels.png
        04_789.jpg

Kiểm tra số lượng hình ảnh tạo ra được, so khớp với số record ở trong mỗi file annotate về json

Test: 440 images -> 220 records
Train: 1810 images -> 905 records
Val: 218 images -> 109 records

Vậy là trong dữ liệu dư thừa ra 8 bản ghi không thuộc loại nào, bỏ qua mấy cái đó

Xây dựng mô hình cho cái thuật toán PowerLine segmentation. Tìm kiếm model thực hiện tốt điều này. Mình sẽ chọn UNET++ (backbone Resnet-34)

Xây dựng DataLoader cho segmentation task, kiểm tra chúng.
Viết script train model.
Sau khi đẩy dữ liệu full lên trên Drive, thì mình tính toán giá trị trung bình mean và std của toàn bộ dữ liệu trên đó thử: Kết quả sẽ được note ở đây:

Kết quả:

Mean: tensor([0.4616, 0.4506, 0.4154])

Std: tensor([0.2368, 0.2339, 0.2415])

Tuy nhiên, ta cũng nên thử mean và std từ ImageNet, do ta tái sử dụng lại Resnet pretrained:

Mean: [0.485, 0.456, 0.406]

Std: [0.229, 0.224, 0.225]

Suy nghĩ cách customize hàm save_checkpoint(self, val_loss, model) của thằng EarlyStopping sao cho nó sử dụng tất cả các trường như thằng docExtractor vậy:
Sử dụng earlystoping để có thể save the best model

Ý tưởng của eary stopping:

B1: Trước khi train model, khởi tạo early_stopping = EarlyStopping()

B2: Tại mỗi check point mà val_stat_interval gây ra, tính toán validation loss, sau đó record nó vào early_stopping bằng cách early_stopping(valid_loss, model)

B3: Ngay sau khi thực hiện bước 2, kiểm tra xem thử cái trạng thái của early_stopping nó như thế nào if early_stopping.early_stop:, nếu nó báo cần kết thúc thì ta kết thúc và break vòng lặp train.

Kiểm tra mật độ phân phối dữ liệu trên toàn bộ data set, dữ liệu của mình là cực kỳ imbalance:

RESULT: tensor([820755889,  17900111])
WEIGHT (1./RESULT): tensor([1.2184e-09, 5.5866e-08])

Update kết quả

Lần 1 + Lần 2 (ngày 24/06/2022)

Model được tải về máy và lưu ở thư mục FirsModel_2

Chạy Testing ở trên Colab đồng thời chạy Custom dataset của mình để xem nó thể hiện như thế nào. So sánh ở 2 tiêu chí: IoU ở tập test như thế nào
Thể hiện của nó ở tập test và tập custom như thế nào, để so sánh ra bằng hình ảnh:

So sánh trên tập Custom Dataset

FirstModel	FirstModel_2

Lần 3 (27/06/2022)

Lên Drive tải bản Lần 3 này về, clone thành một bản để backup dữ liệu.
Sau đó mới chuyển sang mục Lần 4.
Chạy ở trên local này để đánh giá thử model Lần 3 này như thế nào (Ây da, cái này có vẻ không tốt cho lắm đâu, theo cảm quan của mình thấy được là như vậy, nhưng để chắc chắn hơn thì phải chạy qua toàn bộ ảnh test để coi metric đạt được là bao nhiêu cái đã)

Test metric của lần 2

Test metric của lần 3

Vậy là lần 2 tốt hơn lần 3 á !!

Lần 4

Sau khi sửa xong chỗ update bên trong code. Mình cần phải tải cái lần 3 về, lưu thành một bản copy nữa. Sau đó sửa 2 chỗ:

Sửa trong file config trên Drive thành 17
Ở local mình dùng thằng test_torchload.py để sửa cái milestones của thằng Scheduler lại thành con 17 luôn.
Bỏ lại lên trên Drive và tiếp tục train xem thử kết quả nó như thế nào
Fail rồi, mô hình nó vẫn không chịu cập nhật learning rate khi train nữa ...
Thử sử dụng LovasLoss để tiếp tục train xem sao ! Nếu không được nữa thì phải chuyển sang hàm mục tiêu mới !!!

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Powerline Segmentation using UNet++

1. TTPLA Dataset

Update kết quả

Lần 1 + Lần 2 (ngày 24/06/2022)

Lần 3 (27/06/2022)

Lần 4

FilesExpand file tree

unet_plus_plus_experiment.md

Latest commit

History

unet_plus_plus_experiment.md

File metadata and controls

Powerline Segmentation using UNet++

1. TTPLA Dataset

Update kết quả

Lần 1 + Lần 2 (ngày 24/06/2022)

Lần 3 (27/06/2022)

Lần 4