有研究稱,他們使用一種技術在一周內清理了 PASCAL VOC 2012 數據集中的 17120 張圖像,并發現 PASCAL 中 6.5% 的圖像有不同的錯誤(缺失標簽、類標簽錯誤等)。他們在創紀錄的時間內修復了這些錯誤,并將模型的性能提高了 13% 的 mAP。

在 Hasty 平臺上使用 AI Consensus Scoring 功能清洗 PASCAL VOC 2012;
使用 Faster R-CNN 架構在原始的 PASCAL 訓練集上訓練自定義模型;
使用相同的 Faster R-CNN 架構和參數,在清理后的 PASCAL 訓練集上準備一個自定義模型;
實驗之后,得出結論。

當 AI CS 檢測到潛在錯誤時,我們嘗試修復每張圖像上所有可能出現的這些錯誤;
我們沒有打算注釋每個可能的目標,如果注釋遺漏了一個目標,并且在前景中或在沒有縮放的情況下肉眼可見,我們就注釋它;
我們試圖讓邊界框像像素一樣完美;
我們還對部分(數據集類目標未注釋部分)進行了注釋,因為原始數據集具有它們的特性。


以 ResNet101 FPN 為骨干的更快的 R-CNN 架構;
采用 R101-FPN COCO 權值進行模型初始化;
模糊,水平翻轉,隨機剪切,旋轉和顏色抖動作為增強;
AdamW 為求解器,ReduceLROnPlateau 為調度器;
就像在其他 OD 任務中一樣,使用了損失組合(RPN Bounding Box 損失、RPN 分類損失、最終 Bounding Box 回歸損失和最終分類損失);
作為指標,我們有 COCO mAP,幸運的是,它直接在 Model Playground 中實現。




