XAI
XAI Method 2
<Influence function-based>
๋ง์ง๋ง์ผ๋ก ์ง๊ธ๊น์ง ๋ณธ ๊ฒ๋ค๊ณผ๋ ์ฝ๊ฐ ๋ค๋ฅธ influence function์ ๊ธฐ๋ฐํ ์ค๋ช
๋ฐฉ๋ฒ์ ์๊ฐํ๊ฒ ๋ค. ์ง๊ธ๊น์ง๋ ์ฃผ์ด์ง ํ
์คํธ ์ด๋ฏธ์ง๊ฐ ์์ผ๋ฉด ๋ชจ๋ธ์ด ์ด๋ฏธ์ง๋ฅผ ๋ถ๋ฅํ๊ณ ๊ทธ ๋ถ๋ฅ ๊ฒฐ๊ณผ์ ๋ํ ์ค๋ช
์ ํด๋น ํ
์คํธ ์ด๋ฏธ์ง์์ ํ์ด๋ผ์ดํธ ํ๋ ๋ฐฉ์์ ๋ฐฉ๋ฒ๋ค์ด์๋ค.
๊ทธ๋ฐ๋ฐ ์ด ๋ฐฉ๋ฒ์์๋, ์ฃผ์ด์ง ๋ชจ๋ธ์ด ์ด๋ค ํ์ต๋ฐ์ดํฐ๋ก๋ถํฐ ํ์ตํ ๊ฒ์ด๋ฏ๋ก ๊ทธ ๋ฐ์ดํฐ์
์ ์๋ ํธ๋ ์ด๋ ์ด๋ฏธ์ง๋ค์ ํจ์๋ผ๊ณ ๋ณผ ์ ์๊ณ , ๋ฐ๋ผ์ ๊ฐ ํ
์คํธ ์ด๋ฏธ์ง๋ฅผ ๋ถ๋ฅํ๋๋ฐ ๊ฐ์ฅ ํฐ ์ํฅ์ ๋ฏธ์น ํธ๋ ์ด๋ ์ด๋ฏธ์ง๊ฐ ํด๋น๋ถ๋ฅ์ ๋ํ ์ค๋ช
์ด๋ผ๊ณ ์ ๊ณต์ ํ๋ ๊ฒ์ด๋ค.
[Koh and Liang, Understanding black-box predictions via influence functions, ICML 2017]
์ฆ, ์ด ๊ทธ๋ฆผ์์ ์ฌ๋ฌ๊ฐ์ง ํธ๋ ์ด๋ ์ด๋ฏธ์ง๋ค์ด ์๋๋ฐ, ์ด ์ฃผ์ด์ง ํ
์คํธ ์ด๋ฏธ์ง๋ฅผ ๊ฐ์์ง๋ผ๊ณ ๋ถ๋ฅํ๋๋ฐ ์์ด์ ๊ฐ์ฅ ํฐ ์ํฅ์ ๋ฏธ์น ํธ๋ ์ด๋ ์ํ์ ์ฌ๊ธฐ ๋นจ๊ฐ์์ผ๋ก ํ์ํ ์ ๋ฉด์ ๋ฐ๋ผ๋ณด๊ณ ์๋ ๊ฐ์์ง ์ด๋ฏธ์ง๋ฅผ ๋ณด์ฌ์ฃผ๋ ๊ฒ์ด๋ค.
๊ทธ๋์ ์ด ํธ๋ ์ด๋ ์ํ ๋ณด์ฌ ์ฃผ๊ฒ ๋๋ฉด ํด๋น ํ
์คํธ์ ๋ํ ๊ฐ์ฅ ํฐ ๋์์ ์ค ํ์ต ์ด๋ฏธ์ง๋ ๊ฒ์ ๋ณด์ฌ ์ค์ผ๋ก์จ ์ค๋ช
์ ํ๊ฒ ๋๋ ๊ฒ์ด๋ค.
1) Influence function
์ด๋ฌํ ์ข
๋ฅ์ ์ค๋ช
์ ํ๊ธฐ ์ํด์ ํด๋น ๋
ผ๋ฌธ์์๋ influence function ์ด๋ผ๋ ๊ฒ์ ํ์ฉํ๊ณ ์๋๋ฐ, ๋ง์ฝ ์ด๋ค ํธ๋ ์ด๋ ์ด๋ฏธ์ง(์ฌ๊ธฐ๋ z๋ก ํ์)์์ด ๋ชจ๋ธ์ ํ๋ จ ์์ผฐ์ ๋ ํด๋น ํ
์คํธ ์ด๋ฏธ์ง์ ๋ถ๋ฅ ์ค์ฝ์ด๊ฐ ์ผ๋ง๋งํผ ๋ณํ ๊ฒ์ธ์ง๋ฅผ ๊ทผ์ฌํ๋ ํจ์๊ฐ ๋ฐ๋ก influence function์ด๋ค.
๊ทธ๋์ ๊ทธ ํจ์๊ฐ์ ๊ฐ์ง๊ณ ๊ฐ ํธ๋ ์ด๋ ์ด๋ฏธ์ง๋ง๋ค ์ด ์ํฅ๋ ฅ์ ๊ณ์ฐํ๊ณ ๊ทธ ์ํฅ๋ ฅ์ด ๊ฐ์ฅ ํฐ ์ด๋ฏธ์ง๋ฅผ ์ค๋ช
์ผ๋ก ์ ๊ณตํ๋ ๋ฐฉ์์ด๋ค.
์ด๋ฌํ influence function์ ์ด์ฉํด์ ์ผ์ชฝ ์์ ์๋ ํ
์คํธ ์ด๋ฏธ์ง๋ฅผ ๋ฌผ๊ณ ๊ธฐ๋ผ๊ณ ๋ถ๋ฅํ๋๋ฐ ์์ด์ ๊ฐ์ฅ ๋์์ ์ค ํธ๋ ์ด๋ ์ด๋ฏธ์ง๋ค์ ์ฐพ์๋ธ ์์๊ฐ ๊ทธ๋ฆผ์ ๋์์๋ค.
์ฌ๊ธฐ์๋ ๋ ๊ฐ์ง ๋ชจ๋ธ, ๊ทธ๋ฌ๋๊น ๋ ๋ฒ์งธ ํ์ ๋์ ์๋ RBF ์ปค๋์ ์ฌ์ฉํ๋ svm ๋ชจ๋ธ๊ณผ ๋ Inception์ด๋ผ๋ CNN ๋ชจ๋ธ ์์ ๋ฝ์๋ธ ํน์ง๋ค์ ๊ธฐ๋ฐํ ๋ถ๋ฅ๊ธฐ์ ๋ํ ์ค๋ช
์ ์ ๊ณตํ๊ณ ์๋ค.
๊ทธ๋ฆผ์ ๋ณด๋ฉด svm ๋ชจ๋ธ์ ๋จ์ํ ํ
์คํธ ์ด๋ฏธ์ง์ ์๊น์ด ๋น์ทํ ํธ๋ ์ด๋ ์ด๋ฏธ์ง๋ค์ ์ค์ํ๊ฒ ์ฌ์ฉํด์ ํ
์คํธ๋ฅผ ํ๊ฒ ๋๋ค. ๋ฐ๋ฉด์, ์ธ์
์
๋ชจ๋ธ์ ์ค์ ๋ก ํ
์คํธ ์ด๋ฏธ์ง์ ๋งค์ฐ ์ ์ฌํ ๊ทธ๋ฐ ๋น์ทํ ์ด๋์ด ์ฌ์ง๋ค์ด ์ค์ํ๊ฒ ํธ๋ ์ด๋ ์ด๋ฏธ์ง๋ก ์์ฉํ ๊ฒ์ ์ ์ ์๊ณ ์ด๋ฅผ ํตํด์ ์ธ์
์
๋ชจ๋ธ์ด ๋ ์ ๋๋ก ๋ ํน์ง๋ค์ ์ ๋ฝ์๋ด์ ํ์ตํ๊ณ ๋ถ๋ฅํ๊ณ ์์์ ์ ์ ์๋ค.
<Quantitative Metrics>
์ด๋ฌํ XAI๋ฐฉ๋ฒ๋ค์ ์ด๋ป๊ฒ ๋น๊ตํ๊ณ ํ๊ฐํ๋์ง, ๊ณ ์๋ ์ค๋ช
๋ฐฉ๋ฒ๋ค์ ๋ฌธ์ ์ ๋ค์ ์๋์ง ์ดํด๋ณด๊ฒ ๋ค.
์์ ๋ง์๋๋ฆฐ ๊ฒ์ฒ๋ผ ์ฌ๋ฌ ๊ฐ์ง ๋ค๋ฅธ ๋ฐฉ์์ผ๋ก ๊ณ ์๋ xai์ ๋ฐฉ๋ฒ๋ค์ด ์๋๋ฐ, ๊ณผ์ฐ ์ด๋ ๋ฐฉ๋ฒ์ด ์ข์ ์ค๋ช
๋ฐฉ๋ฒ์ธ์ง ์ด๋ฐ ๊ฒ๋ค์ ํ๊ฐ ์ดํดํ ํ์๊ฐ ์์ต๋๋ค. ํ๊ฐํ๋ ๋ฐฉ๋ฒ๋ค์ ๊ดํ ๋ด์ฉ์
๋๋ค.
1) Metrics : Human-based visual assessment
๊ฐ์ฅ ๋จผ์ ์ฝ๊ฒ ์๊ฐํ ์ ์๋ ๋ฐฉ๋ฒ์ ์ฌ๋๋ค์ด ์ง์ ์ด๋ฌํ Xai ๋ฐฉ๋ฒ๋ค์ด ๋ง๋ค์ด ๋ธ ์ค๋ช
์ ๋ณด๊ณ ๋น๊ต ํ๊ฐํ๋ ๊ฒ์
๋๋ค.
[Grad-CAM: Visual Explanations from Deep Networks via Gradient-based Localization [Ramprasaath et al., 2017]
Amazon Mechanical Turk ๊ฐ์ ๊ฒ๋ค์ ํ์ฉํด์ ์ฌ๋๋ค์๊ฒ ์ง์ ํด์ฆ๋ฅผ ๋ด๋ ๋ฐฉ์์
๋๋ค. ํ ์๋ก ์๋์ ๊ฐ์ด ์
๋ ฅ ์ด๋ฏธ์ง์ ๋ํด์ ์ด๋ค ๋ชจ๋ธ์ด ์ฌ๋์ด๋ ๋๋ ๋ง์ด๋ผ๊ณ ์์ธก์ ํ์๊ณ , ๊ทธ ์์ธก์ ๋ํ ์ค๋ช
์ ์ค๋ฅธ์ชฝ์ ๋ณด์ฌ ์ค๋๋ค.
๊ทธ๋ฌ๋ฉด ์ฌ๋๋ค์ด ๊ทธ๋ฐ ์ค๋ช
์ ๋ณด๊ณ ์ด ๋ชจ๋ธ์ด ๊ณผ์ฐ ์ด๋ค ์์ธก์ ํ์๋์ง, ๊ทธ๋ฌ๋๊น ์ด๋ค ์์ธก์ ๋ํ ์ค๋ช
์ธ์ง๋ฅผ ๋ง์ถฐ ๋ณด๋๋ก ํ๋ ๊ฒ์
๋๋ค.
๋ง์ฝ์ ์ด๋ฌํ ์ค๋ช
์ด "๋ง"์ ํ์ด๋ผ์ดํธ ํ๊ณ ์๋ค๊ณ ํ๋ฉด ์ฌ๋๋ค์ ๊ทธ ์ค๋ช
์ ๋ณด๊ณ ์๋ง๋ ์ด ๋ชจ๋ธ์ด ๋ง์ด๋ผ๊ณ ์์ธก ํ์์ ๊ฒ์ด๋ผ๊ณ ํ ๊ฒ์ด๊ณ , ๋ง์ฝ ๊ทธ๊ฒ์ด ์ง์ง ๋ง๋ ๋ชจ๋ธ ์์ธก ์ด๋ผ๋ฉด ๋ํ ์ค๋ช
์ ์ ๋ ๊ฒ์ด๋ผ๊ณ ํ ์ ์์ต๋๋ค.
์ด๋ ๊ฒ ํด์ ๋ ๊ฐ์ง ์ค๋ช
๋ฐฉ๋ฒ ์ด ์์์๋ Guided Backprop๊ณผ Guided Grad-CAM์ ์ง์ ์ ์ผ๋ก ๋น๊ตํ ์ ์์ ๊ฒ์ด๊ณ ์.
์ฌ๊ธฐ์๋ Guided grad-cam์ด๋ผ๋ ๋ฐฉ๋ฒ์ ์ค๋ช
์ ๋ณด๊ณ ์ฌ๋๋ค์ด ๋ ๋ชจ๋ธ์ ์์ธก์ ์ ๋ง์ถ์์ผ๋(61.23%) , Guided grad-cam์ด๋ผ๋ ๋ฐฉ๋ฒ์ด ๋ ์ข์ ์ค๋ช
๋ฐฉ๋ฒ์ด๋ผ๊ณ ํ ์ ์๋ ๊ฒ์
๋๋ค.
์ด๋ฌํ ์ฌ๋์ ์ง์ ์ ์ธ ํ๊ฐ๋ฅผ ์ป๋ ๋ฐฉ๋ฒ์ผ๋ก ๋ ํ๋ ๊ฐ๋ฅํ ๊ฒ์ ์์ ๊ฐ๋ค.
์ด๋ฒ์๋ ์ฃผ์ด์ง ์ด๋ฏธ์ง์ ๋ํด์ ๋ชจ๋ธ์ด ์๋ฅผ ๋ค์ด์ โ์ฌ๋โ์ด๋ผ๊ณ ์์ธก์ ํ์๋๋ฐ, ๊ทธ ์ฌ๋์ ์์ธก์ ๋ํ ๋ ๊ฐ์ง ๋ค๋ฅธ ์ค๋ช
์ ๋ณด์ฌ์ฃผ๋ ๊ฒ์ด๋ค. ๊ฐ ์ค๋ช
๋ฐฉ๋ฒ์ ๊ฒฐ๊ณผ๋ฅผ ์ผ์ชฝ์ ๋ณด์ฌ์ค์ง ์๋๋ฉด ์ค๋ฅธ์ชฝ์ ๋ณด์ฌ์ค์ง๋ ์ด๋ฏธ์ง๋ง๋ค ๋๋คํ๊ฒ ๋ณด์ฌ์ค๋ค.
๊ทธ๋ฌ๋ฉด ์ด ๋ ๊ฐ์ง ์ค๋ช
์ ๋ณด๊ณ ๊ณผ์ฐ ์ด๋ ์ชฝ ์ค๋ช
์ด ๋ ์ข์์ง ์ฌ๋๋ค์๊ฒ ๊ณ ๋ฅด๋ผ๊ณ ํ๋ ๊ฒ์ด๋ค. ์ด๋ ๊ฒ ์ง์ ๋น๊ต๋ฅผ ํตํด ์ด๋ ์ค๋ช
๋ฐฉ๋ฒ์ด ์ข์์ง ํ๊ฐ๋ฅผ ํ ์๊ฐ ์๊ฒ ๋๊ณ , ์ด ์์์์๋ ์ญ์ Guided grad-cam๋ฐฉ๋ฒ์ด ๋ ๋์ ์ ์๋ฅผ ๋ฐ์์ ์ข์ ์ค๋ช
์ด์๋ค๋ผ๊ณ ๊ฒฐ๋ก ์ ๋ด๋ฆด ์ ์์๋ค.
์ด๋ ๊ฒ ์ง์ ์ฌ๋์ด ์ค๋ช
๋ฐฉ๋ฒ๋ค์ ๋น๊ต ํ๊ฐํ๋ ๊ฒ์ ๋งค์ฐ ๊ฐ์ด ๋น์ธ๊ณ , ๋ ๊ทธ ํ๊ฐํ๋๋ฐ ์๊ฐ์ด ์ค๋ ๊ฑธ๋ฆฌ๊ฒ ๋๋ ๊ฒ์ ์ ์๊ฐ ์๋ค. ๊ทธ๋์ ์ด๋ ๊ฒ ์ง์ ๋น๊ต๋ณด๋ค๋ ์ฝ๊ฐ์ ํ๊ณ๊ฐ ์์ ์๋ ์์ง๋ง ๋ ํจ์จ์ ์ผ๋ก ์ค๋ช
๊ฐ๋ฅ ๋ฐฉ๋ฒ๋ค์ ๋น๊ตํ๊ณ ํ๊ฐํ๋ ๊ทธ๋ฐ ๋ฐฉ๋ฒ๋ค๋ ๋ง์ด ๊ณ ์๋๊ณ ์๋ค.
2) Metrics : Human annotation
์ฒซ ๋ฒ์งธ ๋ค๋ฅธ ๋ฐฉ๋ฒ์ ์ฌ๋๋ค์ด ์ด๋ฏธ ๋ง๋ค์ด ๋์ annotation ๋ฐ์ดํฐ๋ฅผ ์ด์ฉํ๋ ๊ฒ์ด๋ค. ์ฆ, object detection์ด๋ ์๋ฉํฑ ์ธ๊ทธ๋ฉํ
์ด์
๋ชจ๋ธ์ ํ์ตํ๊ธฐ ์ํ ํ์ต๋ฐ์ดํฐ์
์ผ๋ก๋ ์ค๋ฅธ์ชฝ์ ๋ณด๋ ๊ฒ์ฒ๋ผ ์ฃผ์ด์ง ์ด๋ฏธ์ง์ ๋ํ ๊ทธ ๊ฐ์ฒด์ ๋ฐ์ด๋ฉ๋ฐ์ค๋ ์๋๋ฉด ํฝ์
๋ ๋ฒจ์ ๋ ์ด๋ธ๋์ด์๋ ์๋งจํฑ ์ธ๊ทธ๋ฉํ
์ด์
๋งต์ด ์ด๋ฏธ ์ ๊ณต๋๊ณ ์๋ค.
๊ทธ๋ฌ๋ฉด ์ด๋ฐ ์ด๋
ธํ
์ด์
์ ํ์ฉํด์ ์ค๋ช
๊ฐ๋ฅ๊ธฐ๋ฒ๋ค์ ํ๊ฐํ ์ ์์ ๊ฒ์ด๊ณ , ์ฌ๊ธฐ์๋ pointing game๊ณผ weakly supervised semantic segmentation ์ด๋ผ๋ ๋ฐฉ๋ฒ์ ์๊ฐ ํ๊ฒ ๋ค.
2-1) pointing Game
[Zhang et al., Top-down Neural Attention by Excitation Backprop, IJCV 2018]
pointing game์ ๋ฐ์ด๋ฉ๋ฐ์ค๋ฅผ ํ์ฉํด์ ํ๊ฐ๋ฅผ ํ๋ ๋ฐฉ๋ฒ์ด๋ค.
์์ ์์์ ๋ณด์๋ ๊ฒ์ฒ๋ผ ๊ฐ ์ด๋ฏธ์ง i์ ๋ํ B๋ผ๊ณ ํ์ํ ๋ผ์ด๋ฉ ๋ฐ์ค๋ค์ด ์ฃผ์ด์ ธ ์์ ๋ ๊ทธ ๊ฐ๊ฐ์ ์ด๋ฏธ์ง์ ๋ํ ์ค๋ช
h๋ฅผ ๊ตฌํ๋ค๊ณ ํ๋ฉด,
Grad-CAM์ ์๋ฅผ ๋ค๋ฉด Grad-CAM์ ์ค๋ช
์ค์์ ๊ฐ์ฅ ์ค์๋๊ฐ ๋์ ํฝ์
์ ๊ตฌํ ์๊ฐ ์์ ๊ฒ์ด๋ค. ๊ทธ๋ฆฌ๊ณ ๊ทธ ํฝ์
์ ์ฌ๊ธฐ P๋ผ๊ณ ํ์ ๋ ๊ทธ P๊ฐ ์ฃผ์ด์ง ๋ฐ์ด๋ฉ๋ฐ์ค ์์ ๋ค์ด๊ฐ๋์ง๋ฅผ ๋ณด๊ณ ํ๊ฐํ๋ ๊ฒ์ด๋ค.
๊ณ ์์ด์ด๋ฏธ์ง๋ฅผ ์๋ฅผ ๋ค๋ฉด ๊ณ ์์ด์ ๋ฐ์ด๋ฉ๋ฐ์ค๊ฐ ์์ ๋, XAI๋ฐฉ๋ฒ์ด ๊ฐ์ฅ ์ค์ํ๋ค๊ณ ๋ณด์ฌ์ฃผ๋ ํฝ์
์ด ์ฌ๋์ด ๋ง๋ ๊ทธ ๋ฐ์ด๋ฉ๋ฐ์ค ์์ ์๋ค๊ณ ํ๋ค๋ฉด ์ข์ ์ค๋ช
์ด๋ผ๊ณ ํ ์ ์์ ๊ฒ์ด๋ผ๋ ๊ฐ์ ์์ ์ถ๋ฐํ๋ ๊ฒ์ด๋ค.
๊ทธ๋ ๊ฒ ๊ฐ ์ด๋ฏธ์ง๋ง๋ค ๊ฐ์ฅ ์ค๋ช
๊ฐ์ด ๋์ ํฝ์
์ด ๋ฐ์ด๋ฉ๋ฐ์ค ์์ ๋ค์ด๊ฐ๋ ์ ํ๋๋ฅผ ๊ณ์ฐํด์ ํ๊ฐ๋ฅผ ํ๋ค.
์ ํ์ ๋ณด๋ฉด ์ด๋ฐ ํฌ์ธํ
๊ฒ์ ๋ฐฉ์์ ์ด์ฉํด์ ์ค๋ช
๊ฐ๋ฅ ๋ฐฉ๋ฒ๋ค์ ์ฌ๋ฌ๋ชจ๋ธ ๊ตฌ์กฐ์ ๋ฐ์ดํฐ์
์ ๋ํด์ ํ๊ฐ ํ ๊ฒ์ ๋ณด์ฌ์ฃผ๊ณ ์๊ณ , ์ฌ๊ธฐ์๋ CAM ๋๋ RISE ๋ฐฉ์์ด ์ข์ ๊ฒฐ๊ณผ๋ฅผ ๋ณด์ฌ ์ฃผ๋ ๊ฒ์ ์ ์ ์๋ค.
์ด๋ฐ ์์ผ๋ก ์๋ก ๋ค๋ฅธ ์ค๋ช
ํ๋ ๋ฐฉ๋ฒ์ ๋น๊ตํ๊ณ ํ๊ฐํ๋ ๊ฒ์
๋๋ค.
2-2) Weakly supervised semantic segmentation
๋ ๋ฒ์งธ๋ก ์ฌ๋์ ์ด๋
ธํ
์ด์
์ ์ด์ฉํ๋ ํ๊ฐ๋ฐฉ๋ฒ์ weakly supervised semantic segmentation ๋ฐฉ๋ฒ์ด๋ค.
์ฆ, ์ด๋ค ์ด๋ฏธ์ง์ ๋ํด์ classification label๋ง ์ฃผ์ด์ ธ ์์ ๋ ๊ทธ๊ฒ์ ํ์ฉํ์ฌ ํฝ์
๋ณ๋ก ๊ฐ์ฒด์ label์ ์์ธกํ๋ ์๋ฉํฑ ์ธ๊ทธ๋ฉํ
์ด์
์ ์ํํ๋ ๋ฐฉ๋ฒ์ weakly supervised semantic segmentation์ด๋ผ๊ณ ํ๋ค. ์ด๋ weakly supervised๋ผ๊ณ ํ๋ ์ด์ ๋ ์ ๋ง ์ฐ๋ฆฌ๊ฐ ํ๊ณ ์ ํ๋ ํฝ์
๋ณ๋ก ์ ๋ต ๋ ์ด๋ธ์ด ๋ค ์ฃผ์ด์ ธ ์์ง ์๊ธฐ ๋๋ฌธ์ด๋ค.
์ด๋ classification label๋ง ์์ผ๋ฉด ๊ทธ๊ฒ์ ์ด์ฉํด์ ์ด๋ฏธ์ง ๋ถ๋ฅ๊ธฐ๋ฅผ ๋ง๋ค ์ ์๊ณ ๊ทธ์ ๋ํ ์ค๋ช
์ ๊ตฌํ ์ ์์ ๊ฒ์ด๋ค. ๊ทธ๋ ๊ฒ ๊ตฌํ๋ ์ค๋ช
, ๊ทธ๋ฌ๋๊น ์ด๋ฏธ์ง ๋ด์์ ์ค์ํ ํฝ์
๋ค์ ํ์ด๋ผ์ดํธ๋ฅผ ํ์ ๋ ์ด๋ฅผ ์ด์ฉํด์ ์ญ์ ์ ์ ํ thersholding ๋ฑ์ ํตํด ๊ฐ์ฅ ์ค๋ฅธ์ชฝ์ ์๋ ๊ฒ๊ณผ ๊ฐ์ ํฝ์
๋ณ ๋ ์ด๋ธ, ๋๋ ์ธ๊ทธ๋งจํ
์ด์
๋งต์ ๊ตฌํ ์ ์์ ๊ฒ์ด๋ค.
๊ทธ๋ ๊ฒ ๊ตฌํ ์ธ๊ทธ๋ฉํ
์ด์
์ ์ ค ์ผ์ชฝ์ ์๋ ์ ๋ต ์ธ๊ทธ๋ฉํ
์ด์
๋งต๊ณผ ๋น๊ตํด์ ํ๊ฐ๋ฅผ ํ๋ค.
์ด๋ ํ๊ฐํ๋ ๋ฉํธ๋ฆญ์ mean IOU, ์ฆ Intersection over Union์ ํ์ฉํ๋๋ฐ, ์ด๋ ์ ๋ต ๋งต๊ณผ ์ด๋ ๊ฒ ๋ง๋ค์ด ๋ธ ์ธ๊ทธ๋ฉํ
์ด์
๋งต์ด ์ผ๋ง๋ ๊ฒน์น๋์ง๋ฅผ ํ๊ฐํ๋ ๋ฉํธ๋ฆญ์ด๋ค. ๋ฉํธ๋ฆญ ๊ฐ์ ํตํด์ ์ค๋ช
๊ฐ๋ฅ ๋ฐฉ๋ฒ์ผ๋ก ๋ง๋ค์ด๋ธ ์๋งจํฑ ์ธ๊ทธ๋ฉํ
์ด์
๊ฒฐ๊ณผ๊ฐ ์ข์์๋ก ๊ทธ ์ค๋ช
๊ฐ๋ ๋ฐฉ๋ฒ์ด ๋ ์ข๋ค๋ผ๊ณ ํ๊ฐ๋ฅผ ํ๋ ๋ฐฉ์์ด๋ค.
์ด๋ฌํ ํ๊ฐ ๋ฐฉ๋ฒ๋ค์ ๋จ์ ์ ์ฌ์ ํ ์๋ง์กด ๋ฏธ์ผ๋์ปฌ ํฐ์ปค์ ๊ฐ์ด ๋งค๋ฒ ๊ฒฐ๊ณผ๋ฅผ ์ง์ ์ฌ๋์๊ฒ ๋ฌป๋ ๊ฒ๊น์ง๋ ์๋์ง๋ง ๊ทธ๋๋ ์ฌ๋์ด ์ง์ ์ ๊ณตํ ์ด๋
ธํ
์ด์
์ ํ์ฉํ๋ฏ๋ก ๊ทธ๋ฌํ ์ด๋
ธํ
์ด์
๋ฐ์ดํฐ๋ฅผ ์ป๊ธฐ๊ฐ ์ฝ์ง ์๊ณ ๋น์ธ๋ค๋๋ฐ ์๋ค.
๋, ์ด๋ฌํ ๋ฐ์ด๋ฉ๋ฐ์ค๋ ์ธ๊ทธ๋ฉํ
์ด์
๋ ์ด๋ธ์ด ๊ณผ์ฐ ์ง์ง ์ข์ ์ค๋ช
์ ๊ฐ์ ธ์ค๋ ์ ๋ต์ธ๊ฐ์ ๋ํ ๋ช
ํํ์ง ์์ ๋จ์ ์ด ์๋ค.