XAI
XAI method
date
Jul 9, 2023
slug
xai-method
author
status
Public
tags
DeepLearning
XAI
summary
type
Post
thumbnail
category
XAI
updatedAt
Jul 9, 2023 02:35 PM
โป Outline : 5๊ฐ์ง<Salinecy map-based>1) Salinecy map-based : Simple Gradient method1-2) Examples of Simple Gradient method1-2) Strength and Weakness points of Simple Gradient method2) Salinecy map-based : SmoothGrad method2-1) Examples of SmoothGrad Method2-2) Strength and Weakness points of SmoothGrad method3) Salinecy map-based : Class Activation Map (CAM)3-1) Strength and Weakness points of CAM method4) Salinecy map-based : Grad-CAM4-1) Strength and Weakness points of Grad-CAM method<Perturbation-based>1) Perturbation based : LIME 1-1) Strength and Weakness points of LIME method2) Perturbation based : RISE2-1) ์ฅ๋จ์ of RISE<Influence function-based><Quantitative Metrics><Sanity checks / Robustness>
โป Outline : 5๊ฐ์ง
<Salinecy map-based>
Saliency map ๊ธฐ๋ฐ ๋ฐฉ๋ฒ์ Grad-CAM๊ฒฐ๊ณผ์ ๊ฐ์ด ํ๋์ ์ด๋ฏธ์ง ์ํ์ด ๋ชจ๋ธ์ ์
๋ ฅ์ผ๋ก ๋ค์ด๊ฐ๊ฒ ๋๋ฉด ์์ธก ๊ฒฐ๊ณผ์ ๋ํ ์ค๋ช
์ ํํธ๋งต๊ณผ ๊ฐ์ด ์ด๋ฏธ์ง ๋ด์์ ์ค์ํ๊ฒ ์์ฉํ ๋ถ๋ถ์ ํ์ด๋ผ์ดํธํด์ ๋ณด์ฌ์ค์ผ๋ก์จ ์ค๋ช
์ ์ ๊ณตํ๋ ๋ฐฉ๋ฒ์ด๋ค.
1) Salinecy map-based : Simple Gradient method
sliency map ๋ฐฉ๋ฒ๋ค ์ค ๊ฐ์ฅ ๊ฐ๋จํ ๋ฐฉ๋ฒ์ ์
๋ ฅ์ ๋ํ ๋ชจ๋ธ์ Gradient๋ก ์ค๋ช
์ ์ ๊ณตํ๋ ๊ฒ์ด๋ค.
์๋ฅผ ๋ค์ด, ์์ ์์์ ์๋ ๋ผ๋ ์ด๋ฏธ์ง๊ฐ ๋ผ๋ ํจ์์ ์
๋ ฅ์ผ๋ก ๋ค์ด๊ฐ์ ์ถ๋ ฅ์ด ๊ณ์ฐ๋์์ ๋, ๊ทธ ์ถ๋ ฅ๊ฐ์ด ์
๋ ฅ ์ด๋ฏธ์ง์ ๊ฐ ํฝ์
์ ๋ํ gradient๋ฅผ ๊ตฌํ์ฌ, ๊ทธ ๊ตฌํ ๊ฐ์ ๊ฐ ํฝ์
์ ์ค์๋๋ก ํด์ํ๋ค.
์ด ๋ฐฉ๋ฒ์ด ํ๋นํ ์ด์ ๋ gradient๋ผ๋ ๊ฒ์ด ๊ฐ ํฝ์
์ ๊ฐ์ด ์กฐ๊ธ ๋ฐ๋์์ ๋, ํจ์์ ์ถ๋ ฅ๊ฐ์ด ์ผ๋ง๋ ๋นจ๋ฆฌ ๋ณํ๋์ง๋ฅผ ๊ตฌํ๋ ๊ฐ์ด๊ธฐ ๋๋ฌธ์ Gradient๊ฐ ํฌ๋ค๋ฉด ํด๋น ํฝ์
์ด ์ถ๋ ฅ๊ฐ์ ์ํฅ์ ๋ง์ด ๋ฏธ์น๋ ๊ฒ์ด๋ฏ๋ก ์ค์ํ๋ค๊ณ ํด์ ํ ์ ์๊ธฐ ๋๋ฌธ์ด๋ค.
๊ทธ๋ฆฌ๊ณ ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ ๊ฒฝ์ฐ back-propagation ํตํด ์ฝ๊ฒ ๊ณ์ฐํ ์ ์๊ธฐ ๋๋ฌธ์ ๊ฐ๋จํ ๊ตฌํํ ์ ์๋ ์ด์ ์ด ์กด์ฌํ๋ค.
1-2) Examples of Simple Gradient method
gradient ๋ฐฉ๋ฒ์ ์ด์ฉํด์ ์ฃผ์ด์ง ์
๋ ฅ ์ด๋ฏธ์ง์ ์์ธก ๊ฒฐ๊ณผ์ ๋ํ Saliency map์ ์์ ๊ทธ๋ฆผ์ฒ๋ผ ๋ณผ ์ ์๋ค.
์์ 6๊ฐ์ง ์ด๋ฏธ์ง๋ค์ ๋ํด ์ฃผ์ด์ง ๋ชจ๋ธ์ ๋ชจ๋ ์ ํํ ์ ๋ต ํด๋์ค๋ฅผ ์ฌ๋ฐ๋ฅด๊ฒ ์์ธกํ์๊ณ , ๊ทธ์ ๋ํ ์ค๋ช
(Saliency map)์ ๋ณด๋ฉด ์ ๋ต class์ ํด๋นํ๋ ๊ฐ์ฒด๋ค์ ์ ํ์ด๋ผ์ดํธํ๊ณ ์๋ ๊ฒ์ ๋ณผ ์ ์๋ค.
์ํธ, ๊ฐ์์ง, ์ด๋๊ณผ์ผ ๋ฑ ๊ฐ์ฒด๋ฅผ ์ฌ๋ฐ๋ฅธ ์์ธก์ ๋ํ ์ค๋ช
์ผ๋ก ๊ทธ ๊ฐ์ฒด๋ค์ ํ์ด๋ผ์ดํธํ๊ณ ์๋ค. ์ฆ, object๋ฅผ ์ ์ง์ด๋ด๊ณ ์๋ค.
1-2) Strength and Weakness points of Simple Gradient method
(์ฅ์ ) ๊ฐ๋จํ gradient์ ๊ธฐ๋ฐํ ์ค๋ช
๋ฐฉ๋ฒ์ ๊ณ์ฐํ๊ธฐ๊ฐ ์์ฃผ ์ฌ์ด ์ฅ์ ์ ๊ฐ์ง๊ณ ์๊ณ , ๋ ์ด๋ ์ ๋ ์ ํํ ์ค๋ช
์ ๋ง๋ค์ด ๋ผ ์ ์์์ ์ ์์์์ ๋ณด์๋ค.
๊ทธ๋ฌ๋ ์ด ๋ฐฉ๋ฒ์ ๋จ์ ๋ ์กด์ฌํ๋๋ฐ, ์ด๋ ๊ฒ gradient๋ก ๊ตฌํ ์ค๋ช
๋ค์ด ๋งค์ฐ Noisy ํ ์ ์๋ค๋ ๊ฒ์ด๋ค. ์์์ธ ์ผ์ชฝ ์๋ ๊ทธ๋ฆผ์ ๋ณด๋ฉด ์ด๋ฏธ์ง์ ์ํ์ค์ธ ์ด๋ค ๋น๋์ค ํ๋ ์์ ๋ํด ๋ผ๋ ๋ถ๋ฅ๊ธฐ์ ๋ํ ์ถ๋ ฅ์ ๊ทธ๋ฆผ์ ํตํด ๋ณด์ฌ ์ฃผ๊ณ ์๋ค.
์ฆ, ๊ฐ ํ๋ ์์ ๋ํ ์์ธก ๊ฒฐ๊ณผ๋ โ๋ฐ๋ฒจโ๋ก ์ผ์ ํ๊ณ , ๊ทธ ์์ธก๊ฐ๋ง ๋น๊ต์ ๋ถ๋๋ฝ๊ฒ ๋ณํ๋ ๊ฒ์ ๋ฐํด์, ์
๋ ฅ ์ด๋ฏธ์ง๋ค์ ๋ํ gradient๋ฅผ ๊ตฌํ๋ฉด ์๋ ์๋ ๊ทธ๋ฆผ(map)์ฒ๋ผ ๊ต์ฅํ Noisy ํด์ง๋ ๊ฒ์ ์ ์๊ฐ ์๋ค.
์ฆ, ๋๊ฐ์ ์์ธก ๊ฒฐ๊ณผ๋ฅผ ๊ฐ์ง ์กฐ๊ธ์ฉ ๋ณํ๋ ์ด๋ฏธ์ง๋ค์ด ์๋๋ฐ, ๊ฐ ์ด๋ฏธ์ง์ ๋ํ ์ค๋ช
(map)์ ๋ง์ด ๋ค๋ฅด๊ฒ ๋ํ๋จ์ ์ ์ ์๋ค.
๋ํ ์ค๋ฅธ์ชฝ ์์์ฒ๋ผ ์ด๋ค ์ด๋ฏธ์ง ์ ์์ฃผ ์์ ๋
ธ์ด์ฆ ์ก์ค๋ก ์ ์์ด ์ฃผ์์ ๋, ์ฌ๋ ๋์ผ๋ก ๋ณด๊ธฐ์๋ ๊ฑฐ์ ์ฐจ์ด์ ์ด ์๋ ์ด๋ฏธ์ง๋ฅผ ๊ฐ์ง๊ณ ๋ชจ๋ธ์ ์์ธก๋ ๋์ผํ๊ฒ ๋์ง๋ง ๊ทธ ์
๋ ฅ gradient๋ ๊ฐ์ด๋ฐ ์๋ ๊ทธ๋ํ plot์ฒ๋ผ ๋งค์ฐ Noisy ํ๊ฒ ๋ณํํ๋ ๊ฒ์ ๋ณผ ์๊ฐ ์๋ค.
2) Salinecy map-based : SmoothGrad method
[Smilkov, et al., Smoothgrad: removing noise by adding noise, ICML workshop, 2017]
๊ฐ๋จํ gradient ๋ฐฉ๋ฒ์ ๋จ์ ์ ๊ทน๋ณตํ๊ธฐ ์ํด ์ ์๋ ๊ฒ์ด smoothGrad๋ผ๋ ๋ฐฉ๋ฒ์ด๋ค.
๋ผ๋ ์ด๋ฏธ์ง๊ฐ ์ฃผ์ด์ก์ ๋, ์์ ๋
๋ฆฝ์ ์ธ ๊ฐ์ฐ์์๋
ธ์ด์ฆ ์ก์ค๋ก (์ก์์ผ๋ก ์ถ๊ฐ๋๋ ๊ฐ์ด ๊ฐ์ฐ์์ ํจ์ ํํ๋ฅผ ๋ฐ๋ฆ)์ ์์ด์ค ๋ค, ์
๋ ฅ gradient๋ฅผ ๊ตฌํ๋ ๊ณผ์ ์ ์ฌ๋ฌ ๋ฒ ์ํํด์ ๊ทธ gradient์ ํ๊ท ์ผ๋ก ์ค๋ช
(map๋ฑ์ผ๋ก ๋ํ๋)์ ์ ์ํ๋ ๋ฐฉ๋ฒ์ด๋ค.
์ด SmoothGrad ๋ฐฉ๋ฒ์ ์์์ ๋ณด์ ์(Gradient๊ฒฐ๊ณผ ์์)์์ ๋ณธ Noisyํ Gradient๋ค์ ๋ง์ด ์ ๊ฑฐ๋ ์๊ฐ ์๊ณ , ํ๊ท ์ผ๋ก ๋จ๋ Gradient๋ค์ด ๋ ๊นจ๋ํ ์ค๋ช
์ ์ ๊ณตํ ์ ์๊ฒ ๋๋ค.
๋
ธ์ด์ฆ๋ฅผ ์์ด์ Gradient๋ฅผ ๊ณ์ฐํ๋ ํ์๋ ๋๋ต 50ํ ์ ๋ ์งํ์ด ๋๊ณ , noise์ ํ์คํธ์ฐจ๋ ์์ ํด๋ฆฌ์คํฑํ ๋ฃฐ๋ก ์ธํด์ ์ ํด์ฃผ๊ฒ ๋๋ค.
2-1) Examples of SmoothGrad Method
Simple Gradient๋ฅผ ๋ณด์ํ ๋ฐฉ๋ฒ์ธ smoothGrad๋ฅผ ์ ์ฉํด๋ณธ ๊ฒฐ๊ณผ์ด๋ค.
๊ทธ๋ฆผ์ ์ธ ๋ฒ์งธ ์ด๋ก ๋ํ๋ ์๋ smoothGrad์ ์ค๋ช
์ด ๋ณด๋ค ๊ฐ๋จํ(simple) Gradient ๋ฐฉ๋ฒ(๋ ๋ฒ์งธ ์ด ๊ฒฐ๊ณผ)๋ณด๋ค ํจ์ฌ ๊นจ๋ํ ์ค๋ช
์ ๋ณด์ฌ์ฃผ๊ณ ์๋ ๊ฒ์ ํ์ธํ ์ ์๋ค.
ํนํ, ์ผ์ชฝ ๋ ๋ฒ์งธ ์์ด ์ด๋ฏธ์ง์ฒ๋ผ ๋ฐฐ๊ฒฝ์ด ๊ท ์ผํ ๊ฒฝ์ฐ์ ๋ ๊นจ๋ํ๊ฒ smoothGrad๊ฐ ์ ์ค๋ช
ํ๋ค. (์ฆ, ๋ฐฐ๊ฒฝ์ด ๊ท ์ผํ ๊ฒฝ์ฐ ์ค์ํ ํฝ์
๋ค์ ๋ ์ ์ก์๋ด๊ณ ์๋ ๊ฒ์ ์ ์ ์๋ค.)
2-2) Strength and Weakness points of SmoothGrad method
(์ฅ์ ) smoothGrad๋ ํ๊ท ๋ด๋ ๊ณผ์ ์ ํตํด ๋ช
ํํ ์ค๋ช
์ ์์ฑํด ๋ผ ์ ์๋ ์ฅ์ ์ด ์๊ณ , ๋ ๊ฐ๋จํ Gradient ๋ฐฉ๋ฒ๊ณผ ๊ฐ์ด ๋๋ถ๋ถ์ saliency-map ๊ธฐ๋ฐ ๋ฐฉ๋ฒ๋ค์๋ ๋์ผํ๊ฒ ์ฝ๊ฒ ์ ์ฉ์ด ๊ฐ๋ฅํ ์ฅ์ ์ด ์๋ค.
(๋จ์ ) ๋ฐ๋ฉด์, Noise๋ฅผ ์์ด ์ฃผ๊ณ ์ป๋ Gradient๋ฅผ ํ๊ท ๋ด๋ ๊ฒ์ด๊ธฐ ๋๋ฌธ์ Noise๋ฅผ ์์ด์ฃผ๋ ํ์๋งํผ ์ด๋ค ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ forward-backward propagation์ ํด์ผํ๋ฏ๋ก ๋งค์ฐ ๊ณ์ฐ ๋ณต์ก๋๊ฐ ๋์ ๋จ์ ์ ๊ฐ์ง๊ณ ์๋ ๊ฒ์ ์ ์ ์๋ค.
3) Salinecy map-based : Class Activation Map (CAM)
saliency map๊ธฐ๋ฐ์ ์ค๋ช
๊ฐ๋ฅ ๋ฐฉ๋ฒ ์ค์ ํ๋์ธ class activation map (CAP) ๋ฐฉ๋ฒ
[Zhou, Bolei, et al., Learning deep features for discriminative localization, CVPR 2016]
CAM(class activation map)์ Global Average Pooling์ด๋ผ๋ ํน์ ํ layer๋ฅผ ๋ง๋ค๊ณ ๊ทธ๊ฒ์ ํ์ฉํ์ฌ ์ค๋ช
์ ์ ๊ณตํ๋ ๋ฐฉ๋ฒ์ด๋ค.
๊ทธ๋ฆผ์์์ฒ๋ผ Convolutionalย Neural Network ๊ธฐ๋ฐ์ ๋ถ๋ฅ๊ธฐ๊ฐ ์๋ค๊ณ ํ๊ณ ์ต์ข
๋ ์ด์ด์์ n๊ฐ์ activation map์ด ๋์ค๊ณ (์ฌ๊ธฐ์ ๊ฐ activation map๋ค์ ์๊น๋ก ๊ตฌ๋ถํจ) ์ด๋ GAP ๋ ์ด์ด๋ ๊ฐ activation map์ ๋ชจ๋ Activation๋ค์ ํ๊ท ์ ๋ด๋ ์ฐ์ฐ์ ๋ปํ๋ค.
๊ทธ๋ ๊ฒ ๋๋ฉด ํ Activation๋ง๋ค ํ๋์ ์ซ์๋ฅผ ์ป๊ฒ ๋๊ณ , ๊ทธ๊ฒ์ด ์ฌ๊ธฐ ์ค๋ฅธ์ชฝ์ ๊ฐ ์๊น์ ๋๊ทธ๋ผ๋ฏธ๋ก ํ์๋์๋ค. ๊ทธ๋ ๊ฒ ๊ณ์ฐ๋ Activation map๋ณ ํ๊ท Activation์ ์ต์ข
softmax output layer(ํ๋ฅ .. ๊ฐ์ ธ์ด)๋ฅผ ๋ถ์ฌ์ ๊ฐ ํด๋์ค๋ง๋ค ํ๊ท ๋ธ Activation๋ค์ ์ ํ์ ์ผ๋ก ๊ฒฐํฉํด์ ํด๋์ค๋ณ ํ๋ฅ ์ ๊ณ์ฐํ๋ ์์ํ ๋ถ๋ฅ๊ธฐ๋ฅผ ๋ง๋ค์ด์ ํ์ต์ ํ๊ฒ ๋๋ค.
๊ทธ๋ ๊ฒ ํ์ตํ๊ฒ ๋๋ฉด ๊ทธ๋ฆผ์์ ๋ณด๋ ๊ฒ์ฒ๋ผ ๊ฐ class์ ๋ํ, ์๋ฅผ ๋ค์ด์ Australian terrier ํด๋์ค์ ๋ํ activation์ ๊ฒฐํฉํ์ฌ ์ค์ฝ์ด๋ฅผ ๊ณ์ฐํ๋ ์ ํ๊ณ์๋ค ๋ถํฐ (weight)๊น์ง ์ป๊ฒ ๋๋ค.
์ฌ๊ธฐ๊น์ง ํ๊ณ ๋ ๋ค์ CAM์ด ์ป๋ ์ค๋ช
์ ๊ทธ ์๋์ ๋ํ๋ ์๋ ๊ทธ๋ฆผ๊ณผ ๊ฐ๋ค.
ย
์ฆ, ์๋ฅผ ๋ค์ด์ ์ด๋ค ์ด๋ฏธ์ง๊ฐ CNN ์
๋ ฅ์ผ๋ก ๋ค์ด์ค๊ฒ ๋๋ฉด ๊ทธ ์ด๋ฏธ์ง์ ํด๋นํ๋ activation๋ค์ด ์ต์ข
๋ ์ด์ด์ activation map์ผ๋ก ๋ํ๋๊ฒ ๋๋ค. ์ด ๊ฐ activation map๋ค์ ์๋์ชฝ์ ํ๋์ ๋ฐฐ๊ฒฝ์ด๋ฏธ์ง์ ํ์๋์ด ์๋ค. ๊ทธ๋ ๊ฒ ์ป์ activation map๋ค์ด ์์ผ๋ฉด ์์์ ๊ตฌํ ์์ธกํ ํด๋์ค์ ๋ํ Global Average Pooling๋ณ๋ก ํ์ต์ด ๋ ~ ์ ํ์ฉํด์ ์ด activaiton map์ ๊ฒฐํฉํ๊ฒ ๋๋ค.
๊ทธ๋ ๊ฒ ์ต์ข
๊ฒฐํฉํ activaiton map์ด ์ค๋ฅธ์ชฝ์ ํํ๋์ด ์๊ณ ์ด๊ฒ์ ์๋ ์ด๋ฏธ์ง์ ๊ฒน์ณ์ ์๊ฐํ๋ฅผ ํด๋ณด๋ฉด ์ ๋ต ํด๋์ค์ธ Australian terrier๋ฅผ ์ด๋ฏธ์ง ๋ด์์ ์ ํ์ด๋ผ์ดํธ ํ๊ณ ์๋ ๊ฒ์ ์ ์ ์๋ค.
์ด๋ ๊ฒ activaiton์ ๊ฒฐํฉํ์ฌ ์ค๋ช
์ ๋ง๋๋ ๋ฐฉ๋ฒ์ ์ง๊ด์ ์ผ๋ก๋ ๋ง์ด ๋๋ค. ์ฆ, ์ด๋ค activation map์ activation์ด ํฌ๊ฒ ๋๋ค๋ ๊ฒ์ ๊ทธ map์ด ์ฃผ์ด์ง ์
๋ ฅ๊ณผ ๊ด๋ จ์ด ๋ง๋ค๋ ๋ป์ด๊ณ , ๊ทธ๊ฒ์ ๊ฒฐํฉํ๋ w๊ฐ ํฌ๋ค๋ ๊ฒ๋ ์ต์ข
๋ถ๋ฅ์ ํฐ ์ํฅ์ ์ฃผ๋ activation์ด๋ผ๋ ๋ป์ด ๋ฏ๋ก, ๊ทธ๊ฒ์ ๊ฒฐํฉํ๋ฉด ์
๋ ฅ์ ๋ํ ์์ธก์ ์ ์ค๋ช
ํ๋ ๋ฐฉ์์ด ๋๋ ๊ฒ์ด๋ค.
์ต์ข
์ ์ธ ๊ฒฐ๊ณผ๋ฅผ ์ด๋ป๊ฒ ์๊ฐํํ๋์ง ๋ณด์ฌ์ฃผ๊ณ ์๋ค. CNN์ ์ต์ข
layer ํด์๋๋ ๋ณดํต ์๋ ์ด๋ฏธ์ง ํด์๋์ ๋นํด ๋จ์ด์ง๊ฒ ๋๋ฏ๋ก upsamping์ ํตํด์ ์ต์ข
์๊ฐํ๋ฅผ ํ๋ค.
CAM์ Global Average Pooling์ ๊ฑฐ์ณ์ ์ต์ข
๋ถ๋ฅ ์ ์๋ฅผ ๊ณ์ฐํ๋ ์์ด ์์ ์ฐ์ฌ์๋ค.
์ด ์์ A๋ activation map์ด๊ณ ์์ชฝ์ ์๋ ์ Global Average Pooling ํ๋ ๊ฒ์ ํํํ๊ณ ์๋ค. ๊ฐ ํฝ์
ij์ ๋ํด์ ๋ชจ๋ activation๋ค์ ๋ํ ๋ค์์ ๊ทธ activationํฌ๊ธฐ(Z)๋ก ๋๋๋ฉด global average pooling์ ํ๋ ๊ฒ์ด๋ค.
๊ทธ๋ฌ๊ณ ๋์ , ๋ ํด๋์ค c์ ๋ํ W๋ค์ด ๊ฐ activation k๋ง๋ค ์์ด์ ์ด๋ ๊ฒ global average pooling ํ activation์ ๋ค์ ๊ฒฐํฉํด์ ์ต์ข
์ ์ Y๋ฅผ ๊ณ์ฐ ํ๋ ๊ฒ์ด๋ค.
๋ class c์ ๋ํ ์์ํ ์ค์ฝ์ด์ด๋ค.
์ด๋ ๊ฒ ์จ ๋๊ณ ๋ณด๋ฉด ์ฐ๋ฆฌ๋ ๋ ๊ฐ์ ์๊ทธ๋ง์ ์์น๋ฅผ ๋ฐ๊ฟ ์ ์๋ ๊ฒ์ ์ ์ ์๋ค. ์์น๋ฅผ ๋ฐ๊ฟ์ ํํ์ ํ๊ฒ ๋๋ฉด ์ผ์ชฝ ์๋ ์๋ ์๋ L ํ์๋์ด ์๋ ๊ฒ์ด ๊ทธ activation map์ ij ๋ฒ์งธ ํฝ์
๋ง๋ค ๋จผ์ W๋ฅผ ์ด์ฉํด์ ๊ฒฐํฉ์ ํ ์๊ฐ ์๊ณ ๊ทธ๋ ๊ฒ ๊ฒฐํฉ๋ ๊ฐ์ด ๋ฐ๋ก ์์ ์๊ฐํํด์ ๋ณด์ฌ ๋๋ฆฐ CAM์ด ๋๋ ๊ฒ์ด๋ค. ์ฌ๊ธฐ ๊ฐ ํด๋์ค C์ ๋ํ CAM์ ๊ฒฐ๊ณผ๊ฐ์ ๋ณด์ฌ์ฃผ๊ณ ์๋ ๊ฒ์ด๋ค.
๊ทธ๋ฆฌ๊ณ ์ด๋ ๊ฒ ๊ณ์ฐ๋ activation map์ CAM ๊ฐ๋ค์ ํ๊ท ์ ๋ด๋ฉด ๋ฐ๋ก ํน์ ํด๋์ค์ ๋ํ ๋ถ๋ฅ ์ ์๊ฐ ๋๋ ๊ฒ์ ๋ ๋ค์ ๋ณผ ์๊ฐ ์๋ค.
๋ค์์ CAM์ผ๋ก ๊ตฌํ ์ค๋ช
๋ค์ ๋ํ ์์๋ฅผ ํ๋ฒ ์ดํด๋ณด๋๋ก ํ๊ฒ ๋ค.
๊ทธ๋ฆผ์์ ํด๋์ค๋ง๋ค ์ธ ์ฅ์ ์๋ก ๋ค๋ฅธ ์
๋ ฅ ์ฌ์ง๋ค์ ๋ณด์ฌ ์ฃผ๊ณ ์๊ณ , ์ฌ์ง ์๋์ ์ ๋๋ก ๋ ํด๋์ค ์์ธก์ ๋ํ CAM ์ค๋ช
์ ๋ํ๋ด๊ณ ์๋ค. ๊ทธ๋ฆผ์ ๋ํ๋ ๊ฑฐ์ฒ๋ผ ํด๋์ค๊ฐ ๊ฐ๋๋ผ๋ ๋งค์ฐ ๋ค๋ฅธ ์
๋ ฅ๋ค์ด ์ฃผ์ด์ก์ ๋๋ ๋ถ๋ฅ๊ธฐ๋ ์ ๋๋ก ์ ๋ต์ ์์ธกํ๊ณ , ๊ทธ ์์ธก์ ๋ํ ์ค๋ช
๋ ๊ทธ๋ฆผ ๋ด์์ ์ ๋ต์ด ํด๋นํ๋ ๊ฐ์ฒด๋ค์ ์ ์ฐพ์๋ด์ด ํ์ด๋ผ์ดํธํ๊ณ ์๋ ๊ฒ์ ์ ์๊ฐ ์๋ค.
์ด๋ ๊ฒ ๊ตฌํ CAM ์ค๋ช
์ ์ด์ฉํ๋ฉด ๋จ์ํ ์ด๋ฏธ์ง ๋ถ๋ฅ ์ธ์๋ ๋ค๋ฅธ ๋ ๋ณต์กํ ์์ฉ ๋ถ์ผ์ธ Object Detection ์ด๋ Semantic segmentation์๋ ์ ์ฉํ ์ ์๋ค.
๊ทธ๋ฆผ์์ ๋ณด๋ ๊ฒ์ฒ๋ผ ์ฃผ์ด์ง ์ด๋ฏธ์ง์ ๋ถ๋ฅ ๊ฒฐ๊ณผ๋ฅผ ์ป์ ๋ค, ๊ทธ์ ๋ํ CAM ์ค๋ช
์ ์ป์ผ๋ฉด ์ค๋ฅธ์ชฝ์ ๋ณด์ด๋ ๊ฒ์ฒ๋ผ ์ด๋ฏธ์ง ๋ด์ ๊ฐ์ฒด์ ๋ํ ํ์ด๋ผ์ดํธ๋ฅผ ์ป์ ์ ์๋ค. ๊ฒฐ๊ณผ๋ฅผ ํตํด, ์ ์ ํ ๊ฐ์ฒด๋ฅผ ์ ๋๋ก ๋ณด๊ณ ํด๋น ๋ถ๋ฅ ๊ฒฐ๊ณผ๋ฅผ ๋ด์๋ค๋ ๊ฒ์ ์ ์๊ฐ ์๋ค. ์ถ๊ฐ๋ก ์ด๋ ๊ฒ ์ป์ ํ์ด๋ผ์ดํธ๋ ๊ทธ ๊ฐ๋ค์ ์ ์ ํ thersholding์ ํด์ฃผ๊ฒ ๋๋ฉด ์ผ์ชฝ ์ด๋ฏธ์ง์์ ๋ณด๋ ๊ฒ์ฒ๋ผ ์ด๋ฏธ์ง ๋ด์ ๊ฐ์ฒด์ ๋ํ ๋ฐ์ด๋ฉ ๋ฐ์ค๋ฅผ ์ป์ ์ ์๋ค.
์ค์ ๋ก ์ด๋ ๊ฒ CAM์ ์ด์ฉํด์ ์ด๋ฏธ์ง๋ง๋ค ๋จ์ํ classification ๋ ์ด๋ธ๋ง ์ฃผ์ด์ ธ ์์ ๋๋ ํด๋น ๋ฐ์ดํฐ๋ฅผ ํ์ฉํด ๋ถ๋ฅ๊ธฐ๋ฅผ ํ์ตํ ๋ค, ์ด CAM ์ ๋ณด๋ฅผ ํตํด ๋ฐ์ด๋ฉ ๋ฐ์ค๋ฅผ ์ณ์ฃผ๋ object detection, ๋๋ ํฝ์
๋ง๋ค ๋ ์ด๋ธ ํด์ฃผ๋ Semantic segmentation์ ํ์ฉํ ์ ์๋ค. ์ด๋ฌํ ๊ฒ๋ค์ ํตํ์ด์ weakly Supervised Learning์ด๋ผ๊ณ ํ๋ค. ๊ด๋ จ ์ฐ๊ตฌ๋ค๋ ๋งค์ฐ ํ๋ฐํ๊ฒ ์งํ๋๊ณ ์๋ค.
3-1) Strength and Weakness points of CAM method
์ฅ์ ์ ์์ ์๋ค์์ ๋ณธ ๊ฒ์ฒ๋ผ ๋ชจ๋ธ์ด ์ค์ํ๊ฒ ๋ณด๊ณ ์๋ ์ด๋ฏธ์ง ๋ด์ object๋ค์ ์ ํํ๊ฒ ๊น๋ํ๊ฒ ์ก์๋ธ๋ค.
๋จ์ ์ ์ด ๋ฐฉ๋ฒ์ model-specificํ ์ค๋ช
์ด๋ค. CAM์ ํญ์ global average pooling์ด ๋ง์ง๋ง์ ๋ฌ๋ ค์๋ ๋ชจ๋ธ์๋ง ์ ์ฉ์ด ๊ฐ๋ฅํ๊ณ ๊ทธ๋ ์ง ์์ ๋ชจ๋ธ์๋ ์ ์ฉํ ์ ์๋ค.
ํ์ง๋ง, ์ค์ ๋ก ๋ง์ ๊ฒฝ์ฐ์๋ global average pooling ๋ ์ด์ด๊ฐ ์๋ ๋ชจ๋ธ๋ค์ด ๋๋ถ๋ถ์ด๊ณ , ๊ทธ๋ฐ ๊ฒฝ์ฐ์๋ CAM์ ์ด์ฉํด์ ์ค๋ช
ํ ์๊ฐ ์๊ฒ ๋๋ค.
๋ํ CAM ์ค๋ช
์ ๋ง์ง๋ง ์ปจ๋ณผ๋ฃจ์
๋ ์ด์ด์ activation map์์๋ง ์ป์ ์ ์์ผ๋ฏ๋ก ๊ทธ Visualization ํด์๋๊ฐ ๋ง์ด ๋จ์ด์ง๋ ๋จ์ ์ด ์๋ค. ์ถ๊ฐ๋ก, ์ ๊ทธ๋ฆผ์ ์์์์ Visualization์ด ๋๋ต์ ์ผ๋ก๋ง ๊ฐ์ฒด๋ฅผ ์ง์ด๋ด๊ณ ์์ง, ์ ํํ๊ฒ ๊ฐ์ฒด์ ๋ฐ์ด๋๋ฆฌ๊น์ง ์ฐพ์๋ด๋ ๋์๋ ํ๊ณ๊ฐ ์๋ค.
์ด๋ ๊ฒ ์ดํด๋ณธ CAM์ ๋จ์ ๋ค์ ๊ทน๋ณตํ๊ธฐ ์ํด์ ๋์จ ๋ฐฉ๋ฒ์ด ๋ฐ๋ก Grad-CAM์ด๋ผ๋ ๋ฐฉ๋ฒ์ด๋ค.
4) Salinecy map-based : Grad-CAM
- CAM ๋ฐฉ๋ฒ๋ก ์ดํ 1๋ ๋ค์ ๋ฑ์ฅ
- 2017๋ ๋ ICCV์์ ์๊ฐ๋จ
์ด๋ฆ์์๋ ์ ์ ์๋ฏ์ด Grad-CAM์ gradient ์ ๋ณด๋ฅผ ํ์ฉํด์ ํ์ฅํ ์ค๋ช
๋ฐฉ๋ฒ์ด๋ค. global average pooling์ด ์๋ ๋ชจ๋ธ์๋ ๋ค ์ ์ฉ ๊ฐ๋ฅํ๊ฒ ํ ๋ฐฉ๋ฒ์ด๋ค.
CAM์ ์์์ ๋ณด๋ฉด ํด๋์ค c์ ๋ํ ij๋ฒ์งธ activation ํฝ์
์ ๋ํ ์ค์๋๋ ์ฌ๋ฌ activation map๋ค์ ij๋ฒ์งธ ํฝ์
๊ฐ์ w๋ฅผ ์ด์ฉํด์ ๊ฒฐํฉํ ๊ฒ์ด์๋๋ฐ, ์ด๋ w๋ global average pooling layer ์์ ๋ถ์ด ์๋ ์ต์ข
์์ํ layer์์ ํ์ตํ w๋ค์ด ์ฌ์ฉ๋์๋ค.
grad-CAM์์๋ ์ด๋ฌํ global average pooling ์๋ ๋ชจ๋ธ์๋ ์ด๋ฐ activation์ ๊ฒฐํฉํ๋ ๋ฐฉ์์ ๋ณด์ํ์๋ค. ํ์ตํ w๋ฅผ ์ฌ์ฉํ๋ CAM๊ณผ ๋ฌ๋ฆฌ ์์ ์์์ ๋์์๋๊ฑฐ ์ฒ๋ผ, ํด๋น activation map์์ ๊ตฌํ gradient๋ค์ global average pooling ๋ ๊ฐ์ w๋ก ์ฌ์ฉํ๊ณ ์๋ค. ์ฆ, ์ด๋ค w๊ฐ ํน์ ๋ชจ๋ธ ๊ตฌ์กฐ๋ฅผ ๊ฐ์ง๊ณ ํ์ต๋ w๋ฅผ ์ฌ์ฉํ๋ ๊ฒ์ด ์๋๋ผ, ์ด๋ activation map์์๋ ๊ทธ activation map์ gradient๋ฅผ ๊ตฌํ ๋ค์์ ๊ทธ๊ฒ์ global average pooling๊ฐ์ผ๋ก w๋ฅผ ์ ์ฉํ๋ค๋ ๋ป์ด๋ค.
๊ทธ๋ ๊ฒ ๊ตฌํ grad-CAM์ w๋ก activation์ ๊ฒฐํฉํ๊ณ ๊ทธ ๊ฒฐ๊ณผ๊ฐ๋ค์ด ์์์ผ ๋์๋ง ์ต์ข
์ ์ผ๋ก ์ทจํจ์ผ๋ก์ grad-CAM์ ์ค๋ช
์ ์ป๋๋ค.
ํ์ฉํ๊ณ ์ ํ๋ ๋ ์ด์ด์ activation map๊น์ง back propagation์ ํด์ gradient๋ฅผ ๊ตฌํ ๋ค, ๊ทธ gradient๋ฅผ poolingํด์ ๊ทธ ํด๋น activaiton map์ ๊ฒฐํฉํ๋ w๋ก ์ฌ์ฉํ๊ณ ์ต์ข
์ ์ผ๋ก ์ค๋ช
์ ๊ตฌํ๋ค. ์ด๋ ๊ฒ ๊ตฌํ Grad-CAM์ ์ค๋ช
๊ฒฐ๊ณผ๋ฅผ์ด ๊ทธ๋ฆผ๋ค์์ ๋ณด์ฌ ์ฃผ๊ณ ์๋ค.
์ฒซ๋ฒ์งธ ์์ ์ฌ์ง์ ๊ฐ์์ง์ ๊ณ ์์ด๊ฐ ๊ฐ์ด ์๋ ์ด๋ฏธ์ง์ ๋ํ ์ค๋ช
๊ฒฐ๊ณผ๋ฅผ ๋ณด์ฌ์ฃผ๊ณ ์๋๋ฐ, ๊ฐ์์ง์ ํด๋นํ๋ ์ถ๋ ฅ์ ๋ํ ์ค๋ช
(์ค๋ฅธ์ชฝ์ ์๋ ๊ทธ๋ฆผ)๊ณผ, ๊ทธ๋ฆฌ๊ณ ๊ณ ์์ด์ ํด๋นํ๋ ์ถ๋ ฅ์ ๋ํ ์ค๋ช
(๊ฐ์ด๋ฐ์ ์๋ ๊ทธ๋ฆผ)์ด ํ์คํ ์ ๊ตฌ๋ถ๋๊ณ , ๊ฐ๊ฐ ํด๋น ์ค๋ธ์ ํธ๋ฅผ ์ ์๊ฐํํ๊ณ ์๋ ๊ฒ์ ์ ์ ์๋ค.
๋ํ, ์ด๋ฐ Grad-CAM ์ด์ฉํ๋ฉด ํ์ต๋ ๋ชจ๋ธ์ด ๊ณผ์ฐ ์ ๋๋ก ์์ธก์ ํ๊ณ ์๋์ง ๋๋ ์ด ๋ชจ๋ธ์ ์์ธก์ ํธํฅ์ฑ์ ์กด์ฌํ์ง ์๋์ง๋ ์์๋ผ ์ ์๋ค.
๋๋ฒ์งธ ์์ ์์ ์
๋ ฅ ์ฌ์ง์ ๊ฐํธ์ฌ๋ผ๊ณ ๋ถ๋ฅ๋ฅผ ํ์ ๋, ๋ง์ฝ ๊ทธ ๋ชจ๋ธ์ ์์ธก ์ถ๋ ฅ์ ๋ํ grad-CAM์ ๊ตฌํด ๋ดค์ ๋ ๊ฐ์ด๋ฐ ์ด๋ฏธ์ง์ฒ๋ผ ์ฌ์ฑ ๋๋ ์ผ๊ตด์ด ์ค์ํ๋ค๊ณ ๋์ค๊ฒ ๋๋ฉด์ด ๋ชจ๋ธ์ ์ฑ๋ณ์ ๋ํ์ฌ ํธํฅ๋์ด์๋ ๋ชจ๋ธ์ ๊ฐ๋ฅ์ฑ์ด ํฌ๋ค.
๋ฐ๋ฉด ์ค๋ฅธ์ชฝ ์ด๋ฏธ์ง์ฒ๋ผ Grad-CAM ์ค๋ช
๊ฒฐ๊ณผ๊ฐ ์ฒญ์ง๊ธฐ์ ๊ฐ์ ์๋ฃ ๋๊ตฌ์ focus ๋์ด ์์ผ๋ฉด ์ด ๋ชจ๋ธ์ ๋น๊ต์ ํธํฅ๋์ง ์์ ์ํ์์ ์ฌ๋ฐ๋ฅด๊ฒ ๋ถ๋ฅ๋ฅผ ํ๊ณ ์๋ ๊ฒ์ ์ ์ ์๋ค.
4-1) Strength and Weakness points of Grad-CAM method
์ฅ์ ์ CAM๊ณผ ๋ฌ๋ฆฌ model-agnosticํ๋ค. ์ฆ, ๊ทธ๋ฆผ์์ ๋ณด์๋ ๊ฒ์ฒ๋ผ ๋ชจ๋ธ์ด ์ด๋ค ์ถ๋ ฅ ๊ตฌ์กฐ๋ฅผ ๊ฐ์ง๊ณ ์๋๋ผ๋ ์๊ด์์ด ์ฌ์ฉํ ์ ์๋ค. ๊ทธ ๋ชจ๋ธ์ด ๋ถ๋ฅ๋ฅผ ํ๋ ๋ชจ๋ธ์ด๋ ๋๋ ์ด๋ฏธ์ง์บก์
๋์ ํ๋ ๋ชจ๋ธ์ด๋ , ๋ชจ๋ธ์ ์ถ๋ ฅ์ผ๋ก๋ถํฐ ๋ฐฑ๋ณธ์ด ๋๋ CNN ๋ชจ๋ธ์ activation layer๊น์ง back propagationํตํด gradient๋ฅผ ๊ตฌํ ์๋ง ์๋ค๋ฉด, ๋ค ์ฌ์ฉํ ์ ์๋ ๋ฐฉ๋ฒ์ธ ๊ฒ์ด๋ค.
๋จ์ ์, activaiton์ ๊ฒฐํฉํ๋ ์ด w๋ก ํ๊ท gradient๋ฅผ ์ฌ์ฉํ๊ฒ ๋๋๋ฐ, ์ด๊ฒ์ด ๊ทธ๋ ๊ฒ ์ ํํ์ง ์์ ๋๊ฐ ์๋ค๋ ๊ฒ์ด๋ค. ์ฆ, gradient๊ฐ ํฌ๋ค๋ ๊ฒ์ ํด๋น activation์ ๋ํ ์ถ๋ ฅ๊ฐ์ ๋ฏผ๊ฐ๋๊ฐ ํฌ๋ค๋ ๋ง์ด์ง๋ง, ๊ทธ๊ฒ์ด ๋ฐ๋์ ๊ทธ activaiton์ด ์ต์ข
๊ฒฐ๊ณผ๋ฅผ ๊ณ์ฐํ๋๋ฐ ์์ด์ ์ค์๋๋ฅผ ์ ํํ ๋ฐ์ํ์ง ์๋๋ค๋ ๊ฒ์ด๋ค.
์ฌ๊ธฐ๊น์ง white-box ์ค๋ช
๋ฐฉ๋ฒ์ ๊ธฐ๋ฐํ saliency map๋ฐฉ์์ ์ค๋ช
๋ฐฉ๋ฒ์ ๋ํ ์ค๋ช
์ด์๋ค.
ย
<Perturbation-based>
๋ค์์ผ๋ก๋ ๋ชจ๋ธ์ ์ ํํ ๊ตฌ์กฐ๋ ๊ณ์๋ฅผ ๋ชจ๋ฅด๋ ์ํ์์ ๊ทธ ๋ชจ๋ธ์ ๋ํ ์
์ถ๋ ฅ์ ๋ํ ์ ๋ณด๋ง ๊ฐ์ง๊ณ ์๋ ๊ฒฝ์ฐ์ ์ค๋ช
ํ๋ ๋ฐฉ๋ฒ์ ๋ํด ์๊ฐํ๊ฒ ๋ค. ์ด๋ฐ ๋ฐฉ๋ฒ๋ค์ ์ฃผ๋ก perturbation ๊ธฐ๋ฐ ๋ฐฉ๋ฒ์ด๋ผ๊ณ ๋ ๋ถ๋ฆฐ๋ค. ๊ทธ ์ด์ ๋ ์
๋ ฅ ๋ฐ์ดํฐ๋ฅผ ์กฐ๊ธ์ฉ ๋ฐ๊พธ๋ฉด์ ๊ทธ์ ๋ํ ์ถ๋ ฅ์ ๋ณด๊ณ ๊ทธ ๋ณํ์ ๊ธฐ๋ฐ์์ ์ค๋ช
์ ํ๋ ๋ฐฉ์์ด ๋๋ฌธ์ด๋ค.
1) Perturbation based : LIME
์ฒซ ๋ฒ์งธ๋ก ์ค๋ช
ํ ๋ฐฉ๋ฒ์ local Interpretable model-agnostic Explanations(LIME)์ด๋ผ๋ ๋ฐฉ๋ฒ์ด๋ค.
์ด ๋ฐฉ๋ฒ์ ์ด๋ค ๋ถ๋ฅ๊ธฐ๊ฐ ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ฒ๋ผ ๋งค์ฐ ๋ณต์กํ ๋น์ ํ์ ํน์ง์ ๊ฐ์ง๊ณ ์๋๋ผ๋, ์ฃผ์ด์ง ๋ฐ์ดํฐ ํฌ์ธํธ๋ค์ ๋ํด์๋ ์์ฃผ localํ๊ฒ๋ ๋ค ์ ํ์ ์ธ ๋ชจ๋ธ๋ก ๊ทผ์ฌํ๊ฐ ๊ฐ๋ฅํ๋ค๋ ๊ฒ์์ ์ถ๋ฐํ ๊ฐ๋
์ด๋ค.
๊ทธ๋์ ์ด ๋ฐฉ๋ฒ์ ์ฃผ์ด์ง ๋ฐ์ดํฐ๋ฅผ ์กฐ๊ธ์ฉ perturbationํ๋ฉด์ ๊ทธ perturb๋ ์
๋ ฅ๋ฐ์ดํฐ๋ฅผ ๋ชจ๋ธ์ ์ฌ๋ฌ๋ฒ ํต๊ณผ์ํด์ผ๋ก์จ ๋์ค๋ ์ถ๋ ฅ์ ๋ณด๊ณ , ์ด๋ ๊ฒ ๋์จ ์
์ถ๋ ฅ pair(์ด๋ฏธ์ง, ์ถ๋ ฅ ํ๋ฅ ๊ฐ)๋ค์ ๊ฐ๋จํ ์ ํ ๋ชจ๋ธ๋ก ๊ทผ์ฌํจ์ผ๋ก์จ ์ค๋ช
์ ์ป์ด๋ด๋ ๋ฐฉ๋ฒ์ด๋ค.
๊ทธ๋ฆผ์์์ฒ๋ผ ์์ฃผ ๋ณต์กํ Decisionย boundary๋ฅผ ๊ฐ์ง๊ณ ์๋ ๋ชจ๋ธ์ด๋๋ผ๋ ํด๋นํฌ์ธํธ(๋นจ๊ฐ์ ์ญ์๊ฐ๋ก ํ์๋์ด ์๋ ํด๋นํฌ์ธํธ) ๊ทผ์ฒ์์๋ ๋ค ์ ํ๋ชจ๋ธ๋ก ๊ทผ์ฌํ ์ ์๊ณ , ๊ทธ ์ ํ๋ชจ๋ธ์ ์ด์ฉํด์ ์ค๋ช
์ ํ๊ฒ ๋ค ๋ผ๋ ๋ฐฉ๋ฒ์ด๋ค.
์๋ฅผ ๋ค์ด์ ์ฃผ์ด์ง ๊ฐ๊ตฌ๋ฆฌ์ด๋ฏธ์ง์์ ์ผ๋จ ์ด ๊ฐ๊ตฌ๋ฆฌ ์ด๋ฏธ์ง๋ฅผ ์ํผํฝ์
(์ง๊ฐ์ ์ผ๋ก(perceptually) ์๋ฏธ์๋ ํฝ์
๋ค์ ๋ชจ์์ ๊ทธ๋ฃนํ)๋ก ์ธ๊ทธ๋ฉํ
์ด์
์ ํด์ฃผ๊ณ ์ค๋ฅธ์ชฝ๊ณผ ๊ฐ์ Interpretable components๋ค์ ์ป๋๋ค.
๊ทธ๋ฆฌ๊ณ ๋์ ์ด๋ฌํ ์ํผํฝ์
๋ค์ ๊ต๋(perturbation)ํ๋ค.
๊ทธ๋ ๊ฒ ํด์ ๊ฐ์ด๋ฐ ๋ณด์ด๋ ๊ทธ๋ฆผ์ฒ๋ผ ๋ค์ํ ๊ต๋๋ ๊ทธ๋ฆผ๋ค์ ์ป๊ฒ ๋๋ค. ์ด๋ค ์ํผํฝ์
๋ค์ ์กด์ฌํ๊ณ ์ด๋ค ์ํผํฝ์
๋ค์ ๊ทธ๋ฅ ์๋ ์ํ๋ก ๋๋คํ๊ฒ ๋ง๋๋ ๊ฒ์ด๋ค.
์ด๋ ๊ฒ perturb๋ ๊ทธ๋ฆผ๋ค ๊ฐ๊ฐ์ ๋ํ ๋ชจ๋ธ์ ํต๊ณผํ์ ๋ ์ป๊ฒ๋๋ ๊ทธ ์ถ๋ ฅ ํ๋ฅ ์ ์ป์ ์ ์๊ฒ ๋๊ณ , ๊ฐ๊ตฌ๋ฆฌ์ ๋ํ ์ค์ฝ์ด๊ฐ ์ด๋ป๊ฒ ๋ฐ๋๋์ง ๋ณด์ฌ์ฃผ๊ณ ์๋ค.
๋งจ ์์ ์๋ perturbation ๊ฐ์ ๊ฒฝ์ฐ๋ ์ฌ์ ํ ๊ต๋๋ ์ด๋ฏธ์ง๋ฅผ ๊ฐ๊ตฌ๋ฆฌ๋ผ๊ณ ์์ธกํ ํ๋ฅ ์ด ์๋นํ ๋๊ฒ ๋์ค๊ณ , ์์์ ๋ ๋ฒ์งธ ์๋ ์ด๋ฏธ์ง ๊ฐ์ ๊ฒฝ์ฐ์๋ ๊ฐ๊ตฌ๋ฆฌ๋ผ๊ณ ์์ธกํ ํ๋ฅ ์ด ๊ฑฐ์ ์๊ฒ ๋์ค๋ ๊ฒ์ด๋ค.
perturb๋ ์ด๋ฏธ์ง์ ์ถ๋ ฅ ํ๋ฅ ๊ฐ์ pair๋ฅผ ์ด์ฉํด์ ๊ฐ ์ํผ ํฝ์
๋ค์ ์ ๊ฒฐํฉํ๋ ์ ํ๊ณ์๋ค์ ํ์ตํ ์ ์๊ณ ๊ทธ ๊ณ์๋ค์ ์ด์ฉํด์ ์ํผํฝ์
๋ค์ ๋ค์ ๊ฒฐํฉํ์ ๋, ๋์ค๋ ์ด๋ฏธ์ง๊ฐ ์ค๋ฅธ์ชฝ์ ์๋ ์ต์ข
์ค๋ช
์ด ๋๋ค.
์ฆ, ์ฃผ์ด์ง ์ด๋ฏธ์ง ๋ด์์ ์ด ์ด๋ฏธ์ง๋ฅผ ๊ฐ๊ตฌ๋ฆฌ๋ผ๊ณ ์์ธก์ ํ ๋, ์ด ๋ฐฉ๋ฒ์ ํตํด์ ์ป์ ์ค๋ช
์ ๊ฐ๊ตฌ๋ฆฌ ๋จธ๋ฆฌ์ ํด๋นํ๋ ๋ถ๋ถ์ด๋ค. ์ฆ ๋ถ๋ฅ์ ์ค์ํ ์ญํ ์ ํ๋ ์ํผ ํฝ์
๋ค์ ์ ์ฐพ์๋ด๋ ๊ฒ์ ์ ์๊ฐ ์๋ค.
์ด๋ ๊ฒ ๋์ํ๋ LIME ๋ฐฉ๋ฒ์ ํ์ฉํ๋ฉด ๊ทธ๋ฆผ์์ ๋ณด๋ ๊ฒ๊ณผ ๊ฐ์ ์ฌ๋ฏธ์๋ ๊ฒฐ๊ณผ๋ฅผ ์ป์ ์๊ฐ ์๋ค.
์ฌ๊ธฐ ์ผ์ชฝ์ ์๋ ์ค๋ฆฌ์ง๋ ์ด๋ฏธ์ง์ ๋ํด์ โeletric guitar" ๋ผ๊ณ ์์ธกํ๋ ๊ฒฝ์ฐ์ ๋ํ ์ค๋ช
์ด ๋ ๋ฒ์งธ ๊ทธ๋ฆผ์ด๊ณ , ๊ทธ ๋ค์์ โAcoustic guitarโ๋ผ๊ณ ์์ธกํ๋ ๊ฒฝ์ฐ์ ๋ํ ์ค๋ช
์ด๊ณ , ์ธ ๋ฒ์งธ๊ฐ โLabradorโ๋ผ๋ ๊ฐ์์ง์ข
๋ฅ๋ผ๊ณ ์์ธกํ๋ ๊ฒฝ์ฐ์๋ ๊ทธ ์ค๋ช
์ด ๋งจ ์ค๋ฅธ์ชฝ์ ๋ํ๋์๋ค.
๊ฐ๊ฐ์ ์์ธก์ ๋ํด์ LIME ์ค๋ช
๋ฐฉ๋ฒ์ด ๋ค๋ฅด์ง๋ง, ์ ํํ ๊ทธ๋ฐ ์ค๋ช
๋ค์ ๋ง๋ค์ด ๋ด๊ณ ์์์ ์ ์๊ฐ ์๋ค.
1-1) Strength and Weakness points of LIME method
์ด๋ ๊ฒ ๊ตฌํ๋ LIME ๋ฐฉ๋ฒ์ Black-Box์ค๋ช
๋ฐฉ๋ฒ์ด๋ผ๋ ๊ฐ์ฅ ํฐ ์ฅ์ ์ด ์๋ค. ๋ฅ๋ฌ๋ ๋ชจ๋ธ๋ฟ ์๋๋ผ ์ด๋ค ์ฃผ์ด์ง ์
๋ ฅ๊ณผ ๊ทธ์ ๋ํ ์ถ๋ ฅ๋ง ์ป์ ์ ์์ผ๋ฉด ๊ทธ๊ฒ๋ค์ ํ์ฉํด์ ์ด๋ค ๋ชจ๋ธ์ ๋ํด์๋ ๋ค ์ ์ฉํ ์ ์๋ ์ค๋ช
๋ฐฉ๋ฒ์ธ ๊ฒ์ด๋ค.
๋ฐ๋ฉด ๋จ์ ์ ์ฃผ์ด์ง ๋ชจ๋ธ์ ์ฌ๋ฌ๋ฒ evaluation ํด์ผ ๋๋ ๋ฌธ์ ์ด๋ค. ์ฆ, ๋ฅ๋ฌ๋ ๊ฐ์ ๊ฒฝ์ฐ์๋ forward-propagation ๋ง์ด ํด์ผ๋๊ณ , ๊ทธ๋ก ์ธํด์ ๊ณ์ฐ๋ณต์ก๋๊ฐ ๋งค์ฐ ๋์ ๋ฐฉ๋ฒ์ด๋ผ๊ณ ํ ์ ์๋ค. ์ด๋ ๋ชจ๋ธ ๊ตฌ์กฐ๋ฅผ ์์ง ๋ชปํ๋ ๋ธ๋๋ฐ์ค ๋ฐฉ๋ฒ์ด ์ด์ฉ ์ ์์ด ๊ฐ์ง๊ฒ ๋๋ ํ๊ณ์ด๊ธฐ๋ ํ๋ค.
๋ํ, ์ค์ ๋ชจ๋ธ์ด ์ฌ์ ํ local ํ๊ฒ๋ ๋น์ ํ์ ์ธ ํน์ง์ ๊ฐ์ง๊ณ ์๊ณ , ๊ทธ๊ฒ์ด ์ ํํจ์๋ก ์ ๊ทผ์ฌํ ์๋๋ ๊ฒฝ์ฐ์ ์ค๋ช
์ด ์ ์ ๋๋ ๋จ์ ์ด ์๊ณ , ๊ทธ๋ฆฌ๊ณ ์๋ ๊ทธ๋ฆผ๊ณผ ๊ฐ์ด ๊ฐ์ฒด๋ถ๋ฅ๊ฐ ์๋๋ผ ์ด๋ฏธ์ง ์ ์ฒด์ ํน์ฑ์ ๊ดํ ๋ถ๋ฅ๋ฅผ ํ๋ ๊ฒฝ์ฐ์๋ LIME ๋ฐฉ๋ฒ์ ์ ๋์ํ์ง ์๋ ๋จ์ ์ด ์๋ค.
2) Perturbation based : RISE
[Petsiuk et al, RISE : Randomized Input Sampling for Explanation of Black-box Models, BMVC, 2018]
Black-Box๋ฐฉ๋ฒ์ผ๋ก๋ RISE๋ผ๋ ๋ฐฉ๋ฒ์ด ์๋ค. ์ด ๋ฐฉ๋ฒ๋ ์์ ์๊ฐํ LIME๊ณผ ๋น์ทํ๊ฒ ์ฌ๋ฌ ๋ฒ ์
๋ ฅ์ perturbํด์ ์ค๋ช
์ ๊ตฌํ๋ ๋ฐฉ๋ฒ์ด๋ค.
์ด๋ ์ด๋ฏธ์ง๋ฅผ perturbํ๋ ๋ฐฉ๋ฒ์ ๊ฐ์ด๋ฐ ๋ณด์ด๋ ๊ฒ์ฒ๋ผ ๋๋คํ ๋ง์คํฌ๋ฅผ ๋ง๋ค์ด์ ๊ทธ ๋ง์คํฌ๋ฅผ ์์ด ์
๋ ฅ์ด ๋ชจ๋ธ์ ํต๊ณผํ์ ๋ ํด๋น ํด๋์ค์ ๋ํ ์์ธก ํ๋ฅ ์ด ์ผ๋ง๋ ๋จ์ด์ง๋์ง๋ฅผ ๋ณด๊ณ ์ค๋ช
์ ํ๋ ๋ฐฉ์์ด๋ค.
์ฆ, ์ฌ๋ฌ ๊ฐ์ ๋๋ค ๋ง์คํน์ด ๋์ด ์๋ ์
๋ ฅ์ ๋ํ ์ถ๋ ฅ ์ค์ฝ์ด๋ฅผ ๊ตฌํ๊ณ ๊ทธ ์ค์ฝ์ด(ํ๋ฅ )๋ค์ ์ด์ฉํด์ ์ด ๋ง์คํฌ๋ค์ ๊ฐ์ค์น๋ฅผ ๋์ด์ ํ๊ท ํ์์๋ ๋์ค๋ ๊ฒ์ด ์ค๋ฅธ์ชฝ์ ์๋ ์ค๋ช
Map์ธ ๊ฒ์ด๋ค.
๊ทธ๋ฆผ์์์ฒ๋ผ ํด๋น ๊ฐ์ฒด๋ค์ ์์ฃผ ์ ์ฐพ์๋ด์ด ํ์ด๋ผ์ดํธ ํ๋ ๊ฒ์ ์ ์ ์๋ค.
์ฆ, ์ฌ๋ฐ๋ฅธ ๋ถ๋ฅ ์์ธก์ ํ๋๋ฐ ์์ด์ ์ค์ํ ๊ทธ๋ฐ ์ด๋ฏธ์ง์ ๋ถ๋ถ๋ค์ ์ ์ฐพ์๋ด๋ ๊ฒ์ด๋ค. (d)LIME์ด๋ ๋น๊ตํด์๋ LIME์ด ์ํผํฝ์
๋ฅผ ์ด์ฉํ๋ ๊ฒ ๋๋ฌธ์ ์ค๋ ํ๊ณ๊ฐ ์๊ณ , ๋๋ฒ์งธ ๊ทธ๋ฆผ์ฒ๋ผ ๋งค์ฐ ๊นจ๋ํ ์ค๋ช
์ ํ์ธํ ์ ์๋ค.
2-1) ์ฅ๋จ์ of RISE
black-box ์ค๋ช
์์๋ ๋ถ๊ตฌํ๊ณ ์ ๊ตฌํ ์ ์๋ค๋ ์ฅ์ ์ด ์๊ณ , ๋ ์ด๋ค ๊ฒฝ์ฐ์๋ white-box ๋ฐฉ๋ฒ์ธ grad-CAM ๋ณด๋ค๋ ๋ ์ข์ ์ค๋ช
์ ๋ง๋๋ ๊ฒ์ ์ ์๊ฐ ์๋ค.
๊ทธ๋ฌ๋ ์ด ๋ฐฉ๋ฒ์ ๋จ์ ๋ ๋์ ๊ณ์ฐ๋ณต์ก๋๋ฅผ ํ์๋ก ํ๋ ๊ฒ์ด๊ณ , ์์ ๋ง์๋๋ฆฐ LIME ๋ณด๋ค๋ ํจ์ฌ ๋ ๋ง์ ์๋งํผ ๋๋ค ๋ง์คํฌ๋ฅผ ๋ง๋ค์ด์ผ ๋๋ ๊ทธ๋ฐ ๋จ์ ์ด ์๋ค. ๊ทธ๋ฆฌ๊ณ ์ด ๋๋ค๋ง์คํฌ๋ฅผ ๋ช ๋ฒ ๋ง๋ค ๊ฒ์ด๋์ ๋ฐ๋ผ์ ํด๋น ์ค๋ช
์ด ๋ฌ๋ผ์ง๋ ๊ทธ๋ฐ ๋๋คํ ๋
ธ์ด์ฆ๋ ์กด์ฌํ๋ ๊ฒ์ด ๋จ์ ์ด๋ค.
<Influence function-based>
๋ง์ง๋ง์ผ๋ก ์ง๊ธ๊น์ง ๋ณธ ๊ฒ๋ค๊ณผ๋ ์ฝ๊ฐ ๋ค๋ฅธ influence function์ ๊ธฐ๋ฐํ ์ค๋ช
๋ฐฉ๋ฒ์ ์๊ฐํ๊ฒ ๋ค. ์ง๊ธ๊น์ง๋ ์ฃผ์ด์ง ํ
์คํธ ์ด๋ฏธ์ง๊ฐ ์์ผ๋ฉด ๋ชจ๋ธ์ด ์ด๋ฏธ์ง๋ฅผ ๋ถ๋ฅํ๊ณ ๊ทธ ๋ถ๋ฅ ๊ฒฐ๊ณผ์ ๋ํ ์ค๋ช
์ ํด๋น ํ
์คํธ ์ด๋ฏธ์ง์์ ํ์ด๋ผ์ดํธ ํ๋ ๋ฐฉ์์ ๋ฐฉ๋ฒ๋ค์ด์๋ค.
๊ทธ๋ฐ๋ฐ ์ด ๋ฐฉ๋ฒ์์๋, ์ฃผ์ด์ง ๋ชจ๋ธ์ด ์ด๋ค ํ์ต๋ฐ์ดํฐ๋ก๋ถํฐ ํ์ตํ ๊ฒ์ด๋ฏ๋ก ๊ทธ ๋ฐ์ดํฐ์
์ ์๋ ํธ๋ ์ด๋ ์ด๋ฏธ์ง๋ค์ ํจ์๋ผ๊ณ ๋ณผ ์ ์๊ณ , ๋ฐ๋ผ์ ๊ฐ ํ
์คํธ ์ด๋ฏธ์ง๋ฅผ ๋ถ๋ฅํ๋๋ฐ ๊ฐ์ฅ ํฐ ์ํฅ์ ๋ฏธ์น ํธ๋ ์ด๋ ์ด๋ฏธ์ง๊ฐ ํด๋น๋ถ๋ฅ์ ๋ํ ์ค๋ช
์ด๋ผ๊ณ ์ ๊ณต์ ํ๋ ๊ฒ์ด๋ค.
<Quantitative Metrics>
์ด๋ฌํ XAI๋ฐฉ๋ฒ๋ค์ ์ด๋ป๊ฒ ๋น๊ตํ๊ณ ํ๊ฐํ๋์ง ๊ณ ์๋ ์ค๋ช
๋ฐฉ๋ฒ๋ค์ ๋ฌธ์ ์ ๋ค์ ์๋์ง ์ดํด๋ณด๊ฒ ๋ค.
์์ ์ธ๊ธํ ์ฌ๋ฌ ๊ฐ์ง ๋ฐฉ์์ผ๋ก ๊ณ ์๋ XAI์ ๋ฐฉ๋ฒ๋ค์ด ์๋๋ฐ, ๊ณผ์ฐ ์ด๋ ๋ฐฉ๋ฒ์ด ์ข์ ์ค๋ช
๋ฐฉ๋ฒ์ธ์ง ์ด๋ฐ ๊ฒ๋ค์ ํ๊ฐ, ์ดํดํ ํ์๊ฐ ์๋ค. ๊ทธ๋์ ๊ทธ๋ฐ ๊ฒ๋ค์ ํ๊ฐํ๋ ๋ฐฉ๋ฒ๋ค์ ์๊ฐํ๊ฒ ๋ค.
<Sanity checks / Robustness>
ย