XAI

XAI method

date
Jul 9, 2023
slug
xai-method
author
status
Public
tags
DeepLearning
XAI
summary
type
Post
thumbnail
category
XAI
updatedAt
Jul 9, 2023 02:35 PM

โ€ป Outline : 5๊ฐ€์ง€

notion image
notion image

<Salinecy map-based>

notion image
saliency map์˜ ์˜ˆ์‹œ
saliency map์˜ ์˜ˆ์‹œ
Saliency map ๊ธฐ๋ฐ˜ ๋ฐฉ๋ฒ•์€ Grad-CAM๊ฒฐ๊ณผ์™€ ๊ฐ™์ด ํ•˜๋‚˜์˜ ์ด๋ฏธ์ง€ ์ƒ˜ํ”Œ์ด ๋ชจ๋ธ์˜ ์ž…๋ ฅ์œผ๋กœ ๋“ค์–ด๊ฐ€๊ฒŒ ๋˜๋ฉด ์˜ˆ์ธก ๊ฒฐ๊ณผ์— ๋Œ€ํ•œ ์„ค๋ช…์„ ํžˆํŠธ๋งต๊ณผ ๊ฐ™์ด ์ด๋ฏธ์ง€ ๋‚ด์—์„œ ์ค‘์š”ํ•˜๊ฒŒ ์ž‘์šฉํ•  ๋ถ€๋ถ„์„ ํ•˜์ด๋ผ์ดํŠธํ•ด์„œ ๋ณด์—ฌ์คŒ์œผ๋กœ์จ ์„ค๋ช…์„ ์ œ๊ณตํ•˜๋Š” ๋ฐฉ๋ฒ•์ด๋‹ค.

1) Salinecy map-based : Simple Gradient method

sliency map ๋ฐฉ๋ฒ•๋“ค ์ค‘ ๊ฐ€์žฅ ๊ฐ„๋‹จํ•œ ๋ฐฉ๋ฒ•์€ ์ž…๋ ฅ์— ๋Œ€ํ•œ ๋ชจ๋ธ์˜ Gradient๋กœ ์„ค๋ช…์„ ์ œ๊ณตํ•˜๋Š” ๊ฒƒ์ด๋‹ค.
[Simonyan, et al., Deep Inside Convolutional Networks: Visualising Image Classification Models and Saliency Maps, ICLR 2014]
[Simonyan, et al., Deep Inside Convolutional Networks: Visualising Image Classification Models and Saliency Maps, ICLR 2014]
์˜ˆ๋ฅผ ๋“ค์–ด, ์œ„์˜ ์ˆ˜์‹์— ์žˆ๋Š” ๋ผ๋Š” ์ด๋ฏธ์ง€๊ฐ€ ๋ผ๋Š” ํ•จ์ˆ˜์˜ ์ž…๋ ฅ์œผ๋กœ ๋“ค์–ด๊ฐ€์„œ ์ถœ๋ ฅ์ด ๊ณ„์‚ฐ๋˜์—ˆ์„ ๋•Œ, ๊ทธ ์ถœ๋ ฅ๊ฐ’์ด ์ž…๋ ฅ ์ด๋ฏธ์ง€์˜ ๊ฐ ํ”ฝ์…€์— ๋Œ€ํ•œ gradient๋ฅผ ๊ตฌํ•˜์—ฌ, ๊ทธ ๊ตฌํ•œ ๊ฐ’์„ ๊ฐ ํ”ฝ์…€์˜ ์ค‘์š”๋„๋กœ ํ•ด์„ํ•œ๋‹ค.
์ด ๋ฐฉ๋ฒ•์ด ํƒ€๋‹นํ•œ ์ด์œ ๋Š” gradient๋ผ๋Š” ๊ฒƒ์ด ๊ฐ ํ”ฝ์…€์˜ ๊ฐ’์ด ์กฐ๊ธˆ ๋ฐ”๋€Œ์—ˆ์„ ๋•Œ, ํ•จ์ˆ˜์˜ ์ถœ๋ ฅ๊ฐ’์ด ์–ผ๋งˆ๋‚˜ ๋นจ๋ฆฌ ๋ณ€ํ•˜๋Š”์ง€๋ฅผ ๊ตฌํ•˜๋Š” ๊ฐ’์ด๊ธฐ ๋•Œ๋ฌธ์— Gradient๊ฐ€ ํฌ๋‹ค๋ฉด ํ•ด๋‹น ํ”ฝ์…€์ด ์ถœ๋ ฅ๊ฐ’์— ์˜ํ–ฅ์„ ๋งŽ์ด ๋ฏธ์น˜๋Š” ๊ฒƒ์ด๋ฏ€๋กœ ์ค‘์š”ํ•˜๋‹ค๊ณ  ํ•ด์„ ํ•  ์ˆ˜ ์žˆ๊ธฐ ๋•Œ๋ฌธ์ด๋‹ค.
๊ทธ๋ฆฌ๊ณ  ๋”ฅ๋Ÿฌ๋‹ ๋ชจ๋ธ์˜ ๊ฒฝ์šฐ back-propagation ํ†ตํ•ด ์‰ฝ๊ฒŒ ๊ณ„์‚ฐํ•  ์ˆ˜ ์žˆ๊ธฐ ๋•Œ๋ฌธ์— ๊ฐ„๋‹จํžˆ ๊ตฌํ˜„ํ•  ์ˆ˜ ์žˆ๋Š” ์ด์ ์ด ์กด์žฌํ•œ๋‹ค.

1-2) Examples of Simple Gradient method

notion image
notion image
gradient ๋ฐฉ๋ฒ•์„ ์ด์šฉํ•ด์„œ ์ฃผ์–ด์ง„ ์ž…๋ ฅ ์ด๋ฏธ์ง€์— ์˜ˆ์ธก ๊ฒฐ๊ณผ์— ๋Œ€ํ•œ Saliency map์„ ์œ„์˜ ๊ทธ๋ฆผ์ฒ˜๋Ÿผ ๋ณผ ์ˆ˜ ์žˆ๋‹ค.
์˜ˆ์‹œ 6๊ฐ€์ง€ ์ด๋ฏธ์ง€๋“ค์— ๋Œ€ํ•ด ์ฃผ์–ด์ง„ ๋ชจ๋ธ์€ ๋ชจ๋‘ ์ •ํ™•ํžˆ ์ •๋‹ต ํด๋ž˜์Šค๋ฅผ ์˜ฌ๋ฐ”๋ฅด๊ฒŒ ์˜ˆ์ธกํ•˜์˜€๊ณ , ๊ทธ์— ๋Œ€ํ•œ ์„ค๋ช…(Saliency map)์„ ๋ณด๋ฉด ์ •๋‹ต class์— ํ•ด๋‹นํ•˜๋Š” ๊ฐ์ฒด๋“ค์„ ์ž˜ ํ•˜์ด๋ผ์ดํŠธํ•˜๊ณ  ์žˆ๋Š” ๊ฒƒ์„ ๋ณผ ์ˆ˜ ์žˆ๋‹ค.
์š”ํŠธ, ๊ฐ•์•„์ง€, ์—ด๋Œ€๊ณผ์ผ ๋“ฑ ๊ฐ์ฒด๋ฅผ ์˜ฌ๋ฐ”๋ฅธ ์˜ˆ์ธก์— ๋Œ€ํ•œ ์„ค๋ช…์œผ๋กœ ๊ทธ ๊ฐ์ฒด๋“ค์„ ํ•˜์ด๋ผ์ดํŠธํ•˜๊ณ  ์žˆ๋‹ค. ์ฆ‰, object๋ฅผ ์ž˜ ์ง‘์–ด๋‚ด๊ณ  ์žˆ๋‹ค.

1-2) Strength and Weakness points of Simple Gradient method

notion image
(์žฅ์ ) ๊ฐ„๋‹จํ•œ gradient์— ๊ธฐ๋ฐ˜ํ•œ ์„ค๋ช… ๋ฐฉ๋ฒ•์€ ๊ณ„์‚ฐํ•˜๊ธฐ๊ฐ€ ์•„์ฃผ ์‰ฌ์šด ์žฅ์ ์„ ๊ฐ€์ง€๊ณ  ์žˆ๊ณ , ๋˜ ์–ด๋Š ์ •๋„ ์ •ํ™•ํ•œ ์„ค๋ช…์„ ๋งŒ๋“ค์–ด ๋‚ผ ์ˆ˜ ์žˆ์Œ์„ ์•ž ์˜ˆ์‹œ์—์„œ ๋ณด์•˜๋‹ค.
๊ทธ๋Ÿฌ๋‚˜ ์ด ๋ฐฉ๋ฒ•์„ ๋‹จ์ ๋„ ์กด์žฌํ•˜๋Š”๋ฐ, ์ด๋ ‡๊ฒŒ gradient๋กœ ๊ตฌํ•œ ์„ค๋ช…๋“ค์ด ๋งค์šฐ Noisy ํ•  ์ˆ˜ ์žˆ๋‹ค๋Š” ๊ฒƒ์ด๋‹ค. ์˜ˆ์‹œ์ธ ์™ผ์ชฝ ์•„๋ž˜ ๊ทธ๋ฆผ์„ ๋ณด๋ฉด ์ด๋ฏธ์ง€์˜ ์‹œํ€€์Šค์ธ ์–ด๋–ค ๋น„๋””์˜ค ํ”„๋ ˆ์ž„์— ๋Œ€ํ•ด ๋ผ๋Š” ๋ถ„๋ฅ˜๊ธฐ์— ๋Œ€ํ•œ ์ถœ๋ ฅ์„ ๊ทธ๋ฆผ์„ ํ†ตํ•ด ๋ณด์—ฌ ์ฃผ๊ณ  ์žˆ๋‹ค.
์ฆ‰, ๊ฐ ํ”„๋ ˆ์ž„์— ๋Œ€ํ•œ ์˜ˆ์ธก ๊ฒฐ๊ณผ๋Š” โ€œ๋ฐ”๋ฒจโ€๋กœ ์ผ์ •ํ•˜๊ณ , ๊ทธ ์˜ˆ์ธก๊ฐ’๋งŒ ๋น„๊ต์  ๋ถ€๋“œ๋Ÿฝ๊ฒŒ ๋ณ€ํ•˜๋Š” ๊ฒƒ์— ๋ฐ˜ํ•ด์„œ, ์ž…๋ ฅ ์ด๋ฏธ์ง€๋“ค์— ๋Œ€ํ•œ gradient๋ฅผ ๊ตฌํ•˜๋ฉด ์•„๋ž˜ ์žˆ๋Š” ๊ทธ๋ฆผ(map)์ฒ˜๋Ÿผ ๊ต‰์žฅํžˆ Noisy ํ•ด์ง€๋Š” ๊ฒƒ์„ ์•Œ ์ˆ˜๊ฐ€ ์žˆ๋‹ค.
์ฆ‰, ๋˜‘๊ฐ™์€ ์˜ˆ์ธก ๊ฒฐ๊ณผ๋ฅผ ๊ฐ€์ง„ ์กฐ๊ธˆ์”ฉ ๋ณ€ํ•˜๋Š” ์ด๋ฏธ์ง€๋“ค์ด ์žˆ๋Š”๋ฐ, ๊ฐ ์ด๋ฏธ์ง€์— ๋Œ€ํ•œ ์„ค๋ช…(map)์€ ๋งŽ์ด ๋‹ค๋ฅด๊ฒŒ ๋‚˜ํƒ€๋‚จ์„ ์•Œ ์ˆ˜ ์žˆ๋‹ค.
๋˜ํ•œ ์˜ค๋ฅธ์ชฝ ์˜ˆ์‹œ์ฒ˜๋Ÿผ ์–ด๋–ค ์ด๋ฏธ์ง€ ์— ์•„์ฃผ ์ž‘์€ ๋…ธ์ด์ฆˆ ์—ก์‹ค๋ก ์„ ์„ž์–ด ์ฃผ์—ˆ์„ ๋•Œ, ์‚ฌ๋žŒ ๋ˆˆ์œผ๋กœ ๋ณด๊ธฐ์—๋Š” ๊ฑฐ์˜ ์ฐจ์ด์ ์ด ์—†๋Š” ์ด๋ฏธ์ง€๋ฅผ ๊ฐ€์ง€๊ณ  ๋ชจ๋ธ์˜ ์˜ˆ์ธก๋„ ๋™์ผํ•˜๊ฒŒ ๋˜์ง€๋งŒ ๊ทธ ์ž…๋ ฅ gradient๋Š” ๊ฐ€์šด๋ฐ ์žˆ๋Š” ๊ทธ๋ž˜ํ”„ plot์ฒ˜๋Ÿผ ๋งค์šฐ Noisy ํ•˜๊ฒŒ ๋ณ€ํ™”ํ•˜๋Š” ๊ฒƒ์„ ๋ณผ ์ˆ˜๊ฐ€ ์žˆ๋‹ค.

2) Salinecy map-based : SmoothGrad method

notion image
[Smilkov, et al., Smoothgrad: removing noise by adding noise, ICML workshop, 2017]
๊ฐ„๋‹จํ•œ gradient ๋ฐฉ๋ฒ•์˜ ๋‹จ์ ์„ ๊ทน๋ณตํ•˜๊ธฐ ์œ„ํ•ด ์ œ์‹œ๋œ ๊ฒƒ์ด smoothGrad๋ผ๋Š” ๋ฐฉ๋ฒ•์ด๋‹ค.
๋ผ๋Š” ์ด๋ฏธ์ง€๊ฐ€ ์ฃผ์–ด์กŒ์„ ๋•Œ, ์ž‘์€ ๋…๋ฆฝ์ ์ธ ๊ฐ€์šฐ์‹œ์•ˆ๋…ธ์ด์ฆˆ ์—ก์‹ค๋ก (์žก์Œ์œผ๋กœ ์ถ”๊ฐ€๋˜๋Š” ๊ฐ’์ด ๊ฐ€์šฐ์‹œ์•ˆ ํ•จ์ˆ˜ ํ˜•ํƒœ๋ฅผ ๋”ฐ๋ฆ„)์„ ์„ž์–ด์ค€ ๋’ค, ์ž…๋ ฅ gradient๋ฅผ ๊ตฌํ•˜๋Š” ๊ณผ์ •์„ ์—ฌ๋Ÿฌ ๋ฒˆ ์ˆ˜ํ–‰ํ•ด์„œ ๊ทธ gradient์˜ ํ‰๊ท ์œผ๋กœ ์„ค๋ช…(map๋“ฑ์œผ๋กœ ๋‚˜ํƒ€๋ƒ„)์„ ์ œ์‹œํ•˜๋Š” ๋ฐฉ๋ฒ•์ด๋‹ค.
์ด SmoothGrad ๋ฐฉ๋ฒ•์€ ์•ž์—์„œ ๋ณด์‹  ์˜ˆ(Gradient๊ฒฐ๊ณผ ์˜ˆ์‹œ)์—์„œ ๋ณธ Noisyํ•œ Gradient๋“ค์€ ๋งŽ์ด ์ œ๊ฑฐ๋  ์ˆ˜๊ฐ€ ์žˆ๊ณ , ํ‰๊ท ์œผ๋กœ ๋‚จ๋Š” Gradient๋“ค์ด ๋” ๊นจ๋—ํ•œ ์„ค๋ช…์„ ์ œ๊ณตํ•  ์ˆ˜ ์žˆ๊ฒŒ ๋œ๋‹ค.
๋…ธ์ด์ฆˆ๋ฅผ ์„ž์–ด์„œ Gradient๋ฅผ ๊ณ„์‚ฐํ•˜๋Š” ํšŸ์ˆ˜๋Š” ๋Œ€๋žต 50ํšŒ ์ •๋„ ์ง„ํ–‰์ด ๋˜๊ณ , noise์˜ ํ‘œ์ค€ํŽธ์ฐจ๋„ ์œ„์˜ ํœด๋ฆฌ์Šคํ‹ฑํ•œ ๋ฃฐ๋กœ ์ธํ•ด์„œ ์ •ํ•ด์ฃผ๊ฒŒ ๋œ๋‹ค.

2-1) Examples of SmoothGrad Method

notion image
Simple Gradient๋ฅผ ๋ณด์™„ํ•œ ๋ฐฉ๋ฒ•์ธ smoothGrad๋ฅผ ์ ์šฉํ•ด๋ณธ ๊ฒฐ๊ณผ์ด๋‹ค.
๊ทธ๋ฆผ์˜ ์„ธ ๋ฒˆ์งธ ์—ด๋กœ ๋‚˜ํƒ€๋‚˜ ์žˆ๋Š” smoothGrad์˜ ์„ค๋ช…์ด ๋ณด๋‹ค ๊ฐ„๋‹จํ•œ(simple) Gradient ๋ฐฉ๋ฒ•(๋‘ ๋ฒˆ์งธ ์—ด ๊ฒฐ๊ณผ)๋ณด๋‹ค ํ›จ์”ฌ ๊นจ๋—ํ•œ ์„ค๋ช…์„ ๋ณด์—ฌ์ฃผ๊ณ  ์žˆ๋Š” ๊ฒƒ์„ ํ™•์ธํ•  ์ˆ˜ ์žˆ๋‹ค.
ํŠนํžˆ, ์™ผ์ชฝ ๋‘ ๋ฒˆ์งธ ์ƒ์–ด ์ด๋ฏธ์ง€์ฒ˜๋Ÿผ ๋ฐฐ๊ฒฝ์ด ๊ท ์ผํ•œ ๊ฒฝ์šฐ์— ๋” ๊นจ๋—ํ•˜๊ฒŒ smoothGrad๊ฐ€ ์ž˜ ์„ค๋ช…ํ•œ๋‹ค. (์ฆ‰, ๋ฐฐ๊ฒฝ์ด ๊ท ์ผํ•œ ๊ฒฝ์šฐ ์ค‘์š”ํ•œ ํ”ฝ์…€๋“ค์„ ๋” ์ž˜ ์žก์•„๋‚ด๊ณ  ์žˆ๋Š” ๊ฒƒ์„ ์•Œ ์ˆ˜ ์žˆ๋‹ค.)

2-2) Strength and Weakness points of SmoothGrad method

notion image
(์žฅ์ ) smoothGrad๋Š” ํ‰๊ท  ๋‚ด๋Š” ๊ณผ์ •์„ ํ†ตํ•ด ๋ช…ํ™•ํ•œ ์„ค๋ช…์„ ์ƒ์„ฑํ•ด ๋‚ผ ์ˆ˜ ์žˆ๋Š” ์žฅ์ ์ด ์žˆ๊ณ , ๋˜ ๊ฐ„๋‹จํ•œ Gradient ๋ฐฉ๋ฒ•๊ณผ ๊ฐ™์ด ๋Œ€๋ถ€๋ถ„์˜ saliency-map ๊ธฐ๋ฐ˜ ๋ฐฉ๋ฒ•๋“ค์—๋„ ๋™์ผํ•˜๊ฒŒ ์‰ฝ๊ฒŒ ์ ์šฉ์ด ๊ฐ€๋Šฅํ•œ ์žฅ์ ์ด ์žˆ๋‹ค.
(๋‹จ์ ) ๋ฐ˜๋ฉด์—, Noise๋ฅผ ์„ž์–ด ์ฃผ๊ณ  ์–ป๋Š” Gradient๋ฅผ ํ‰๊ท  ๋‚ด๋Š” ๊ฒƒ์ด๊ธฐ ๋•Œ๋ฌธ์— Noise๋ฅผ ์„ž์–ด์ฃผ๋Š” ํšŸ์ˆ˜๋งŒํผ ์–ด๋–ค ๋”ฅ๋Ÿฌ๋‹ ๋ชจ๋ธ์˜ forward-backward propagation์„ ํ•ด์•ผํ•˜๋ฏ€๋กœ ๋งค์šฐ ๊ณ„์‚ฐ ๋ณต์žก๋„๊ฐ€ ๋†’์€ ๋‹จ์ ์„ ๊ฐ€์ง€๊ณ  ์žˆ๋Š” ๊ฒƒ์„ ์•Œ ์ˆ˜ ์žˆ๋‹ค.

3) Salinecy map-based : Class Activation Map (CAM)

saliency map๊ธฐ๋ฐ˜์˜ ์„ค๋ช…๊ฐ€๋Šฅ ๋ฐฉ๋ฒ• ์ค‘์— ํ•˜๋‚˜์ธ class activation map (CAP) ๋ฐฉ๋ฒ•
notion image
[Zhou, Bolei, et al., Learning deep features for discriminative localization, CVPR 2016]
CAM(class activation map)์€ Global Average Pooling์ด๋ผ๋Š” ํŠน์ •ํ•œ layer๋ฅผ ๋งŒ๋“ค๊ณ  ๊ทธ๊ฒƒ์„ ํ™œ์šฉํ•˜์—ฌ ์„ค๋ช…์„ ์ œ๊ณตํ•˜๋Š” ๋ฐฉ๋ฒ•์ด๋‹ค.
๊ทธ๋ฆผ์—์„œ์ฒ˜๋Ÿผ Convolutionalย Neural Network ๊ธฐ๋ฐ˜์— ๋ถ„๋ฅ˜๊ธฐ๊ฐ€ ์žˆ๋‹ค๊ณ  ํ•˜๊ณ  ์ตœ์ข… ๋ ˆ์ด์–ด์—์„œ n๊ฐœ์˜ activation map์ด ๋‚˜์˜ค๊ณ (์—ฌ๊ธฐ์„œ ๊ฐ activation map๋“ค์€ ์ƒ‰๊น”๋กœ ๊ตฌ๋ถ„ํ•จ) ์ด๋•Œ GAP ๋ ˆ์ด์–ด๋Š” ๊ฐ activation map์˜ ๋ชจ๋“  Activation๋“ค์„ ํ‰๊ท ์„ ๋‚ด๋Š” ์—ฐ์‚ฐ์„ ๋œปํ•œ๋‹ค.
๊ทธ๋ ‡๊ฒŒ ๋˜๋ฉด ํ•œ Activation๋งˆ๋‹ค ํ•˜๋‚˜์˜ ์ˆซ์ž๋ฅผ ์–ป๊ฒŒ ๋˜๊ณ , ๊ทธ๊ฒƒ์ด ์—ฌ๊ธฐ ์˜ค๋ฅธ์ชฝ์— ๊ฐ ์ƒ‰๊น”์˜ ๋™๊ทธ๋ผ๋ฏธ๋กœ ํ‘œ์‹œ๋˜์—ˆ๋‹ค. ๊ทธ๋ ‡๊ฒŒ ๊ณ„์‚ฐ๋œ Activation map๋ณ„ ํ‰๊ท  Activation์— ์ตœ์ข… softmax output layer(ํ™•๋ฅ .. ๊ฐ€์ ธ์˜ด)๋ฅผ ๋ถ™์—ฌ์„œ ๊ฐ ํด๋ž˜์Šค๋งˆ๋‹ค ํ‰๊ท  ๋‚ธ Activation๋“ค์„ ์„ ํ˜•์ ์œผ๋กœ ๊ฒฐํ•ฉํ•ด์„œ ํด๋ž˜์Šค๋ณ„ ํ™•๋ฅ ์„ ๊ณ„์‚ฐํ•˜๋Š” ์•„์›ƒํ’‹ ๋ถ„๋ฅ˜๊ธฐ๋ฅผ ๋งŒ๋“ค์–ด์„œ ํ•™์Šต์„ ํ•˜๊ฒŒ ๋œ๋‹ค.
๊ทธ๋ ‡๊ฒŒ ํ•™์Šตํ•˜๊ฒŒ ๋˜๋ฉด ๊ทธ๋ฆผ์—์„œ ๋ณด๋Š” ๊ฒƒ์ฒ˜๋Ÿผ ๊ฐ class์— ๋Œ€ํ•œ, ์˜ˆ๋ฅผ ๋“ค์–ด์„œ Australian terrier ํด๋ž˜์Šค์— ๋Œ€ํ•œ activation์„ ๊ฒฐํ•ฉํ•˜์—ฌ ์Šค์ฝ”์–ด๋ฅผ ๊ณ„์‚ฐํ•˜๋Š” ์„ ํ˜•๊ณ„์ˆ˜๋“ค ๋ถ€ํ„ฐ (weight)๊นŒ์ง€ ์–ป๊ฒŒ ๋œ๋‹ค.
์—ฌ๊ธฐ๊นŒ์ง€ ํ•˜๊ณ  ๋‚œ ๋’ค์— CAM์ด ์–ป๋Š” ์„ค๋ช…์€ ๊ทธ ์•„๋ž˜์— ๋‚˜ํƒ€๋‚˜ ์žˆ๋Š” ๊ทธ๋ฆผ๊ณผ ๊ฐ™๋‹ค.
ย 
์ฆ‰, ์˜ˆ๋ฅผ ๋“ค์–ด์„œ ์–ด๋–ค ์ด๋ฏธ์ง€๊ฐ€ CNN ์ž…๋ ฅ์œผ๋กœ ๋“ค์–ด์˜ค๊ฒŒ ๋˜๋ฉด ๊ทธ ์ด๋ฏธ์ง€์— ํ•ด๋‹นํ•˜๋Š” activation๋“ค์ด ์ตœ์ข… ๋ ˆ์ด์–ด์˜ activation map์œผ๋กœ ๋‚˜ํƒ€๋‚˜๊ฒŒ ๋œ๋‹ค. ์ด ๊ฐ activation map๋“ค์€ ์•„๋ž˜์ชฝ์˜ ํŒŒ๋ž€์ƒ‰ ๋ฐฐ๊ฒฝ์ด๋ฏธ์ง€์— ํ‘œ์‹œ๋˜์–ด ์žˆ๋‹ค. ๊ทธ๋ ‡๊ฒŒ ์–ป์€ activation map๋“ค์ด ์žˆ์œผ๋ฉด ์œ„์—์„œ ๊ตฌํ•œ ์˜ˆ์ธกํ•œ ํด๋ž˜์Šค์— ๋Œ€ํ•œ Global Average Pooling๋ณ„๋กœ ํ•™์Šต์ด ๋œ ~ ์„ ํ™œ์šฉํ•ด์„œ ์ด activaiton map์„ ๊ฒฐํ•ฉํ•˜๊ฒŒ ๋œ๋‹ค.
๊ทธ๋ ‡๊ฒŒ ์ตœ์ข… ๊ฒฐํ•ฉํ•œ activaiton map์ด ์˜ค๋ฅธ์ชฝ์— ํ‘œํ˜„๋˜์–ด ์žˆ๊ณ  ์ด๊ฒƒ์„ ์›๋ž˜ ์ด๋ฏธ์ง€์— ๊ฒน์ณ์„œ ์‹œ๊ฐํ™”๋ฅผ ํ•ด๋ณด๋ฉด ์ •๋‹ต ํด๋ž˜์Šค์ธ Australian terrier๋ฅผ ์ด๋ฏธ์ง€ ๋‚ด์—์„œ ์ž˜ ํ•˜์ด๋ผ์ดํŠธ ํ•˜๊ณ  ์žˆ๋Š” ๊ฒƒ์„ ์•Œ ์ˆ˜ ์žˆ๋‹ค.
์ด๋ ‡๊ฒŒ activaiton์„ ๊ฒฐํ•ฉํ•˜์—ฌ ์„ค๋ช…์„ ๋งŒ๋“œ๋Š” ๋ฐฉ๋ฒ•์€ ์ง๊ด€์ ์œผ๋กœ๋„ ๋ง์ด ๋œ๋‹ค. ์ฆ‰, ์–ด๋–ค activation map์— activation์ด ํฌ๊ฒŒ ๋œ๋‹ค๋Š” ๊ฒƒ์€ ๊ทธ map์ด ์ฃผ์–ด์ง„ ์ž…๋ ฅ๊ณผ ๊ด€๋ จ์ด ๋งŽ๋‹ค๋Š” ๋œป์ด๊ณ , ๊ทธ๊ฒƒ์„ ๊ฒฐํ•ฉํ•˜๋Š” w๊ฐ€ ํฌ๋‹ค๋Š” ๊ฒƒ๋„ ์ตœ์ข… ๋ถ„๋ฅ˜์˜ ํฐ ์˜ํ–ฅ์„ ์ฃผ๋Š” activation์ด๋ผ๋Š” ๋œป์ด ๋ฏ€๋กœ, ๊ทธ๊ฒƒ์„ ๊ฒฐํ•ฉํ•˜๋ฉด ์ž…๋ ฅ์— ๋Œ€ํ•œ ์˜ˆ์ธก์„ ์ž˜ ์„ค๋ช…ํ•˜๋Š” ๋ฐฉ์‹์ด ๋˜๋Š” ๊ฒƒ์ด๋‹ค.
notion image
์ตœ์ข…์ ์ธ ๊ฒฐ๊ณผ๋ฅผ ์–ด๋–ป๊ฒŒ ์‹œ๊ฐํ™”ํ•˜๋Š”์ง€ ๋ณด์—ฌ์ฃผ๊ณ  ์žˆ๋‹ค. CNN์˜ ์ตœ์ข… layer ํ•ด์ƒ๋„๋Š” ๋ณดํ†ต ์›๋ž˜ ์ด๋ฏธ์ง€ ํ•ด์ƒ๋„์— ๋น„ํ•ด ๋–จ์–ด์ง€๊ฒŒ ๋˜๋ฏ€๋กœ upsamping์„ ํ†ตํ•ด์„œ ์ตœ์ข… ์‹œ๊ฐํ™”๋ฅผ ํ•œ๋‹ค.
notion image
CAM์˜ Global Average Pooling์„ ๊ฑฐ์ณ์„œ ์ตœ์ข… ๋ถ„๋ฅ˜ ์ ์ˆ˜๋ฅผ ๊ณ„์‚ฐํ•˜๋Š” ์‹์ด ์œ„์— ์“ฐ์—ฌ์žˆ๋‹ค.
์ด ์‹์˜ A๋Š” activation map์ด๊ณ  ์•ˆ์ชฝ์— ์žˆ๋Š” ์€ Global Average Pooling ํ•˜๋Š” ๊ฒƒ์„ ํ‘œํ˜„ํ•˜๊ณ  ์žˆ๋‹ค. ๊ฐ ํ”ฝ์…€ ij์— ๋Œ€ํ•ด์„œ ๋ชจ๋“  activation๋“ค์„ ๋”ํ•œ ๋‹ค์Œ์— ๊ทธ activationํฌ๊ธฐ(Z)๋กœ ๋‚˜๋ˆ„๋ฉด global average pooling์„ ํ•˜๋Š” ๊ฒƒ์ด๋‹ค.
๊ทธ๋Ÿฌ๊ณ  ๋‚˜์„œ , ๋Š” ํด๋ž˜์Šค c์— ๋Œ€ํ•œ W๋“ค์ด ๊ฐ activation k๋งˆ๋‹ค ์žˆ์–ด์„œ ์ด๋ ‡๊ฒŒ global average pooling ํ•œ activation์„ ๋‹ค์‹œ ๊ฒฐํ•ฉํ•ด์„œ ์ตœ์ข…์ ์ˆ˜ Y๋ฅผ ๊ณ„์‚ฐ ํ•˜๋Š” ๊ฒƒ์ด๋‹ค.
๋Š” class c์— ๋Œ€ํ•œ ์•„์›ƒํ’‹ ์Šค์ฝ”์–ด์ด๋‹ค.
์ด๋ ‡๊ฒŒ ์จ ๋†“๊ณ  ๋ณด๋ฉด ์šฐ๋ฆฌ๋Š” ๋‘ ๊ฐœ์˜ ์‹œ๊ทธ๋งˆ์˜ ์œ„์น˜๋ฅผ ๋ฐ”๊ฟ€ ์ˆ˜ ์žˆ๋Š” ๊ฒƒ์„ ์•Œ ์ˆ˜ ์žˆ๋‹ค. ์œ„์น˜๋ฅผ ๋ฐ”๊ฟ”์„œ ํ‘œํ˜„์„ ํ•˜๊ฒŒ ๋˜๋ฉด ์™ผ์ชฝ ์•„๋ž˜ ์žˆ๋Š” ์žˆ๋Š” L ํ‘œ์‹œ๋˜์–ด ์žˆ๋Š” ๊ฒƒ์ด ๊ทธ activation map์˜ ij ๋ฒˆ์งธ ํ”ฝ์…€๋งˆ๋‹ค ๋จผ์ € W๋ฅผ ์ด์šฉํ•ด์„œ ๊ฒฐํ•ฉ์„ ํ•  ์ˆ˜๊ฐ€ ์žˆ๊ณ  ๊ทธ๋ ‡๊ฒŒ ๊ฒฐํ•ฉ๋œ ๊ฐ’์ด ๋ฐ”๋กœ ์•ž์„œ ์‹œ๊ฐํ™”ํ•ด์„œ ๋ณด์—ฌ ๋“œ๋ฆฐ CAM์ด ๋˜๋Š” ๊ฒƒ์ด๋‹ค. ์—ฌ๊ธฐ ๊ฐ€ ํด๋ž˜์Šค C์— ๋Œ€ํ•œ CAM์— ๊ฒฐ๊ณผ๊ฐ’์„ ๋ณด์—ฌ์ฃผ๊ณ  ์žˆ๋Š” ๊ฒƒ์ด๋‹ค.
๊ทธ๋ฆฌ๊ณ  ์ด๋ ‡๊ฒŒ ๊ณ„์‚ฐ๋œ activation map์˜ CAM ๊ฐ’๋“ค์˜ ํ‰๊ท ์„ ๋‚ด๋ฉด ๋ฐ”๋กœ ํŠน์ •ํด๋ž˜์Šค์— ๋Œ€ํ•œ ๋ถ„๋ฅ˜ ์ ์ˆ˜๊ฐ€ ๋˜๋Š” ๊ฒƒ์„ ๋˜ ๋‹ค์‹œ ๋ณผ ์ˆ˜๊ฐ€ ์žˆ๋‹ค.
๋‹ค์Œ์€ CAM์œผ๋กœ ๊ตฌํ•œ ์„ค๋ช…๋“ค์— ๋Œ€ํ•œ ์˜ˆ์‹œ๋ฅผ ํ•œ๋ฒˆ ์‚ดํŽด๋ณด๋„๋ก ํ•˜๊ฒ ๋‹ค.
notion image
๊ทธ๋ฆผ์—์„œ ํด๋ž˜์Šค๋งˆ๋‹ค ์„ธ ์žฅ์˜ ์„œ๋กœ ๋‹ค๋ฅธ ์ž…๋ ฅ ์‚ฌ์ง„๋“ค์„ ๋ณด์—ฌ ์ฃผ๊ณ  ์žˆ๊ณ , ์‚ฌ์ง„ ์•„๋ž˜์— ์ œ๋Œ€๋กœ ๋œ ํด๋ž˜์Šค ์˜ˆ์ธก์— ๋Œ€ํ•œ CAM ์„ค๋ช…์„ ๋‚˜ํƒ€๋‚ด๊ณ  ์žˆ๋‹ค. ๊ทธ๋ฆผ์— ๋‚˜ํƒ€๋‚œ ๊ฑฐ์ฒ˜๋Ÿผ ํด๋ž˜์Šค๊ฐ€ ๊ฐ™๋”๋ผ๋„ ๋งค์šฐ ๋‹ค๋ฅธ ์ž…๋ ฅ๋“ค์ด ์ฃผ์–ด์กŒ์„ ๋•Œ๋„ ๋ถ„๋ฅ˜๊ธฐ๋Š” ์ œ๋Œ€๋กœ ์ •๋‹ต์„ ์˜ˆ์ธกํ•˜๊ณ , ๊ทธ ์˜ˆ์ธก์— ๋Œ€ํ•œ ์„ค๋ช…๋„ ๊ทธ๋ฆผ ๋‚ด์—์„œ ์ •๋‹ต์ด ํ•ด๋‹นํ•˜๋Š” ๊ฐ์ฒด๋“ค์„ ์ž˜ ์ฐพ์•„๋‚ด์–ด ํ•˜์ด๋ผ์ดํŠธํ•˜๊ณ  ์žˆ๋Š” ๊ฒƒ์„ ์•Œ ์ˆ˜๊ฐ€ ์žˆ๋‹ค.
notion image
์ด๋ ‡๊ฒŒ ๊ตฌํ•œ CAM ์„ค๋ช…์„ ์ด์šฉํ•˜๋ฉด ๋‹จ์ˆœํ•œ ์ด๋ฏธ์ง€ ๋ถ„๋ฅ˜ ์™ธ์—๋„ ๋‹ค๋ฅธ ๋” ๋ณต์žกํ•œ ์‘์šฉ ๋ถ„์•ผ์ธ Object Detection ์ด๋‚˜ Semantic segmentation์—๋„ ์ ์šฉํ•  ์ˆ˜ ์žˆ๋‹ค.
๊ทธ๋ฆผ์—์„œ ๋ณด๋Š” ๊ฒƒ์ฒ˜๋Ÿผ ์ฃผ์–ด์ง„ ์ด๋ฏธ์ง€์— ๋ถ„๋ฅ˜ ๊ฒฐ๊ณผ๋ฅผ ์–ป์€ ๋’ค, ๊ทธ์— ๋Œ€ํ•œ CAM ์„ค๋ช…์„ ์–ป์œผ๋ฉด ์˜ค๋ฅธ์ชฝ์— ๋ณด์ด๋Š” ๊ฒƒ์ฒ˜๋Ÿผ ์ด๋ฏธ์ง€ ๋‚ด์— ๊ฐ์ฒด์— ๋Œ€ํ•œ ํ•˜์ด๋ผ์ดํŠธ๋ฅผ ์–ป์„ ์ˆ˜ ์žˆ๋‹ค. ๊ฒฐ๊ณผ๋ฅผ ํ†ตํ•ด, ์ ์ ˆํ•œ ๊ฐ์ฒด๋ฅผ ์ œ๋Œ€๋กœ ๋ณด๊ณ  ํ•ด๋‹น ๋ถ„๋ฅ˜ ๊ฒฐ๊ณผ๋ฅผ ๋‚ด์—ˆ๋‹ค๋Š” ๊ฒƒ์„ ์•Œ ์ˆ˜๊ฐ€ ์žˆ๋‹ค. ์ถ”๊ฐ€๋กœ ์ด๋ ‡๊ฒŒ ์–ป์€ ํ•˜์ด๋ผ์ดํŠธ๋œ ๊ทธ ๊ฐ’๋“ค์„ ์ ์ ˆํ•œ thersholding์„ ํ•ด์ฃผ๊ฒŒ ๋˜๋ฉด ์™ผ์ชฝ ์ด๋ฏธ์ง€์—์„œ ๋ณด๋Š” ๊ฒƒ์ฒ˜๋Ÿผ ์ด๋ฏธ์ง€ ๋‚ด์— ๊ฐ์ฒด์— ๋Œ€ํ•œ ๋ฐ”์šด๋”ฉ ๋ฐ•์Šค๋ฅผ ์–ป์„ ์ˆ˜ ์žˆ๋‹ค.
์‹ค์ œ๋กœ ์ด๋ ‡๊ฒŒ CAM์„ ์ด์šฉํ•ด์„œ ์ด๋ฏธ์ง€๋งˆ๋‹ค ๋‹จ์ˆœํ•œ classification ๋ ˆ์ด๋ธ”๋งŒ ์ฃผ์–ด์ ธ ์žˆ์„ ๋•Œ๋„ ํ•ด๋‹น ๋ฐ์ดํ„ฐ๋ฅผ ํ™œ์šฉํ•ด ๋ถ„๋ฅ˜๊ธฐ๋ฅผ ํ•™์Šตํ•œ ๋’ค, ์ด CAM ์ •๋ณด๋ฅผ ํ†ตํ•ด ๋ฐ”์šด๋”ฉ ๋ฐ•์Šค๋ฅผ ์ณ์ฃผ๋Š” object detection, ๋˜๋Š” ํ”ฝ์…€๋งˆ๋‹ค ๋ ˆ์ด๋ธ” ํ•ด์ฃผ๋Š” Semantic segmentation์˜ ํ™œ์šฉํ•  ์ˆ˜ ์žˆ๋‹ค. ์ด๋Ÿฌํ•œ ๊ฒƒ๋“ค์„ ํ†ตํ‹€์–ด์„œ weakly Supervised Learning์ด๋ผ๊ณ  ํ•œ๋‹ค. ๊ด€๋ จ ์—ฐ๊ตฌ๋“ค๋„ ๋งค์šฐ ํ™œ๋ฐœํ•˜๊ฒŒ ์ง„ํ–‰๋˜๊ณ  ์žˆ๋‹ค.

3-1) Strength and Weakness points of CAM method

notion image
์žฅ์ ์€ ์•ž์„œ ์˜ˆ๋“ค์—์„œ ๋ณธ ๊ฒƒ์ฒ˜๋Ÿผ ๋ชจ๋ธ์ด ์ค‘์š”ํ•˜๊ฒŒ ๋ณด๊ณ  ์žˆ๋Š” ์ด๋ฏธ์ง€ ๋‚ด์— object๋“ค์„ ์ •ํ™•ํ•˜๊ฒŒ ๊น”๋”ํ•˜๊ฒŒ ์žก์•„๋‚ธ๋‹ค.
๋‹จ์ ์€ ์ด ๋ฐฉ๋ฒ•์€ model-specificํ•œ ์„ค๋ช…์ด๋‹ค. CAM์€ ํ•ญ์ƒ global average pooling์ด ๋งˆ์ง€๋ง‰์— ๋‹ฌ๋ ค์žˆ๋Š” ๋ชจ๋ธ์—๋งŒ ์ ์šฉ์ด ๊ฐ€๋Šฅํ•˜๊ณ  ๊ทธ๋ ‡์ง€ ์•Š์€ ๋ชจ๋ธ์—๋Š” ์ ์šฉํ•  ์ˆ˜ ์—†๋‹ค.
ํ•˜์ง€๋งŒ, ์‹ค์ œ๋กœ ๋งŽ์€ ๊ฒฝ์šฐ์—๋Š” global average pooling ๋ ˆ์ด์–ด๊ฐ€ ์—†๋Š” ๋ชจ๋ธ๋“ค์ด ๋Œ€๋ถ€๋ถ„์ด๊ณ , ๊ทธ๋Ÿฐ ๊ฒฝ์šฐ์—๋Š” CAM์„ ์ด์šฉํ•ด์„œ ์„ค๋ช…ํ•  ์ˆ˜๊ฐ€ ์—†๊ฒŒ ๋œ๋‹ค.
๋˜ํ•œ CAM ์„ค๋ช…์€ ๋งˆ์ง€๋ง‰ ์ปจ๋ณผ๋ฃจ์…˜ ๋ ˆ์ด์–ด์˜ activation map์—์„œ๋งŒ ์–ป์„ ์ˆ˜ ์žˆ์œผ๋ฏ€๋กœ ๊ทธ Visualization ํ•ด์ƒ๋„๊ฐ€ ๋งŽ์ด ๋–จ์–ด์ง€๋Š” ๋‹จ์ ์ด ์žˆ๋‹ค. ์ถ”๊ฐ€๋กœ, ์•ž ๊ทธ๋ฆผ์˜ ์˜ˆ์‹œ์—์„œ Visualization์ด ๋Œ€๋žต์ ์œผ๋กœ๋งŒ ๊ฐ์ฒด๋ฅผ ์ง‘์–ด๋‚ด๊ณ  ์žˆ์ง€, ์ •ํ™•ํ•˜๊ฒŒ ๊ฐ์ฒด์˜ ๋ฐ”์šด๋”๋ฆฌ๊นŒ์ง€ ์ฐพ์•„๋‚ด๋Š” ๋Œ€์—๋Š” ํ•œ๊ณ„๊ฐ€ ์žˆ๋‹ค.
์ด๋ ‡๊ฒŒ ์‚ดํŽด๋ณธ CAM์˜ ๋‹จ์ ๋“ค์„ ๊ทน๋ณตํ•˜๊ธฐ ์œ„ํ•ด์„œ ๋‚˜์˜จ ๋ฐฉ๋ฒ•์ด ๋ฐ”๋กœ Grad-CAM์ด๋ผ๋Š” ๋ฐฉ๋ฒ•์ด๋‹ค.

4) Salinecy map-based : Grad-CAM

[Selvaraju, Ramprasaath R., et al. "Grad-cam: Visual explanations from deep networks via gradientbased localization." ICCV 2017]
[Selvaraju, Ramprasaath R., et al. "Grad-cam: Visual explanations from deep networks via gradientbased localization." ICCV 2017]
  • CAM ๋ฐฉ๋ฒ•๋ก  ์ดํ›„ 1๋…„ ๋’ค์— ๋“ฑ์žฅ
  • 2017๋…„๋„ ICCV์—์„œ ์†Œ๊ฐœ๋จ
์ด๋ฆ„์—์„œ๋„ ์•Œ ์ˆ˜ ์žˆ๋“ฏ์ด Grad-CAM์€ gradient ์ •๋ณด๋ฅผ ํ™œ์šฉํ•ด์„œ ํ™•์žฅํ•œ ์„ค๋ช… ๋ฐฉ๋ฒ•์ด๋‹ค. global average pooling์ด ์—†๋Š” ๋ชจ๋ธ์—๋„ ๋‹ค ์ ์šฉ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•œ ๋ฐฉ๋ฒ•์ด๋‹ค.
CAM์˜ ์ˆ˜์‹์„ ๋ณด๋ฉด ํด๋ž˜์Šค c์— ๋Œ€ํ•œ ij๋ฒˆ์งธ activation ํ”ฝ์…€์— ๋Œ€ํ•œ ์ค‘์š”๋„๋Š” ์—ฌ๋Ÿฌ activation map๋“ค์˜ ij๋ฒˆ์งธ ํ”ฝ์…€๊ฐ’์„ w๋ฅผ ์ด์šฉํ•ด์„œ ๊ฒฐํ•ฉํ•œ ๊ฒƒ์ด์—ˆ๋Š”๋ฐ, ์ด๋•Œ w๋Š” global average pooling layer ์œ„์— ๋ถ™์–ด ์žˆ๋Š” ์ตœ์ข… ์•„์›ƒํ’‹ layer์—์„œ ํ•™์Šตํ•œ w๋“ค์ด ์‚ฌ์šฉ๋˜์—ˆ๋‹ค.
grad-CAM์—์„œ๋Š” ์ด๋Ÿฌํ•œ global average pooling ์—†๋Š” ๋ชจ๋ธ์—๋„ ์ด๋Ÿฐ activation์„ ๊ฒฐํ•ฉํ•˜๋Š” ๋ฐฉ์‹์„ ๋ณด์™„ํ•˜์˜€๋‹ค. ํ•™์Šตํ•œ w๋ฅผ ์‚ฌ์šฉํ•˜๋Š” CAM๊ณผ ๋‹ฌ๋ฆฌ ์œ„์˜ ์ˆ˜์‹์— ๋‚˜์™€์žˆ๋Š”๊ฑฐ ์ฒ˜๋Ÿผ, ํ•ด๋‹น activation map์—์„œ ๊ตฌํ•œ gradient๋“ค์˜ global average pooling ๋œ ๊ฐ’์„ w๋กœ ์‚ฌ์šฉํ•˜๊ณ  ์žˆ๋‹ค. ์ฆ‰, ์–ด๋–ค w๊ฐ€ ํŠน์ • ๋ชจ๋ธ ๊ตฌ์กฐ๋ฅผ ๊ฐ€์ง€๊ณ  ํ•™์Šต๋œ w๋ฅผ ์‚ฌ์šฉํ•˜๋Š” ๊ฒƒ์ด ์•„๋‹ˆ๋ผ, ์–ด๋Š activation map์—์„œ๋„ ๊ทธ activation map์˜ gradient๋ฅผ ๊ตฌํ•œ ๋‹ค์Œ์— ๊ทธ๊ฒƒ์˜ global average pooling๊ฐ’์œผ๋กœ w๋ฅผ ์ ์šฉํ•œ๋‹ค๋Š” ๋œป์ด๋‹ค.
๊ทธ๋ ‡๊ฒŒ ๊ตฌํ•œ grad-CAM์˜ w๋กœ activation์„ ๊ฒฐํ•ฉํ•˜๊ณ  ๊ทธ ๊ฒฐ๊ณผ๊ฐ’๋“ค์ด ์–‘์ˆ˜์ผ ๋•Œ์—๋งŒ ์ตœ์ข…์ ์œผ๋กœ ์ทจํ•จ์œผ๋กœ์„œ grad-CAM์˜ ์„ค๋ช…์„ ์–ป๋Š”๋‹ค.
notion image
ํ™œ์šฉํ•˜๊ณ ์ž ํ•˜๋Š” ๋ ˆ์ด์–ด์˜ activation map๊นŒ์ง€ back propagation์„ ํ•ด์„œ gradient๋ฅผ ๊ตฌํ•œ ๋’ค, ๊ทธ gradient๋ฅผ poolingํ•ด์„œ ๊ทธ ํ•ด๋‹น activaiton map์„ ๊ฒฐํ•ฉํ•˜๋Š” w๋กœ ์‚ฌ์šฉํ•˜๊ณ  ์ตœ์ข…์ ์œผ๋กœ ์„ค๋ช…์„ ๊ตฌํ•œ๋‹ค. ์ด๋ ‡๊ฒŒ ๊ตฌํ•œ Grad-CAM์˜ ์„ค๋ช… ๊ฒฐ๊ณผ๋ฅผ์ด ๊ทธ๋ฆผ๋“ค์—์„œ ๋ณด์—ฌ ์ฃผ๊ณ  ์žˆ๋‹ค.
notion image
์ฒซ๋ฒˆ์งธ ์˜ˆ์ œ ์‚ฌ์ง„์€ ๊ฐ•์•„์ง€์™€ ๊ณ ์–‘์ด๊ฐ€ ๊ฐ™์ด ์žˆ๋Š” ์ด๋ฏธ์ง€์— ๋Œ€ํ•œ ์„ค๋ช… ๊ฒฐ๊ณผ๋ฅผ ๋ณด์—ฌ์ฃผ๊ณ  ์žˆ๋Š”๋ฐ, ๊ฐ•์•„์ง€์— ํ•ด๋‹นํ•˜๋Š” ์ถœ๋ ฅ์— ๋Œ€ํ•œ ์„ค๋ช…(์˜ค๋ฅธ์ชฝ์— ์žˆ๋Š” ๊ทธ๋ฆผ)๊ณผ, ๊ทธ๋ฆฌ๊ณ  ๊ณ ์–‘์ด์— ํ•ด๋‹นํ•˜๋Š” ์ถœ๋ ฅ์— ๋Œ€ํ•œ ์„ค๋ช…(๊ฐ€์šด๋ฐ์— ์žˆ๋Š” ๊ทธ๋ฆผ)์ด ํ™•์‹คํžˆ ์ž˜ ๊ตฌ๋ถ„๋˜๊ณ , ๊ฐ๊ฐ ํ•ด๋‹น ์˜ค๋ธŒ์ ํŠธ๋ฅผ ์ž˜ ์‹œ๊ฐํ™”ํ•˜๊ณ  ์žˆ๋Š” ๊ฒƒ์„ ์•Œ ์ˆ˜ ์žˆ๋‹ค.
๋˜ํ•œ, ์ด๋Ÿฐ Grad-CAM ์ด์šฉํ•˜๋ฉด ํ•™์Šต๋œ ๋ชจ๋ธ์ด ๊ณผ์—ฐ ์ œ๋Œ€๋กœ ์˜ˆ์ธก์„ ํ•˜๊ณ  ์žˆ๋Š”์ง€ ๋˜๋Š” ์ด ๋ชจ๋ธ์˜ ์˜ˆ์ธก์— ํŽธํ–ฅ์„ฑ์— ์กด์žฌํ•˜์ง€ ์•Š๋Š”์ง€๋„ ์•Œ์•„๋‚ผ ์ˆ˜ ์žˆ๋‹ค.
๋‘๋ฒˆ์งธ ์˜ˆ์ œ์—์„œ ์ž…๋ ฅ ์‚ฌ์ง„์„ ๊ฐ„ํ˜ธ์‚ฌ๋ผ๊ณ  ๋ถ„๋ฅ˜๋ฅผ ํ–ˆ์„ ๋•Œ, ๋งŒ์•ฝ ๊ทธ ๋ชจ๋ธ์˜ ์˜ˆ์ธก ์ถœ๋ ฅ์— ๋Œ€ํ•œ grad-CAM์„ ๊ตฌํ•ด ๋ดค์„ ๋•Œ ๊ฐ€์šด๋ฐ ์ด๋ฏธ์ง€์ฒ˜๋Ÿผ ์—ฌ์„ฑ ๋˜๋Š” ์–ผ๊ตด์ด ์ค‘์š”ํ•˜๋‹ค๊ณ  ๋‚˜์˜ค๊ฒŒ ๋˜๋ฉด์ด ๋ชจ๋ธ์€ ์„ฑ๋ณ„์— ๋Œ€ํ•˜์—ฌ ํŽธํ–ฅ๋˜์–ด์žˆ๋Š” ๋ชจ๋ธ์„ ๊ฐ€๋Šฅ์„ฑ์ด ํฌ๋‹ค.
๋ฐ˜๋ฉด ์˜ค๋ฅธ์ชฝ ์ด๋ฏธ์ง€์ฒ˜๋Ÿผ Grad-CAM ์„ค๋ช… ๊ฒฐ๊ณผ๊ฐ€ ์ฒญ์ง„๊ธฐ์™€ ๊ฐ™์€ ์˜๋ฃŒ ๋„๊ตฌ์— focus ๋˜์–ด ์žˆ์œผ๋ฉด ์ด ๋ชจ๋ธ์€ ๋น„๊ต์  ํŽธํ–ฅ๋˜์ง€ ์•Š์€ ์ƒํƒœ์—์„œ ์˜ฌ๋ฐ”๋ฅด๊ฒŒ ๋ถ„๋ฅ˜๋ฅผ ํ•˜๊ณ  ์žˆ๋Š” ๊ฒƒ์„ ์•Œ ์ˆ˜ ์žˆ๋‹ค.

4-1) Strength and Weakness points of Grad-CAM method

notion image
์žฅ์ ์€ CAM๊ณผ ๋‹ฌ๋ฆฌ model-agnosticํ•˜๋‹ค. ์ฆ‰, ๊ทธ๋ฆผ์—์„œ ๋ณด์‹œ๋Š” ๊ฒƒ์ฒ˜๋Ÿผ ๋ชจ๋ธ์ด ์–ด๋–ค ์ถœ๋ ฅ ๊ตฌ์กฐ๋ฅผ ๊ฐ€์ง€๊ณ  ์žˆ๋”๋ผ๋„ ์ƒ๊ด€์—†์ด ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋‹ค. ๊ทธ ๋ชจ๋ธ์ด ๋ถ„๋ฅ˜๋ฅผ ํ•˜๋Š” ๋ชจ๋ธ์ด๋“  ๋˜๋Š” ์ด๋ฏธ์ง€์บก์…”๋‹์„ ํ•˜๋Š” ๋ชจ๋ธ์ด๋“ , ๋ชจ๋ธ์˜ ์ถœ๋ ฅ์œผ๋กœ๋ถ€ํ„ฐ ๋ฐฑ๋ณธ์ด ๋˜๋Š” CNN ๋ชจ๋ธ์˜ activation layer๊นŒ์ง€ back propagationํ†ตํ•ด gradient๋ฅผ ๊ตฌํ•  ์ˆ˜๋งŒ ์žˆ๋‹ค๋ฉด, ๋‹ค ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋Š” ๋ฐฉ๋ฒ•์ธ ๊ฒƒ์ด๋‹ค.
๋‹จ์ ์€, activaiton์„ ๊ฒฐํ•ฉํ•˜๋Š” ์ด w๋กœ ํ‰๊ท  gradient๋ฅผ ์‚ฌ์šฉํ•˜๊ฒŒ ๋˜๋Š”๋ฐ, ์ด๊ฒƒ์ด ๊ทธ๋ ‡๊ฒŒ ์ •ํ™•ํ•˜์ง€ ์•Š์„ ๋•Œ๊ฐ€ ์žˆ๋‹ค๋Š” ๊ฒƒ์ด๋‹ค. ์ฆ‰, gradient๊ฐ€ ํฌ๋‹ค๋Š” ๊ฒƒ์€ ํ•ด๋‹น activation์— ๋Œ€ํ•œ ์ถœ๋ ฅ๊ฐ’์˜ ๋ฏผ๊ฐ๋„๊ฐ€ ํฌ๋‹ค๋Š” ๋ง์ด์ง€๋งŒ, ๊ทธ๊ฒƒ์ด ๋ฐ˜๋“œ์‹œ ๊ทธ activaiton์ด ์ตœ์ข… ๊ฒฐ๊ณผ๋ฅผ ๊ณ„์‚ฐํ•˜๋Š”๋ฐ ์žˆ์–ด์„œ ์ค‘์š”๋„๋ฅผ ์ •ํ™•ํžˆ ๋ฐ˜์˜ํ•˜์ง€ ์•Š๋Š”๋‹ค๋Š” ๊ฒƒ์ด๋‹ค.
์—ฌ๊ธฐ๊นŒ์ง€ white-box ์„ค๋ช…๋ฐฉ๋ฒ•์— ๊ธฐ๋ฐ˜ํ•œ saliency map๋ฐฉ์‹์˜ ์„ค๋ช…๋ฐฉ๋ฒ•์— ๋Œ€ํ•œ ์„ค๋ช…์ด์—ˆ๋‹ค.
ย 

<Perturbation-based>

notion image
๋‹ค์Œ์œผ๋กœ๋Š” ๋ชจ๋ธ์˜ ์ •ํ™•ํ•œ ๊ตฌ์กฐ๋‚˜ ๊ณ„์ˆ˜๋ฅผ ๋ชจ๋ฅด๋Š” ์ƒํƒœ์—์„œ ๊ทธ ๋ชจ๋ธ์— ๋Œ€ํ•œ ์ž…์ถœ๋ ฅ์— ๋Œ€ํ•œ ์ •๋ณด๋งŒ ๊ฐ€์ง€๊ณ  ์žˆ๋Š” ๊ฒฝ์šฐ์— ์„ค๋ช…ํ•˜๋Š” ๋ฐฉ๋ฒ•์— ๋Œ€ํ•ด ์†Œ๊ฐœํ•˜๊ฒ ๋‹ค. ์ด๋Ÿฐ ๋ฐฉ๋ฒ•๋“ค์€ ์ฃผ๋กœ perturbation ๊ธฐ๋ฐ˜ ๋ฐฉ๋ฒ•์ด๋ผ๊ณ ๋„ ๋ถˆ๋ฆฐ๋‹ค. ๊ทธ ์ด์œ ๋Š” ์ž…๋ ฅ ๋ฐ์ดํ„ฐ๋ฅผ ์กฐ๊ธˆ์”ฉ ๋ฐ”๊พธ๋ฉด์„œ ๊ทธ์— ๋Œ€ํ•œ ์ถœ๋ ฅ์„ ๋ณด๊ณ  ๊ทธ ๋ณ€ํ™”์— ๊ธฐ๋ฐ˜์—์„œ ์„ค๋ช…์„ ํ•˜๋Š” ๋ฐฉ์‹์ด ๋•Œ๋ฌธ์ด๋‹ค.

1) Perturbation based : LIME

[Ribeiro et al., "Why Should I Trust You?" Explaining the Predictions of Any Classifier, KDD, 2016]
[Ribeiro et al., "Why Should I Trust You?" Explaining the Predictions of Any Classifier, KDD, 2016]
์ฒซ ๋ฒˆ์งธ๋กœ ์„ค๋ช…ํ•  ๋ฐฉ๋ฒ•์€ local Interpretable model-agnostic Explanations(LIME)์ด๋ผ๋Š” ๋ฐฉ๋ฒ•์ด๋‹ค.
์ด ๋ฐฉ๋ฒ•์€ ์–ด๋–ค ๋ถ„๋ฅ˜๊ธฐ๊ฐ€ ๋”ฅ๋Ÿฌ๋‹ ๋ชจ๋ธ์ฒ˜๋Ÿผ ๋งค์šฐ ๋ณต์žกํ•œ ๋น„์„ ํ˜•์  ํŠน์ง•์„ ๊ฐ€์ง€๊ณ  ์žˆ๋”๋ผ๋„, ์ฃผ์–ด์ง„ ๋ฐ์ดํ„ฐ ํฌ์ธํŠธ๋“ค์˜ ๋Œ€ํ•ด์„œ๋Š” ์•„์ฃผ localํ•˜๊ฒŒ๋Š” ๋‹ค ์„ ํ˜•์ ์ธ ๋ชจ๋ธ๋กœ ๊ทผ์‚ฌํ™”๊ฐ€ ๊ฐ€๋Šฅํ•˜๋‹ค๋Š” ๊ฒƒ์—์„œ ์ถœ๋ฐœํ•œ ๊ฐœ๋…์ด๋‹ค.
๊ทธ๋ž˜์„œ ์ด ๋ฐฉ๋ฒ•์€ ์ฃผ์–ด์ง„ ๋ฐ์ดํ„ฐ๋ฅผ ์กฐ๊ธˆ์”ฉ perturbationํ•˜๋ฉด์„œ ๊ทธ perturb๋œ ์ž…๋ ฅ๋ฐ์ดํ„ฐ๋ฅผ ๋ชจ๋ธ์˜ ์—ฌ๋Ÿฌ๋ฒˆ ํ†ต๊ณผ์‹œํ‚ด์œผ๋กœ์จ ๋‚˜์˜ค๋Š” ์ถœ๋ ฅ์„ ๋ณด๊ณ , ์ด๋ ‡๊ฒŒ ๋‚˜์˜จ ์ž…์ถœ๋ ฅ pair(์ด๋ฏธ์ง€, ์ถœ๋ ฅ ํ™•๋ฅ ๊ฐ’)๋“ค์„ ๊ฐ„๋‹จํ•œ ์„ ํ˜• ๋ชจ๋ธ๋กœ ๊ทผ์‚ฌํ•จ์œผ๋กœ์จ ์„ค๋ช…์„ ์–ป์–ด๋‚ด๋Š” ๋ฐฉ๋ฒ•์ด๋‹ค.
notion image
๊ทธ๋ฆผ์˜ˆ์‹œ์ฒ˜๋Ÿผ ์•„์ฃผ ๋ณต์žกํ•œ Decisionย boundary๋ฅผ ๊ฐ€์ง€๊ณ  ์žˆ๋Š” ๋ชจ๋ธ์ด๋”๋ผ๋„ ํ•ด๋‹นํฌ์ธํŠธ(๋นจ๊ฐ„์ƒ‰ ์‹ญ์ž๊ฐ€๋กœ ํ‘œ์‹œ๋˜์–ด ์žˆ๋Š” ํ•ด๋‹นํฌ์ธํŠธ) ๊ทผ์ฒ˜์—์„œ๋Š” ๋‹ค ์„ ํ˜•๋ชจ๋ธ๋กœ ๊ทผ์‚ฌํ•  ์ˆ˜ ์žˆ๊ณ , ๊ทธ ์„ ํ˜•๋ชจ๋ธ์„ ์ด์šฉํ•ด์„œ ์„ค๋ช…์„ ํ•˜๊ฒ ๋‹ค ๋ผ๋Š” ๋ฐฉ๋ฒ•์ด๋‹ค.
notion image
์˜ˆ๋ฅผ ๋“ค์–ด์„œ ์ฃผ์–ด์ง„ ๊ฐœ๊ตฌ๋ฆฌ์ด๋ฏธ์ง€์—์„œ ์ผ๋‹จ ์ด ๊ฐœ๊ตฌ๋ฆฌ ์ด๋ฏธ์ง€๋ฅผ ์Šˆํผํ”ฝ์…€(์ง€๊ฐ์ ์œผ๋กœ(perceptually) ์˜๋ฏธ์žˆ๋Š” ํ”ฝ์…€๋“ค์„ ๋ชจ์•„์„œ ๊ทธ๋ฃนํ™”)๋กœ ์„ธ๊ทธ๋ฉ˜ํ…Œ์ด์…˜์„ ํ•ด์ฃผ๊ณ  ์˜ค๋ฅธ์ชฝ๊ณผ ๊ฐ™์€ Interpretable components๋“ค์„ ์–ป๋Š”๋‹ค.
notion image
๊ทธ๋ฆฌ๊ณ  ๋‚˜์„œ ์ด๋Ÿฌํ•œ ์Šˆํผํ”ฝ์…€๋“ค์„ ๊ต๋ž€(perturbation)ํ•œ๋‹ค.
๊ทธ๋ ‡๊ฒŒ ํ•ด์„œ ๊ฐ€์šด๋ฐ ๋ณด์ด๋Š” ๊ทธ๋ฆผ์ฒ˜๋Ÿผ ๋‹ค์–‘ํ•œ ๊ต๋ž€๋œ ๊ทธ๋ฆผ๋“ค์„ ์–ป๊ฒŒ ๋œ๋‹ค. ์–ด๋–ค ์Šˆํผํ”ฝ์…€๋“ค์€ ์กด์žฌํ•˜๊ณ  ์–ด๋–ค ์Šˆํผํ”ฝ์…€๋“ค์€ ๊ทธ๋ƒฅ ์—†๋Š” ์ƒํƒœ๋กœ ๋žœ๋คํ•˜๊ฒŒ ๋งŒ๋“œ๋Š” ๊ฒƒ์ด๋‹ค.
์ด๋ ‡๊ฒŒ perturb๋œ ๊ทธ๋ฆผ๋“ค ๊ฐ๊ฐ์— ๋Œ€ํ•œ ๋ชจ๋ธ์„ ํ†ต๊ณผํ–ˆ์„ ๋•Œ ์–ป๊ฒŒ๋˜๋Š” ๊ทธ ์ถœ๋ ฅ ํ™•๋ฅ ์„ ์–ป์„ ์ˆ˜ ์žˆ๊ฒŒ ๋˜๊ณ , ๊ฐœ๊ตฌ๋ฆฌ์— ๋Œ€ํ•œ ์Šค์ฝ”์–ด๊ฐ€ ์–ด๋–ป๊ฒŒ ๋ฐ”๋€Œ๋Š”์ง€ ๋ณด์—ฌ์ฃผ๊ณ  ์žˆ๋‹ค.
๋งจ ์œ„์— ์žˆ๋Š” perturbation ๊ฐ™์€ ๊ฒฝ์šฐ๋Š” ์—ฌ์ „ํžˆ ๊ต๋ž€๋œ ์ด๋ฏธ์ง€๋ฅผ ๊ฐœ๊ตฌ๋ฆฌ๋ผ๊ณ  ์˜ˆ์ธกํ•  ํ™•๋ฅ ์ด ์ƒ๋‹นํžˆ ๋†’๊ฒŒ ๋‚˜์˜ค๊ณ , ์œ„์—์„œ ๋‘ ๋ฒˆ์งธ ์žˆ๋Š” ์ด๋ฏธ์ง€ ๊ฐ™์€ ๊ฒฝ์šฐ์—๋Š” ๊ฐœ๊ตฌ๋ฆฌ๋ผ๊ณ  ์˜ˆ์ธกํ•  ํ™•๋ฅ ์ด ๊ฑฐ์˜ ์—†๊ฒŒ ๋‚˜์˜ค๋Š” ๊ฒƒ์ด๋‹ค.
perturb๋œ ์ด๋ฏธ์ง€์™€ ์ถœ๋ ฅ ํ™•๋ฅ ๊ฐ’์˜ pair๋ฅผ ์ด์šฉํ•ด์„œ ๊ฐ ์Šˆํผ ํ”ฝ์…€๋“ค์„ ์ž˜ ๊ฒฐํ•ฉํ•˜๋Š” ์„ ํ˜•๊ณ„์ˆ˜๋“ค์„ ํ•™์Šตํ•  ์ˆ˜ ์žˆ๊ณ  ๊ทธ ๊ณ„์ˆ˜๋“ค์„ ์ด์šฉํ•ด์„œ ์Šˆํผํ”ฝ์…€๋“ค์„ ๋‹ค์‹œ ๊ฒฐํ•ฉํ–ˆ์„ ๋•Œ, ๋‚˜์˜ค๋Š” ์ด๋ฏธ์ง€๊ฐ€ ์˜ค๋ฅธ์ชฝ์— ์žˆ๋Š” ์ตœ์ข… ์„ค๋ช…์ด ๋œ๋‹ค.
์ฆ‰, ์ฃผ์–ด์ง„ ์ด๋ฏธ์ง€ ๋‚ด์—์„œ ์ด ์ด๋ฏธ์ง€๋ฅผ ๊ฐœ๊ตฌ๋ฆฌ๋ผ๊ณ  ์˜ˆ์ธก์„ ํ•  ๋•Œ, ์ด ๋ฐฉ๋ฒ•์„ ํ†ตํ•ด์„œ ์–ป์€ ์„ค๋ช…์€ ๊ฐœ๊ตฌ๋ฆฌ ๋จธ๋ฆฌ์— ํ•ด๋‹นํ•˜๋Š” ๋ถ€๋ถ„์ด๋‹ค. ์ฆ‰ ๋ถ„๋ฅ˜์˜ ์ค‘์š”ํ•œ ์—ญํ• ์„ ํ•˜๋Š” ์Šˆํผ ํ”ฝ์…€๋“ค์„ ์ž˜ ์ฐพ์•„๋‚ด๋Š” ๊ฒƒ์„ ์•Œ ์ˆ˜๊ฐ€ ์žˆ๋‹ค.
notion image
์ด๋ ‡๊ฒŒ ๋™์ž‘ํ•˜๋Š” LIME ๋ฐฉ๋ฒ•์„ ํ™œ์šฉํ•˜๋ฉด ๊ทธ๋ฆผ์—์„œ ๋ณด๋Š” ๊ฒƒ๊ณผ ๊ฐ™์€ ์žฌ๋ฏธ์žˆ๋Š” ๊ฒฐ๊ณผ๋ฅผ ์–ป์„ ์ˆ˜๊ฐ€ ์žˆ๋‹ค.
์—ฌ๊ธฐ ์™ผ์ชฝ์— ์žˆ๋Š” ์˜ค๋ฆฌ์ง€๋„ ์ด๋ฏธ์ง€์— ๋Œ€ํ•ด์„œ โ€œeletric guitar" ๋ผ๊ณ  ์˜ˆ์ธกํ•˜๋Š” ๊ฒฝ์šฐ์— ๋Œ€ํ•œ ์„ค๋ช…์ด ๋‘ ๋ฒˆ์งธ ๊ทธ๋ฆผ์ด๊ณ , ๊ทธ ๋‹ค์Œ์— โ€œAcoustic guitarโ€๋ผ๊ณ  ์˜ˆ์ธกํ•˜๋Š” ๊ฒฝ์šฐ์— ๋Œ€ํ•œ ์„ค๋ช…์ด๊ณ , ์„ธ ๋ฒˆ์งธ๊ฐ€ โ€œLabradorโ€๋ผ๋Š” ๊ฐ•์•„์ง€์ข…๋ฅ˜๋ผ๊ณ  ์˜ˆ์ธกํ•˜๋Š” ๊ฒฝ์šฐ์—๋Š” ๊ทธ ์„ค๋ช…์ด ๋งจ ์˜ค๋ฅธ์ชฝ์— ๋‚˜ํƒ€๋‚˜์žˆ๋‹ค.
๊ฐ๊ฐ์— ์˜ˆ์ธก์— ๋Œ€ํ•ด์„œ LIME ์„ค๋ช… ๋ฐฉ๋ฒ•์ด ๋‹ค๋ฅด์ง€๋งŒ, ์ •ํ™•ํ•œ ๊ทธ๋Ÿฐ ์„ค๋ช…๋“ค์„ ๋งŒ๋“ค์–ด ๋‚ด๊ณ  ์žˆ์Œ์„ ์•Œ ์ˆ˜๊ฐ€ ์žˆ๋‹ค.

1-1) Strength and Weakness points of LIME method

ex) A model the predicts sepia-toned images to be retro
ex) A model the predicts sepia-toned images to be retro
์ด๋ ‡๊ฒŒ ๊ตฌํ•˜๋Š” LIME ๋ฐฉ๋ฒ•์€ Black-Box์„ค๋ช… ๋ฐฉ๋ฒ•์ด๋ผ๋Š” ๊ฐ€์žฅ ํฐ ์žฅ์ ์ด ์žˆ๋‹ค. ๋”ฅ๋Ÿฌ๋‹ ๋ชจ๋ธ๋ฟ ์•„๋‹ˆ๋ผ ์–ด๋–ค ์ฃผ์–ด์ง„ ์ž…๋ ฅ๊ณผ ๊ทธ์— ๋Œ€ํ•œ ์ถœ๋ ฅ๋งŒ ์–ป์„ ์ˆ˜ ์žˆ์œผ๋ฉด ๊ทธ๊ฒƒ๋“ค์„ ํ™œ์šฉํ•ด์„œ ์–ด๋–ค ๋ชจ๋ธ์— ๋Œ€ํ•ด์„œ๋„ ๋‹ค ์ ์šฉํ•  ์ˆ˜ ์žˆ๋Š” ์„ค๋ช…๋ฐฉ๋ฒ•์ธ ๊ฒƒ์ด๋‹ค.
๋ฐ˜๋ฉด ๋‹จ์ ์€ ์ฃผ์–ด์ง„ ๋ชจ๋ธ์„ ์—ฌ๋Ÿฌ๋ฒˆ evaluation ํ•ด์•ผ ๋˜๋Š” ๋ฌธ์ œ์ด๋‹ค. ์ฆ‰, ๋”ฅ๋Ÿฌ๋‹ ๊ฐ™์€ ๊ฒฝ์šฐ์—๋Š” forward-propagation ๋งŽ์ด ํ•ด์•ผ๋˜๊ณ , ๊ทธ๋กœ ์ธํ•ด์„œ ๊ณ„์‚ฐ๋ณต์žก๋„๊ฐ€ ๋งค์šฐ ๋†’์€ ๋ฐฉ๋ฒ•์ด๋ผ๊ณ  ํ•  ์ˆ˜ ์žˆ๋‹ค. ์ด๋Š” ๋ชจ๋ธ ๊ตฌ์กฐ๋ฅผ ์•Œ์ง€ ๋ชปํ•˜๋Š” ๋ธ”๋ž™๋ฐ•์Šค ๋ฐฉ๋ฒ•์ด ์–ด์ฉ” ์ˆ˜ ์—†์ด ๊ฐ€์ง€๊ฒŒ ๋˜๋Š” ํ•œ๊ณ„์ด๊ธฐ๋„ ํ•˜๋‹ค.
๋˜ํ•œ, ์‹ค์ œ ๋ชจ๋ธ์ด ์—ฌ์ „ํžˆ local ํ•˜๊ฒŒ๋„ ๋น„์„ ํ˜•์ ์ธ ํŠน์ง•์„ ๊ฐ€์ง€๊ณ  ์žˆ๊ณ , ๊ทธ๊ฒƒ์ด ์„ ํ˜•ํ•จ์ˆ˜๋กœ ์ž˜ ๊ทผ์‚ฌํ•œ ์•ˆ๋˜๋Š” ๊ฒฝ์šฐ์— ์„ค๋ช…์ด ์ž˜ ์•ˆ ๋˜๋Š” ๋‹จ์ ์ด ์žˆ๊ณ , ๊ทธ๋ฆฌ๊ณ  ์•„๋ž˜ ๊ทธ๋ฆผ๊ณผ ๊ฐ™์ด ๊ฐ์ฒด๋ถ„๋ฅ˜๊ฐ€ ์•„๋‹ˆ๋ผ ์ด๋ฏธ์ง€ ์ „์ฒด์˜ ํŠน์„ฑ์— ๊ด€ํ•œ ๋ถ„๋ฅ˜๋ฅผ ํ•˜๋Š” ๊ฒฝ์šฐ์—๋„ LIME ๋ฐฉ๋ฒ•์€ ์ž˜ ๋™์ž‘ํ•˜์ง€ ์•Š๋Š” ๋‹จ์ ์ด ์žˆ๋‹ค.

2) Perturbation based : RISE

notion image
[Petsiuk et al, RISE : Randomized Input Sampling for Explanation of Black-box Models, BMVC, 2018]
Black-Box๋ฐฉ๋ฒ•์œผ๋กœ๋Š” RISE๋ผ๋Š” ๋ฐฉ๋ฒ•์ด ์žˆ๋‹ค. ์ด ๋ฐฉ๋ฒ•๋„ ์•ž์— ์†Œ๊ฐœํ•œ LIME๊ณผ ๋น„์Šทํ•˜๊ฒŒ ์—ฌ๋Ÿฌ ๋ฒˆ ์ž…๋ ฅ์„ perturbํ•ด์„œ ์„ค๋ช…์„ ๊ตฌํ•˜๋Š” ๋ฐฉ๋ฒ•์ด๋‹ค.
์ด๋•Œ ์ด๋ฏธ์ง€๋ฅผ perturbํ•˜๋Š” ๋ฐฉ๋ฒ•์€ ๊ฐ€์šด๋ฐ ๋ณด์ด๋Š” ๊ฒƒ์ฒ˜๋Ÿผ ๋žœ๋คํ•œ ๋งˆ์Šคํฌ๋ฅผ ๋งŒ๋“ค์–ด์„œ ๊ทธ ๋งˆ์Šคํฌ๋ฅผ ์”Œ์šด ์ž…๋ ฅ์ด ๋ชจ๋ธ์„ ํ†ต๊ณผํ–ˆ์„ ๋•Œ ํ•ด๋‹น ํด๋ž˜์Šค์— ๋Œ€ํ•œ ์˜ˆ์ธก ํ™•๋ฅ ์ด ์–ผ๋งˆ๋‚˜ ๋–จ์–ด์ง€๋Š”์ง€๋ฅผ ๋ณด๊ณ  ์„ค๋ช…์„ ํ•˜๋Š” ๋ฐฉ์‹์ด๋‹ค.
์ฆ‰, ์—ฌ๋Ÿฌ ๊ฐœ์˜ ๋žœ๋ค ๋งˆ์Šคํ‚น์ด ๋˜์–ด ์žˆ๋Š” ์ž…๋ ฅ์— ๋Œ€ํ•œ ์ถœ๋ ฅ ์Šค์ฝ”์–ด๋ฅผ ๊ตฌํ•˜๊ณ  ๊ทธ ์Šค์ฝ”์–ด(ํ™•๋ฅ )๋“ค์„ ์ด์šฉํ•ด์„œ ์ด ๋งˆ์Šคํฌ๋“ค์„ ๊ฐ€์ค‘์น˜๋ฅผ ๋‘์–ด์„œ ํ‰๊ท ํ•˜์˜€์„๋•Œ ๋‚˜์˜ค๋Š” ๊ฒƒ์ด ์˜ค๋ฅธ์ชฝ์— ์žˆ๋Š” ์„ค๋ช… Map์ธ ๊ฒƒ์ด๋‹ค.
notion image
๊ทธ๋ฆผ์—์„œ์ฒ˜๋Ÿผ ํ•ด๋‹น ๊ฐ์ฒด๋“ค์„ ์•„์ฃผ ์ž˜ ์ฐพ์•„๋‚ด์–ด ํ•˜์ด๋ผ์ดํŠธ ํ•˜๋Š” ๊ฒƒ์„ ์•Œ ์ˆ˜ ์žˆ๋‹ค.
notion image
์ฆ‰, ์˜ฌ๋ฐ”๋ฅธ ๋ถ„๋ฅ˜ ์˜ˆ์ธก์„ ํ•˜๋Š”๋ฐ ์žˆ์–ด์„œ ์ค‘์š”ํ•œ ๊ทธ๋Ÿฐ ์ด๋ฏธ์ง€์— ๋ถ€๋ถ„๋“ค์„ ์ž˜ ์ฐพ์•„๋‚ด๋Š” ๊ฒƒ์ด๋‹ค. (d)LIME์ด๋ž‘ ๋น„๊ตํ•ด์„œ๋„ LIME์ด ์Šˆํผํ”ฝ์…€๋ฅผ ์ด์šฉํ•˜๋Š” ๊ฒƒ ๋•Œ๋ฌธ์— ์˜ค๋Š” ํ•œ๊ณ„๊ฐ€ ์—†๊ณ , ๋‘๋ฒˆ์งธ ๊ทธ๋ฆผ์ฒ˜๋Ÿผ ๋งค์šฐ ๊นจ๋—ํ•œ ์„ค๋ช…์„ ํ™•์ธํ•  ์ˆ˜ ์žˆ๋‹ค.

2-1) ์žฅ๋‹จ์  of RISE

notion image
black-box ์„ค๋ช…์ž„์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ  ์ž˜ ๊ตฌํ•  ์ˆ˜ ์žˆ๋‹ค๋Š” ์žฅ์ ์ด ์žˆ๊ณ , ๋˜ ์–ด๋–ค ๊ฒฝ์šฐ์—๋Š” white-box ๋ฐฉ๋ฒ•์ธ grad-CAM ๋ณด๋‹ค๋„ ๋” ์ข‹์€ ์„ค๋ช…์„ ๋งŒ๋“œ๋Š” ๊ฒƒ์„ ์•Œ ์ˆ˜๊ฐ€ ์žˆ๋‹ค.
๊ทธ๋Ÿฌ๋‚˜ ์ด ๋ฐฉ๋ฒ•์˜ ๋‹จ์ ๋„ ๋†’์€ ๊ณ„์‚ฐ๋ณต์žก๋„๋ฅผ ํ•„์š”๋กœ ํ•˜๋Š” ๊ฒƒ์ด๊ณ , ์•ž์„œ ๋ง์”€๋“œ๋ฆฐ LIME ๋ณด๋‹ค๋„ ํ›จ์”ฌ ๋” ๋งŽ์€ ์ˆ˜๋งŒํผ ๋žœ๋ค ๋งˆ์Šคํฌ๋ฅผ ๋งŒ๋“ค์–ด์•ผ ๋˜๋Š” ๊ทธ๋Ÿฐ ๋‹จ์ ์ด ์žˆ๋‹ค. ๊ทธ๋ฆฌ๊ณ  ์ด ๋žœ๋ค๋งˆ์Šคํฌ๋ฅผ ๋ช‡ ๋ฒˆ ๋งŒ๋“ค ๊ฒƒ์ด๋ƒ์— ๋”ฐ๋ผ์„œ ํ•ด๋‹น ์„ค๋ช…์ด ๋‹ฌ๋ผ์ง€๋Š” ๊ทธ๋Ÿฐ ๋žœ๋คํ•œ ๋…ธ์ด์ฆˆ๋„ ์กด์žฌํ•˜๋Š” ๊ฒƒ์ด ๋‹จ์ ์ด๋‹ค.

<Influence function-based>

notion image
๋งˆ์ง€๋ง‰์œผ๋กœ ์ง€๊ธˆ๊นŒ์ง€ ๋ณธ ๊ฒƒ๋“ค๊ณผ๋Š” ์•ฝ๊ฐ„ ๋‹ค๋ฅธ influence function์˜ ๊ธฐ๋ฐ˜ํ•œ ์„ค๋ช… ๋ฐฉ๋ฒ•์„ ์†Œ๊ฐœํ•˜๊ฒ ๋‹ค. ์ง€๊ธˆ๊นŒ์ง€๋Š” ์ฃผ์–ด์ง„ ํ…Œ์ŠคํŠธ ์ด๋ฏธ์ง€๊ฐ€ ์žˆ์œผ๋ฉด ๋ชจ๋ธ์ด ์ด๋ฏธ์ง€๋ฅผ ๋ถ„๋ฅ˜ํ•˜๊ณ  ๊ทธ ๋ถ„๋ฅ˜ ๊ฒฐ๊ณผ์— ๋Œ€ํ•œ ์„ค๋ช…์„ ํ•ด๋‹น ํ…Œ์ŠคํŠธ ์ด๋ฏธ์ง€์—์„œ ํ•˜์ด๋ผ์ดํŠธ ํ•˜๋Š” ๋ฐฉ์‹์˜ ๋ฐฉ๋ฒ•๋“ค์ด์—ˆ๋‹ค.
๊ทธ๋Ÿฐ๋ฐ ์ด ๋ฐฉ๋ฒ•์—์„œ๋Š”, ์ฃผ์–ด์ง„ ๋ชจ๋ธ์ด ์–ด๋–ค ํ•™์Šต๋ฐ์ดํ„ฐ๋กœ๋ถ€ํ„ฐ ํ•™์Šตํ•œ ๊ฒƒ์ด๋ฏ€๋กœ ๊ทธ ๋ฐ์ดํ„ฐ์…‹์— ์žˆ๋Š” ํŠธ๋ ˆ์ด๋‹ ์ด๋ฏธ์ง€๋“ค์˜ ํ•จ์ˆ˜๋ผ๊ณ  ๋ณผ ์ˆ˜ ์žˆ๊ณ , ๋”ฐ๋ผ์„œ ๊ฐ ํ…Œ์ŠคํŠธ ์ด๋ฏธ์ง€๋ฅผ ๋ถ„๋ฅ˜ํ•˜๋Š”๋ฐ ๊ฐ€์žฅ ํฐ ์˜ํ–ฅ์„ ๋ฏธ์นœ ํŠธ๋ ˆ์ด๋‹ ์ด๋ฏธ์ง€๊ฐ€ ํ•ด๋‹น๋ถ„๋ฅ˜์— ๋Œ€ํ•œ ์„ค๋ช…์ด๋ผ๊ณ  ์ œ๊ณต์„ ํ•˜๋Š” ๊ฒƒ์ด๋‹ค.

<Quantitative Metrics>

notion image
์ด๋Ÿฌํ•œ XAI๋ฐฉ๋ฒ•๋“ค์„ ์–ด๋–ป๊ฒŒ ๋น„๊ตํ•˜๊ณ  ํ‰๊ฐ€ํ•˜๋Š”์ง€ ๊ณ ์•ˆ๋œ ์„ค๋ช…๋ฐฉ๋ฒ•๋“ค์— ๋ฌธ์ œ์ ๋“ค์€ ์—†๋Š”์ง€ ์‚ดํŽด๋ณด๊ฒ ๋‹ค.
์•ž์„œ ์–ธ๊ธ‰ํ•œ ์—ฌ๋Ÿฌ ๊ฐ€์ง€ ๋ฐฉ์‹์œผ๋กœ ๊ณ ์•ˆ๋œ XAI์˜ ๋ฐฉ๋ฒ•๋“ค์ด ์žˆ๋Š”๋ฐ, ๊ณผ์—ฐ ์–ด๋Š ๋ฐฉ๋ฒ•์ด ์ข‹์€ ์„ค๋ช… ๋ฐฉ๋ฒ•์ธ์ง€ ์ด๋Ÿฐ ๊ฒƒ๋“ค์„ ํ‰๊ฐ€, ์ดํ•ดํ•  ํ•„์š”๊ฐ€ ์žˆ๋‹ค. ๊ทธ๋ž˜์„œ ๊ทธ๋Ÿฐ ๊ฒƒ๋“ค์„ ํ‰๊ฐ€ํ•˜๋Š” ๋ฐฉ๋ฒ•๋“ค์„ ์†Œ๊ฐœํ•˜๊ฒ ๋‹ค.

<Sanity checks / Robustness>

notion image
ย