XAI
XAI Introduction
date
Jul 9, 2023
slug
xai-introduction
author
status
Public
tags
DeepLearning
XAI
summary
type
Post
thumbnail
category
XAI
updatedAt
Jul 9, 2023 02:35 PM
1. Limitation of supervised learning2. Some Examples of Explainable AI2-1) example 12-2) example 22-3) example 33-4) example 43. What is Explainability(์ค๋ช
์ ํ๋ค๋ ๊ฒ) / Interpretability?4. Taxonomy of XAI Methods : ๋ถ๋ฅ ๋ฐฉ๋ฒ5. Taxonomy of XAI Methods : Examples์์ 1) ๋จธ์ ๋ฌ๋ : Linear model, Decision Tree์์ 2) ๋ฅ๋ฌ๋ : Grad-CAM
ย
์ต๊ทผ ์ง๋ํ์ต์ ๊ธฐ๋ฐํ ํ๋ ์์ํฌ๊ฐ ํฐ ํ์ ์ ์ด๋ฃจ๊ณ ์๋ค. ๊ทธ์ค์์๋ ๋ฅ๋ฌ๋์ ๊ธฐ๋ฐํ ๊ธฐ์ ๋ค์ด ๋ค์ํ ๋ถ์ผ์ ์ฑ๋ฅ์ ๋น์ฝ์ ์ผ๋ก ๋ฐ์ ์ํค๊ณ ์๋ค.
์ผ์ชฝ ๊ทธ๋ํ๋ฅผ ๋ณด๋ฉด 2012๋
์ ๊ธฐ์ ์ผ๋ก ImageNet์ด๋ผ๋ ๋ฐ์ดํฐ์
์ ์ธ์ ์๋ฌ์จ์ด ๋ฅ๋ฌ๋์ ์ ์ฉํ๋ฉด์ ๋งค๋
์ ๋ฐ์ผ๋ก ์ค์ด๋๋ ํ์ ์ด ์์๊ณ , ๊ทธ ์ธ์๋ ์์ฑ์ธ์(speech recognition), ๊ธฐ๊ณ๋ฒ์ญ(machine translation) ๋ฑ์์ ๋๋ผ์ด ์ฑ๋ฅ ํฅ์์ ๊ฐ์ ธ์ ํ์ฌ ๋ง์ ์ฌ๋์ ์ถ์ ์ง์ ์ํฅ์ ๋ฏธ์น๊ณ ์์ฉ ๋ถ์ผ์ ๋๋ฆฌ ์ ์ฉ๋๊ณ ์๋ค.
1. Limitation of supervised learning
์ด๋ฅผ ํตํด์ ์ธ๊ณต์ง๋ฅ AI์ ๋ํ ์ฌํ์ ์ธ ๊ด์ฌ์ด ๋งค์ฐ ๋์์ก๊ณ , AI๊ฐ 4์ฐจ ์ฐ์
ํ๋ช
์ ํต์ฌ์ ์ธ ๊ธฐ์ ๋ก ์๋ฆฌ ์ก๊ฒ ๋์๋ค. ํ์ง๋ง, ์ด๋ ๊ฒ ๋งค์ฐ ์ข์ ์ฑ๋ฅ์ ๋ด๋ ์ง๋ํ์ต ๊ธฐ๋ฐ ๋ฅ๋ฌ๋ ๋ชจ๋ธ์๋ ์ค์ํ ํ๊ณ์ ์ด ์กด์ฌํ๋ค.
ํ๊ณ์ ์ ๋ฐ๋ก ๋์ฉ๋ ํ์ต ๋ฐ์ดํฐ๋ก๋ถํฐ ํ์ตํ๋ ๋ชจ๋ธ์ ๊ตฌ์กฐ๊ฐ ์ ์ ๋ ๋ณต์กํด์ง๊ณ ์ดํดํ๊ธฐ ์ด๋ ค์์ง๋ค๋ ์ ์ด๋ค.
์ด์ฐฝ๊ธฐ ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ธ ์ผ์ชฝ์ ์๋ ๋จ์ํ ์ ๊ฒฝ๋ง ๋ชจ๋ธ๋ก๋ถํฐ ์ฌ๋ฌ ๊ฐ์ง Skip Connection์ ๊ฐ์ง๊ณ ์๋ ์์ฒญ๋๊ฒ ๊น์ ๊ตฌ์กฐ๋ฅผ ๊ฐ์ง๋ ResNet, DenseNet ๋ฑ์ผ๋ก ๋ฐ์ ํ์๊ณ , ์ต๊ทผ์๋ ์ค๋ฅธ์ชฝ์ ๋ณด์๋ ๊ฒ๊ณผ ๊ฐ์ transformer๋ผ๋ attention ๋ฉ์ปค๋์ฆ์ ํ์ฉํ๋ ๋ชจ๋ธ๋ก๋ ๋ฐ์ ํ๊ณ ์๋ค.
์ด๋ ๊ฒ ์ ์ ์ฑ๋ฅ์ด ์ข์์ง๋ฉด์ ์ ์ ๋ณต์กํ ๋ชจ๋ธ๋ก ๋ฐ์ ํ๋๋ฐ, ๊ฒฐ๊ตญ ์ด๋ฌํ ๋ชจ๋ธ์ ์
๋ ฅ์ ์ง์ด๋ฃ์ผ๋ฉด ์ถ๋ ฅ์ด ํ์ด๋์ค๋ ํ๋์ ๋ธ๋๋ฐ์ค์ฒ๋ผ ๋์ํ๊ฒ ๋๋ค.
๊ทธ๋ฐ๋ฐ ์ด๋ ๊ฒ ๋ณต์กํ ๊ตฌ์กฐ์ ๋ชจ๋ธ์ ์์ฉ ๋ถ์ผ์ ์ ์ฉํ ๋, ์ํ ์ถ์ฒ๊ณผ ๊ฐ์ด ๋จ์ํ ์์ธก ๊ฒฐ๊ณผ๋ง ํ์ํ ๊ฒฝ์ฐ์๋ ํฐ ๋ฌธ์ ๊ฐ ์์ง๋ง, ๋ชจ๋ธ์ ์์ธก ๊ฒฐ๊ณผ๊ฐ ์ฌ๋์๊ฒ ์ง์ ์ํฅ์ ๋ฏธ์น ์ ์๋ ๊ฒฝ์ฐ๋ ๋ฌธ์ ๊ฐ ์๊ธธ ์ ์๋ค.
์ฆ, ์ด๋ฏธ์ง ์ธ์ ๊ธฐ์ ์ ๊ธฐ๋ฐํ ์์จ์ฃผํ ์๋์ฐจ๊ฐ ์ฌ๊ณ ๋ฅผ ๋์ ๋, ์๋ฃ์์ ๊ธฐ๋ฐ ์ง๋ณ ์ง๋จ์ ํ๋ ๊ฒฝ์ฐ, AI ๊ธฐ๋ฐ ์ธํฐ๋ทฐ, AI ๊ธฐ๋ฐ ๋์ถ ์ฌ๋ถ ๊ฒฐ์ ๋ฑ์ ํ๋ ๊ฒฝ์ฐ ๋จ์ํ ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ด ๋ด์ด ์ฃผ๋ ์์ธก ๊ฒฐ๊ณผ๋ง์ ์ฌ์ฉํ๊ธฐ์๋ ํ๊ณ๊ฐ ์๊ณ , ์ ํด๋น ๋ชจ๋ธ์ด ์ด๋ฌํ ์์ธก ๊ฒฐ๊ณผ๋ฅผ ๋ด์๋์ง ๊ทธ ์ด์ ๋ฅผ ์ค๋ช
ํด์ผ ํ๋ ๊ฒฝ์ฐ๊ฐ ๋ฐ๋์ ์กด์ฌํ๋ค.
๊ทธ๋ฆฌ๊ณ ๊ทธ๋ ๊ฒ ์ค๋ช
์ ์ ๊ณตํ์ง ๋ชปํ๋ ๊ฒฝ์ฐ,๋ฒ์ ๋ฐ ์ฌํ์ ์ผ๋ก ํด๋น ๋ชจ๋ธ์ ์ ์ฉํ๋๋ฐ ์ ์ฝ์ด ์๊ธธ ์ ์๋ค. ์๋ฅผ ๋ค์ด์ ์ต๊ทผ์ ๋๋๋๊ณ ์๋ AI ๋ชจ๋ธ์ ํธํฅ์ฑ ๋ฌธ์ ๋ฅผ ๋ณด๋ฉด ์ค๋ช
๊ฐ๋ฅ ์ธ๊ณต์ง๋ฅ์ด ๊ผญ ํ์ํ๋ฉด ์ ์ ์๋ค.
๋ฅ๋ฌ๋ ๊ธฐ๋ฐย ๋ํ ๋ชจ๋ธ์ด๋ย ์ด๋ฏธ์ง ์ธ์ย ํ๊น
๋ฌธ์ ์์ย ํน์ ์ธ์ข
์ด๋ ์ฑ๋ณ์ ํธํฅ๋ ๊ฒฐ๊ณผ ๋ฐย ์์ธก์ย ๋ง๋ค์ด๋ด๋ ๊ฒฝ์ฐ๊ฐ ์๋ค.
์๋ฅผ ๋ค์ด, Google Photo์์ ์ด๋ค ํ์ธ ์ฌ์ฑ์ ๊ณ ๋ฆด๋ผ๋ผ๊ณ ์๋ชป ์ธ์ํ๊ฑฐ๋, ๋ด์ง๋๋ ์ฌ๊ถ ์ธ์ ํ๋ก๊ทธ๋จ์ด ์์์๊ณ ๋จ์ฑ์ด ๋์ ๊ฐ๊ณ ์๋ค๊ณ ย ์ค์ธ์ํ๋ย ๊ฒฝ์ฐ์ ๋ชจ๋ธ์ด ์ ์ธ์ข
๊ณผ ๊ด๋ จํ์ฌ ์๋ชป๋ย ์์ธก ๊ฒฐ๊ณผ๋ฅผย ๋ด์๊ณ , ์ด๋ฌํ ํธํฅ์ฑ(๋ฐ์ด์ด์ค)์ ํด๊ฒฐํ๊ธฐ ์ํด์๋ ์ด ๋ชจ๋ธ์ ๊ฒฐ๊ณผ๋ฅผ ์ค๋ช
ํ ์ ์๋ย ์ค๋ช
๊ฐ๋ฅย ์ธ๊ณต์ง๋ฅ์ดย ๊ผญ ํ์ํ๋ค.
2. Some Examples of Explainable AI
2-1) example 1
์ด๋ฏธ์ง ๋ถ๋ฅ ์ฐ๊ตฌ๋ฅผ ์ํด ๋ฒค์น๋งํฌ๋ก ๋๋ฆฌ ์ฐ์ด๋ PASCAL VOC๋ผ๋ ๋ฐ์ดํฐ์
์ด ์๋ค.
๋
์ผ์ ํ ์ฐ๊ตฌ์ง์ด XAI๊ธฐ๋ฒ์ PASCAL VOC Data set์ผ๋ก ํ๋ จํ ๋ถ๋ฅ๊ธฐ์ ์ ์ฉํด๋ณด์๋ค.
์ฆ, ์ด๋ค ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ด ์ด๋ฏธ์ง๋ฅผ ๋ฐ์, ์๋ฅผ ๋ค์ด ๋ง์ ๋ํ ์ฌ์ง์ด๋ผ๊ณ ๋ถ๋ฅํ์๋๋ฐ, XAI๊ธฐ๋ฒ์ ๊ณผ์ฐ ํด๋น ๋ชจ๋ธ์ด ์ด๋ฏธ์ง ์ด๋ ๋ถ๋ถ์ ๋ณด๊ณ ์ด๋ฏธ์ง๋ฅผ "๋ง"์ด๋ผ๊ณ ํ๋์ง ๋นจ๊ฐ์์ผ๋ก ํ์ด๋ผ์ดํธ๋ฅผ ํด์ ๋ณด์ฌ ์ฃผ๋ ๋ฐฉ์์ด๋ค.
์์ ์ฌ์ง์์ ์ผ์ชฝ์ ์๋ ๋ค์ฏ ๊ฐ์ ์ด๋ฏธ์ง๊ฐ ๋ชจ๋ ๋ง์ ๊ดํ ์ด๋ฏธ์ง์ด๊ณ , ํด๋น ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ ๋ชจ๋ ์ ๋๋ก ์ ๋ต ํด๋์ค์ธ ๋ง์ ์ ๋๋ก ์์ธกํ์๋ค.
๊ทธ๋ฐ๋ฐ XAI์ ๊ธฐ๋ฒ์ ๋ชจ๋ธ์ด ์ด์ํ๊ฒ๋ ์ด๋ฏธ์ง ๋ด์์ ๋ง์ ํด๋นํ๋ ๋ถ๋ถ์ด ์๋๋ผ ์ด๋ฏธ์ง ์๋์ชฝ์ ์ฃผ๋ก ๋ณด๊ณ ์๋ ๊ฒ์ ๋ณด์ฌ์ฃผ์๋ค.
๊ทธ๋์ ์ฐ๊ตฌ์ง๋ค์ ๋ค์ ํด๋น ๋ง ์ฌ์ง๋ค์ ํ์ธ์ ํด๋ณด๋ ์ฌ์ง ํ๋จ๋ถ์ ์ค๋ฅธ์ชฝ ๊ทธ๋ฆผ์์ ๋ณด๋ ๊ฒ์ฒ๋ผ ํ
์คํธ๋ก ์ํฐ๋งํฌ๊ฐ ์๋ ๊ฒ์ ๋ฐ๊ฒฌํ์๊ณ . ์ด ๋ฐ์ดํฐ์
์ ๋ฒ๊ทธ๊ฐ ์๋ ๊ฒ์ ์๊ฒ ๋์๋ค.
์ฆ, ๋ค๋ฅธ ํด๋์ค์ ์ฌ์ง๋ค์ ์ด๋ฐ ๋ฒ๊ทธ๊ฐ ์์์ง๋ง, ๋ฐ์ดํฐ ์
์ ์๋ ๋ชจ๋ ๋ง ๊ด๋ จ ์ฌ์ง๋ค์๋ ์ด๋ฐ ํ
์คํธ ์ํฐ๋งํฌ๊ฐ ์์๊ณ ํ์ตํ ๋ฅ๋ฌ๋ ๋ชจ๋ธ ์ค์ ๋ง ์ฌ์ง์ด ์๋, ํ
์คํธ ์ํฐ๋งํฌ์ ๊ธฐ๋ฐ์์ ๋ง์ด๋ผ๊ณ ๋ถ๋ฅํ๊ณ ์์๋ ๊ฒ์ด์๋ค.
์ด ๋ฐ์ดํฐ์
์์์ ์ ํ๋๋ ๋์๊ฒ ์ง๋ง, ์ผ๋ฐ์ ์ธ ์ํฉ์ ์ ์ฉํ ์ ์๋ ์ ๋๋ก ๋ ๋ง ๋ถ๋ฅ๊ธฐ๋ผ๊ณ ํ ์๋ ์์ ๊ฒ์ด๋ค.
์ด์ฒ๋ผ XAI์ ๊ธฐ๋ฒ์ ์ฌ์ฉํ๋ฉด ๋ชจ๋ธ์ด๋ ๋ฐ์ดํฐ์
์ด ๊ฐ์ง๊ณ ์๋ ์ค๋ฅ๋ฅผ ์ฐพ์๋ผ ์ ์๋ค.
2-2) example 2
๋ ๋ฒ์งธ ์์๋ก, XAI ๊ธฐ๋ฒ์ด ๋ชจ๋ธ์ด ์ผ๋ง๋ ํธํฅ๋์ด ์๋์ง๋ ์์๋ผ ์ ์๋ค.
๋ฏธ๊ตญ์์ ์ค์ ๋ก COMPAS ๋ผ๋ ๋ฒ์ฃ ์ฌ๋ฒ๋ฅ ์์ธก ์์คํ
์ ์ค๋ช
ํด ๋ณธ ๊ฒ์ด๋ค. ์ด ์์คํ
์ ํ์ฌ ๊ต๋์์ ์๊ฐ๋์ด์๋ ์ฌ๋ ์ค์์ ์ด๋ค ์ฌ๋์ ์งํ์ ์๋ก ํ์ด์คฌ์ ๋ ๋ค์ ๋ฒ์ฃ๋ฅผ ์ ์ง๋ฌ์ ๊ต๋์๋ก ๋์์ฌ์ง๋ฅผ ์์ธกํ๋ ์์คํ
์ด๋ค.
๊ทธ๋ฐ๋ฐ ์ค๋ฅธ์ชฝ ํ๋ฅผ ๋ณด์๋ฉด ์ฌ๋์ด ์์ธกํ ๊ฒ(Humans)๊ณผ COMPAS๋ผ๊ณ ํ๋ ์์คํ
์ด ์์ธกํ ๊ฒ์ ์ ์ฒดํ๊ท ์ ํ๋๋ 60 ๋ช ํผ์ผํธ ์ ๋๋ก ๋น์ทํ ๊ฒฐ๊ณผ์ ๋ฐํด์, ํ์ธ๊ณผ ๋ฐฑ์ธ์ผ๋ก ๋๋ ์ ์ ํ๋๋ฅผ ์ธ๋ถํํด์ ๋ณด๊ฒ ๋๋ฉด ํ์ธ์ ๋ํ first positive rate์ ๋ฐฑ์ธ์ ๋ํ first negative rate๊ฐ COMPAS์์ ์ฌ๋ ์์ธก(humans)๋ณด๋ค ํจ์ฌ ๋ ๋๋ค๋ ๊ฒ์ ์ ์ ์๋ค.
์ฆ, XAI๋ก ์๋ํ ์์คํ
์ ํธํฅ๋ ๋ฌธ์ ๋ฅผ ์ฐพ์๋ธ ๊ฒ์ด๋ค.
2-3) example 3
์์จ์ฃผํ ์๋์ฐจ๊ฐ ์๋ชป ๋์ํด์ ์ฌ๊ณ ๊ฐ ๋ฐ์ํ๋๋ฐ, ์ด๋ ์ธ์ ์๊ณ ๋ฆฌ์ฆ์ด ์ ๊ทธ๋ฐ ์๋ชป๋ ๋์์ ํ๊ฒ ๋์๋์ง ์ค๋ช
ํ๋ ๊ฒ์ ๋งค์ฐ ์ค์ํ๋ค. ๋ฐ๋ผ์, ์ฌ๊ณ ์ฑ
์ ์์ฌ๋ฅผ ์ฐพ์ ์๋ ์๊ณ , ์ค๋ฅ๋ฅผ ๊ณ ์ณ์ ํฅํ ๋ ์์ ํ ์๊ณ ๋ฆฌ์ฆ์ ๋ง๋ค ์ ์๊ธฐ ๋๋ฌธ์ด๋ค.
3-4) example 4
X-ray ์ฌ์ง์ ์ด์ฉํด์ COVID-19๋ฅผ ์๋์ผ๋ก ์ง๋จํ๋ ์์คํ
์์ ์์ฌ๋ ์๊ณ ๋ฆฌ์ฆ์ ๋์ถ๋ ์์ธก ๊ฒฐ๊ณผ๋ง ๋ฌด์์ ๋ฏฟ์ ์๋ ์์ ๊ฒ์ด๊ณ , ์ ์๊ณ ๋ฆฌ์ฆ์ด ๊ทธ๋ฐ ์์ธก ๊ฒฐ๊ณผ๋ฅผ ๋์ถํ๋์ง์ ๋ํ ์ค๋ช
์ ๋ณด๊ณ ๊ทธ AI ๋ชจ๋ธ์ ์์ธก์ ์ ๋ขฐํ ๊ฒ์ธ์ง ์๋์ง๋ฅผ ๊ฒฐ์ ํ ์ ์์ ๊ฒ์ด๋ค.
ย
3. What is Explainability(์ค๋ช ์ ํ๋ค๋ ๊ฒ) / Interpretability?
"์ค๋ช
์ ํ๋ค๋ ๊ฒ(Explainability)"์ด ๋ฌด์์ ๋ปํ๋ ๊ฑด์ง ํ๋ฒ ์๊ฐํด ๋ณผ ์ ์๋ค. ๊ทธ๋ฌ๋, ์ฌ์ ์ด๋ ๋
ผ๋ฌธ๋ค์ ์ฐพ์๋ณด๋ฉด ์ค๋ช
๊ฐ๋ฅ์ฑ(explanation)์ด ์ ํํ๊ฒ ๋ฌด์์ ๋ปํ๋์ง ์ ์๋์ด ์์ง ์๊ณ , ์ฌ๋ฌ ๊ฐ์ง๋ฅผ ํจ๊ป ๋ปํ๊ณ ์๋ ๊ฒ์ ์ ์ ์๋ค.
- ์ฌ๋์ด ๊ทธ ์ด์ ๋ฅผ ์ดํดํ ์ ์๊ฒ ํด์ฃผ๋ ๊ฒ
- ์ค๋ช ์ ํตํด ๋ชจ๋ธ์ ๊ฒฐ๊ณผ๋ฅผ ์์ธกํ ์ ์๊ฒ ํด ์ฃผ๋ ๊ฒ
- ์ด์ ๋ฅผ ์ค๋ช ํ ์ ์๊ฒ ํด ์ฃผ๋ ๊ฒ
์ด๋ผ๊ณ ๋
ผ๋ฌธ์์ ์ ์ํ๋ค.
ํ์ง๋ง, ์ ํํ ์ด๋ป๊ฒ ํ๋ ๊ฒ์ด ์ค๋ช
๊ฐ๋ฅ์ฑ์ ๋์ด๋ ๊ฒ์ธ์ง์ ๋ํ ๊ตฌ์ฒด์ ์ธ ๋ต์ ์๊ธฐ๋ ์ด๋ ต๋ค.
XAI์ ์ฐ๊ตฌ ๋ถ์ผ์์๋ XAI๋ ์ฌ๋์ด ๋ชจ๋ธ์ ์ธ ๋ ๊ทธ ๋์์ ์ดํดํ๊ณ ์ ๋ขฐํ ์ ์๊ฒ ํด์ฃผ๋ ๊ธฐ๊ณ ํ์ต ๊ธฐ์ ์ด๋ผ๊ณ ๋ง ๋์ด ์๋ค.
4. Taxonomy of XAI Methods : ๋ถ๋ฅ ๋ฐฉ๋ฒ
์์ธก ๊ฒฐ๊ณผ์ ์ค์ํ ์ํฅ์ ๋ฏธ์น๋ ํน์ง๋ค์ ์ฐพ์๋ด์ด ๊ทธ ์ค์๋๋ฅผ ์๊ฐํ ๋ฑ์ ํตํด์ ์ค๋ช
ํ๋ ๋ฐฉ๋ฒ์ ๊ณ ์ํ๋ ์ฐ๊ตฌ๋ค์ด ์ต๊ทผ์ ๋ง์ด ์ ์๋์๋๋ฐ, ๊ทธ๋ฐ ๋ฐฉ๋ฒ๋ค์ด ์ด๋ป๊ฒ ๋ถ๋ฅ๋๊ณ ์๋์ง ์ ๋ฆฌํ๊ฒ ๋ค.
- Local vs. Global โ Local: Describes an individual prediction โ Global: Describes entire model behavior
- White-box vs. Black-box โ White-box: Explainer can access the inside of model โ Black-box: Explainer can access only the output
- Intrinsic vs. Post-hoc โ Intrinsic: Restricts the model complexity before training โ Post-hoc: Applies after the ML model is trained
- Model-specific vs. Model-agnostic โ Model-specific: Some methods restricted to specific model classes (e.g., CAM requires global average pooling) โ Model-agnostic: Some methods can be used for any model
XAI๋ฐฉ๋ฒ์ ๊ตฌ๋ถํ๋ ์ฒซ๋ฒ์งธ ๋ถ๋ฅ๋ฐฉ๋ฒ์ localํ ์ค๋ช
๋ฐฉ๋ฒ๊ณผ globalํ ์ค๋ช
๋ฐฉ๋ฒ์ผ๋ก ๋๋ ๋ณผ ์ ์๋ค.
- Local : ์ฃผ์ด์ง ํน์ ๋ฐ์ดํฐ์ ๋ํ ์์ธก ๊ฒฐ๊ณผ๋ฅผ ๊ฐ๋ณ์ ์ผ๋ก ์ค๋ช ํ๋ ค๋ ๋ฐฉ๋ฒ
- Global : ๊ฐ๋ณ ๋ฐ์ดํฐ์ ๋ํ ๊ฒฐ๊ณผ๋ฅผ ๋ฐ๋ก๋ฐ๋ก ์ค๋ช ํ๋ ๊ฒ์ด ์๋๋ผ, ์ ์ฒด ๋ฐ์ดํฐ์ ์์ ๋ชจ๋ธ์ ์ ๋ฐ์ ์ธ ํ๋์ ์ค๋ช ํ๊ณ ์ ํ๋ ๋ฐฉ๋ฒ
๋ ๋ฒ์งธ ๋ถ๋ฅ๋ White-box ์ค๋ช
๋ฐฉ๋ฒ, Black-box ์ค๋ช
๋ฐฉ๋ฒ์ผ๋ก ๊ตฌ๋ถํ๋ ๊ฒ์ด๋ค.
- White-box : ๋ชจ๋ธ์ ๋ด๋ถ๊ตฌ์กฐ๋ฅผ ์ ํํ๊ฒ ์๊ณ ์๋ ์ํฉ์์ ์ค๋ช ์ ์๋ํ๋ ๋ฐฉ๋ฒ
- Black-box : ๋ชจ๋ธ์ ๋ด๋ถ ๊ตฌ์กฐ๋ ์ ํ ๋ชจ๋ฅด๋ ์ํ์์ ๋จ์ํ ๋ชจ๋ธ์ ์ ๋ ฅ๊ณผ ์ถ๋ ฅ๋ง ๊ฐ์ง๊ณ ์ค๋ช ์ ์๋ํ๋ ๋ฐฉ๋ฒ
์ธ ๋ฒ์งธ ๋ถ๋ฅ๋ intrinsic(๋ด์ฌ์ ์ธ ์ค๋ช
๋ฐฉ๋ฒ)๊ณผ Post(์ฌํ ์ถ๋ก )์ ํตํ ์ค๋ช
๋ฐฉ๋ฒ์ด๋ค.
- Intrinsic : ๋ชจ๋ธ์ ๋ณต์ก๋๋ฅผ ํ๋ จํ๊ธฐ ์ด์ ๋ถํฐ ์ค๋ช ํ๊ธฐ ์ฉ์ดํ๋๋ก ์ ์ํ ๋ค, ํ์ต์ ์์ผ์ ๊ทธ ํ ํ์ต๋ ๋ชจ๋ธ์ ๊ฐ์ง๊ณ ์ค๋ช ํ๋ ๋ฐฉ๋ฒ
- Post-hoc : ์์์ ๋ชจ๋ธ์ ํ๋ จ์ด ๋๋ ๋ค์ ์ด ๋ฐฉ๋ฒ์ ์ ์ฉํด์ ๊ทธ ๋ชจ๋ธ์ ํ๋์ ์ค๋ช ํ๋ ๋ฐฉ๋ฒ.
5. Taxonomy of XAI Methods : Examples
์์ 1) ๋จธ์ ๋ฌ๋ : Linear model, Decision Tree
๋จธ์ ๋ฌ๋ ๋ชจ๋ธ์์ linear model์ด๋ decision tree์ ๊ธฐ๋ฐํ ๋ชจ๋ธ๋ค์ ๋ถ๋ฅ๋ Global, White-box, intrinsic, model-specific ํ ์ค๋ช
๋ฐฉ๋ฒ์ด๋ค.
linear ๋ชจ๋ธ์์๋ ํ์ตํ๊ณ ๋ ๋ค์ ์ป์ด์ง๋ ์ ํ ๊ณ์(์์์์๋ ๋ฒ ํ)๊ฐ ๋ฐ๋ก ์ด ๋ชจ๋ธ์ ์ค๋ช
์ผ๋ก ์ง์ ์์ฉํ ์ ์๋ ๊ฒ์ ์ ์ ์๋ค. ์๋ํ๋ฉด ๊ฐ x ๋ณ์๋ค์ด ์ ํ์ ์ผ๋ก ์กฐํฉ๋์ด ์์ธก๊ฐ y๋ฅผ ๋ง๋ค์ด๋ด๋๋ฐ, ์ด ์ ํ๊ณ์๊ฐ ํด์๋ก ๊ทธ ํน์ ํน์ง(x ๋ณ์)๋ค์ด ์์ธก์ ์์ฉํ๋ ์ ๋๊ฐ ํฌ๋ค๊ณ ํ ์ ์๊ธฐ ๋๋ฌธ์ด๋ค.
๋ํ, ์ด๋ฌํ ์ค๋ช
์ ์ฃผ์ด์ง ํน์ ๋ฐ์ดํฐ ์ค๋ช
์ ํด์ฃผ๋ ๊ฒ์ด ์๋๋ผ ์ ์ฒด ๋ฐ์ดํฐ๋ถํฐ ํ์ต๋ ๋ชจ๋ธ์ ์ค๋ช
ํ๋ ๊ฒ์ด๋ฏ๋ก Global ํ ์ค๋ช
์ด๋ค.
๋, ๋ชจ๋ธ์ ์ ํํ ๊ตฌ์กฐ๋ฅผ ์์์ผ ํ๋ฏ๋ก White-box ์ค๋ช
๋ฐฉ์์ด๋ค.
ํ์ต๋๋ ๋ชจ๋ธ ์์ฒด๊ฐ ๊ฐ๋จํ๊ณ ์ง์ ์ ์ผ๋ก ์ค๋ช
์ ๋ง๋ค์ด๋ด๋ ๋ชจ๋ธ์ด๋ผ์ Intrinsic์ด๋ค.
์ด ๊ฒฝ์ฐ๋ ์ ํ ๋ชจ๋ธ์๋ง ์ ์ฉ๋๋ ์ค๋ช
์ด๊ธฐ ๋๋ฌธ์ model-specific ํ ์ค๋ช
๋ฐฉ๋ฒ์ด๋ค.
์ด์ ๋น์ทํ ๋ถ๋ฅ๊ธฐ์ธ desicion tree ๊ธฐ๋ฐ ๋ชจ๋ธ์๋ ์ ์ฉ๋๋ค. ํ์ต ๊ณผ์ ์์ Mean Squre Error๋ฅผ ๋ง์ด ๊ฐ์์ํค๋ ๊ฒ์ ์ค์ํ ํน์ง์ด๋ผ๋ ์ค๋ช
์ ์ ๊ณตํ๊ฒ ๋๋ฏ๋ก ๋ง์ฐฌ๊ฐ์ง๋ก global, white-box, intrinsic, model-specific ํ ์ค๋ช
๋ฐฉ๋ฒ์ด๋ผ๊ณ ํ ์ ์๋ค.
์์ 2) ๋ฅ๋ฌ๋ : Grad-CAM
์ฃผ๋ก ๋ฅ๋ฌ๋ ๊ธฐ๋ฐ์ย ๋ถ๋ฅ๋ชจ๋ธ์ ์ค๋ช
ํ๋๋ฐย ๋ง์ด ์ฐ์ด๋ Grad-CAM ๋ฐฉ๋ฒ์ local, white-box, pos-hoc, model-agnostic ์ค๋ช
๋ฐฉ๋ฒ์ด๋ผ๊ณ ๋ถ๋ฅํ ์ ์๋ค.
์ฆ, ๊ทธ๋ฆผ์ ๋ณด๋ ๊ฒ์ฒ๋ผ ์ฃผ์ด์ง ์ด๋ค ๊ฐ๋ณ ์ด๋ฏธ์ง๋ง๋ค ๊ทธ ์์ธก ๊ฒฐ๊ณผ๋ฅผ ์ค๋ช
ํ ์ ์๋ ๋ฐฉ๋ฒ์ด๊ธฐ ๋๋ฌธ์ย local ํย ์ค๋ช
์ด๊ณ ๋ง์ฐฌ๊ฐ์ง๋ก ๋ชจ๋ธ์ ์ ํํ ๊ตฌ์กฐ์ ๊ณ์๋ค์ ๋ชจ๋ ์์์ผ ๊ตฌํ ์ ์๋ ์ค๋ช
์ด๊ธฐ ๋๋ฌธ์ White-box ์ค๋ช
๋ฐฉ๋ฒ์ด๋ฉฐ,ย ๋ชจ๋ธ์ด ํ์ต๋๊ณ ย ๋ ํ ์ ์ฉํด์ ์ค๋ช
์ ์ ๊ณตํ๋ Post-hoc์ค๋ช
ย ๋ฐฉ๋ฒ์ด๊ณ ,ย ๋ฅ๋ฌ๋ ๋ชจ๋ธย ๊ตฌ์กฐ์ ์๊ด์์ด ํญ์ ์ ์ฉํ ์ ์๋ ๋ฐฉ๋ฒ์ด๊ธฐ ๋๋ฌธ์ ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ ๋ํด์๋ model-agnostic ํ ์ค๋ช
๋ฐฉ๋ฒ์ด๋ค.
ย
ย