๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
์ธ๊ณต์ง€๋Šฅ

3. ์‹ ๊ฒฝ๋ง

by sh119 2025. 7. 25.

์‹ ๊ฒฝ๋ง์ด๋ž€?

  • ํผ์…‰ํŠธ๋ก (Perceptron)์—์„œ ํ™•์žฅ๋œ ๋ชจ๋ธ → ์—ฌ๋Ÿฌ ์ธต(Layer)์„ ์Œ“์•„ ๋ณต์žกํ•œ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐ
  • ๋จธ์‹ ๋Ÿฌ๋‹์˜ ๋ฌธ์ œ ํ’€์ด๋Š” ํฌ๊ฒŒ ํ•™์Šต(Training) + ์ถ”๋ก (Inference) ์œผ๋กœ ๋‚˜๋‰จ
    • ํ•™์Šต: ๊ฐ€์ค‘์น˜์™€ ํŽธํ–ฅ์„ ๋ฐ์ดํ„ฐ๋กœ๋ถ€ํ„ฐ ์ตœ์ ํ™”.
    • ์ถ”๋ก : ํ•™์Šต๋œ ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•ด ์ƒˆ๋กœ์šด ๋ฐ์ดํ„ฐ์˜ ์ถœ๋ ฅ์„ ๊ณ„์‚ฐ.

๊ฐ ์ธต์˜ ์‹ ํ˜ธ ์ „๋‹ฌ (์ˆœ์ „ํŒŒ, Forward Propagation)

  • ์ž…๋ ฅ๊ฐ’ x๊ฐ€ ๊ฐ€์ค‘์น˜ W ์™€ ํŽธํ–ฅ b๋ฅผ ๊ฑฐ์ณ ํ™œ์„ฑํ™” ํ•จ์ˆ˜ f ๋กœ ๋ณ€ํ™˜๋จ:

  • ์ด๋ฅผ ์ธต(layer)๋งˆ๋‹ค ๋ฐ˜๋ณต → ์ตœ์ข… ์ถœ๋ ฅ.

 

ํ™œ์„ฑํ™” ํ•จ์ˆ˜ (Activation Function)

  • ๋น„์„ ํ˜• ํ•จ์ˆ˜ → ์ธต์„ ๊นŠ๊ฒŒ ์Œ“์„ ๋•Œ ๋ณต์žกํ•œ ํŒจํ„ด ํ•™์Šต ๊ฐ€๋Šฅ.

1. ๊ณ„๋‹จ ํ•จ์ˆ˜ (Step Function)

 

  • ์ดˆ๊ธฐ ํผ์…‰ํŠธ๋ก ์—์„œ ์‚ฌ์šฉ.
  • ๋‹จ์ : ๋ฏธ๋ถ„ ๋ถˆ๊ฐ€๋Šฅ, ํ•™์Šต์— ๋ถ€์ ํ•ฉ.

2. ์‹œ๊ทธ๋ชจ์ด๋“œ ํ•จ์ˆ˜ (Sigmoid)

  • 0~1 ์‚ฌ์ด์˜ ์—ฐ์†์ ์ธ ๊ฐ’.
  • ํ™•๋ฅ ์  ํ•ด์„ ๊ฐ€๋Šฅ.
  • ๋‹จ์ : ์ž…๋ ฅ์ด ํฌ๊ฑฐ๋‚˜ ์ž‘์œผ๋ฉด ๊ธฐ์šธ๊ธฐ(Gradient) ์†Œ์‹ค.

3. ReLU (Rectified Linear Unit)

  • ๊ฐ„๋‹จํ•˜๊ณ  ํ•™์Šต์ด ๋น ๋ฆ„.
  • ์ตœ๊ทผ ์‹ ๊ฒฝ๋ง์—์„œ ๊ธฐ๋ณธ ํ™œ์„ฑํ™” ํ•จ์ˆ˜๋กœ ์‚ฌ์šฉ.

 

๋‹ค์ฐจ์› ๋ฐฐ์—ด๊ณผ ํ–‰๋ ฌ ์—ฐ์‚ฐ

  • ๋ฐฐ์น˜ ์ฒ˜๋ฆฌ: ํ•œ ๋ฒˆ์— ์—ฌ๋Ÿฌ ์ž…๋ ฅ ๋ฐ์ดํ„ฐ๋ฅผ ๋ฌถ์–ด ๊ณ„์‚ฐ → ์†๋„ ํ–ฅ์ƒ.
  • ๋ธŒ๋กœ๋“œ์บ์ŠคํŒ…: ์ฐจ์›์ด ๋‹ค๋ฅธ ๋ฐฐ์—ด๋„ ์ž๋™ ํ™•์žฅํ•ด ์—ฐ์‚ฐ ๊ฐ€๋Šฅ.
  • ํ–‰๋ ฌ ๊ณฑ: ๋‹ค์ˆ˜์˜ ๋‰ด๋Ÿฐ·๋‹ค์ˆ˜์˜ ์ž…๋ ฅ์„ ํ•œ ๋ฒˆ์— ์ฒ˜๋ฆฌ:

  • X: ์ž…๋ ฅ ๋ฐ์ดํ„ฐ (๋ฐฐ์น˜ × ํŠน์ง•์ˆ˜)
  • W: ๊ฐ€์ค‘์น˜ (ํŠน์ง•์ˆ˜ × ๋‰ด๋Ÿฐ์ˆ˜)

 

์ถœ๋ ฅ์ธต์˜ ์„ค๊ณ„

 

<๋ถ„๋ฅ˜ ๋ฌธ์ œ>
: ์†Œํ”„ํŠธ๋งฅ์Šค(Softmax)
ํ•จ์ˆ˜ ์‚ฌ์šฉ → ๊ฐ ํด๋ž˜์Šค์˜ ํ™•๋ฅ  ์ถœ๋ ฅ

์ถœ๋ ฅ ํ•ฉ์ด 1, ํ™•๋ฅ ๋กœ ํ•ด์„ ๊ฐ€๋Šฅ

 

 

<ํšŒ๊ท€ ๋ฌธ์ œ>

  • ํ™œ์„ฑํ™” ํ•จ์ˆ˜ ์—†์ด ๊ทธ๋Œ€๋กœ ์ถœ๋ ฅ.

 

 

์‹ ๊ฒฝ๋ง์˜ ํ™œ์šฉ

  • ๋ถ„๋ฅ˜(Classification)
    • ์ด๋ฏธ์ง€ ์ธ์‹, ํ…์ŠคํŠธ ๋ถ„๋ฅ˜ ๋“ฑ
    • ์ถœ๋ ฅ์ธต์—์„œ ์†Œํ”„ํŠธ๋งฅ์Šค + ๊ต์ฐจ์—”ํŠธ๋กœํ”ผ ์†์‹ค ์‚ฌ์šฉ
    • ์ถœ๋ ฅ์ธต์˜ ๋‰ด๋Ÿฐ ์ˆ˜ = ๋ถ„๋ฅ˜ํ•˜๋ ค๋Š” ํด๋ž˜์Šค ์ˆ˜ 
  • ํšŒ๊ท€(Regression)
    • ์—ฐ์†๊ฐ’ ์˜ˆ์ธก
    • ํ™œ์„ฑํ™” ์—†์ด MSE(ํ‰๊ท ์ œ๊ณฑ์˜ค์ฐจ) ์†์‹ค.

 

ํ•ต์‹ฌ ํ๋ฆ„ ์ •๋ฆฌ

  1. ์ž…๋ ฅ → ๊ฐ€์ค‘ํ•ฉ → ํ™œ์„ฑํ™” → ์ธต ์ „๋‹ฌ
  2. ์ถœ๋ ฅ์ธต์—์„œ ๋ชฉ์ ์— ๋งž๊ฒŒ ๋ณ€ํ™˜ (๋ถ„๋ฅ˜: Softmax / ํšŒ๊ท€: ๊ทธ๋Œ€๋กœ)
  3. ํ•™์Šต & ์ถ”๋ก ์œผ๋กœ ๋‚˜๋ˆ„์–ด ๋ชจ๋ธ์„ ์šด์šฉํ•จ

 

 

๋”ฐ๋ผ์„œ ์‹ ๊ฒฝ๋ง์€ “๊ฐ€์ค‘์น˜·ํŽธํ–ฅ + ํ™œ์„ฑํ™” ํ•จ์ˆ˜”๋ฅผ ์ธต์ธต์ด ์Œ“์•„ ๋ณต์žกํ•œ ํŒจํ„ด์„ ํ•™์Šตํ•˜๊ณ , ๋ถ„๋ฅ˜·ํšŒ๊ท€ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•œ๋‹ค.