2025.04.22
정규화 내용 추가
- 학습용 / 테스트용 특성 데이터에 정규화를 진행한다.
Confusion Matrix와 평가 지표 내용 정리 자료
Orange3 사용
회귀 분석
- 회귀란 입력과 출력의 상관관계를 찾는 것
- 회귀분석은 Y = aX + b와 같은 어떤 함수를 만들어 낸 후 이 함수식으로 예측한 결과값과 실제값의 차이(오차)를 제곱해서 모두 더한 값이 최소화되도록 함수를 조정해 가는 작업 → 적절한 a와 b를 찾는 것이 목표
단순 선형 회귀(Simple Linear Regression)
- 독립변수 X와 종속변수 Y가 각각 하나이고 임의로 분포한 데이터들을 하나의 직선으로 일반화시킨 것으로 둘의 관계가 1차 직선인 경우를 단순 선형 회귀라고 합니다.
- 단순 선형 회귀식 : y = mx + c
선형 회귀 장단점
장점
- 학습 속도가 빠르고 예측도 빠름
- 예측이 어떻게 만들어지는지 수식 등을 통해 비교적 쉽게 이해할 수 있음
단점
- 독립변수가 많을 경우 때로는 계수 값이 왜 그렇게 계산되는지 명확하지 않을 때가 있음
회귀 문제를 해결하기 위한 단계별 접근
- 변수를 산점도에 그려서 변수 간의 관계를 알 수 있습니다.
- 선을 사용하여 그들 사이의 관계를 나타낼 수 있습니다.
- 선형 회귀에서 변수 간의 관계를 나타내기 위해 직선을 사용합니다.
- 최적선은 변수 간의 선형 관계를 나타내는 최적선으로 간주됩니다.
단순 선형 회귀
Loss (손실)함수 이해하기
- 실제 값과 예측 값 차이의 제곱의 합을 Loss 함수로 정의합니다.
→ Loss 함수가 작을수록 좋은 모델임
편향(bias)
- bias는 y절편을 의미하며 입력이 0일 때의 예측값으로 직선의 "시작점"을 조정하는 역할을 함
옵티마이저 - 경사하강법 & 학습률