진도: Chapter 04
기본미션: Ch.04(04-1) 2번 문제 풀고, 풀이 과정 설명하기
선택미션: Ch.04(04-2) 과대적합/과소적합 손코딩 코랩 화면 캡처하기
로지스틱 회귀 (logistic regression)
- 수학을 사용하여 두 데이터 요인 간의 관계를 찾는 데이터 분석 기법
- 회귀 분석의 목표와 동일하게 종속 변수와 독립 변수간의 관계를 구체적인 함수를 나타내어 향후 예측 모델에서 사용
- 종속 변수가 범주형 데이터를 대상으로 한 일종의 분류(Classification) 기법
중요성
- 간편성: 다른 ML 기법보다 수학적으로 덜 복잡함
- 속도: 메모리 및 처리 성능과 같은 계산 용량이 덜 필요하므로 대량의 데이터를 고속으로 처리할 수 있음.
- 유연성: 두 개 이상의 유한한 결과가 있는 질문에 대한 답을 찾을 수 있음. 전처리에도 사용 가능
- 가시성: 내부 소프트웨어 프로세스에 대한 더 높은 가시성이 제공됨
로지스틱 회귀 함수(시그모이드 함수, Sigmoid Function)
로지스틱 회귀는 연속이고 증가함수이며 [0, 1]에서 값을 갖는 연결 함수 (이진 분류시 사용)
z 가 아주 큰 음수일 때 0이 되고, 아주 큰 양수일 때 1이 됨.
$f(x) = \dfrac{1}{1+e^{-z}}$ 시그모이드 함수
**시그모이드 그래프**
독립 변수의 값에 관계 없이 종속 변수의 값이 0과 1사이의 값만을 반환한다.