데이터 엔지니어 이것저것

로지스틱 회귀분석 본문

머신러닝

로지스틱 회귀분석

pastime 2021. 9. 8. 20:18
728x90

로지스틱회귀분석이란?
회귀를 사용하여 데이터가 어떤 범주에 속할 확률을 0과 1사이의 값으로 예측.
그 확률에 따라 가능성이 더 높은 범주에 속하는 것으로 분류해주는 지도 학습 알고리즘이다.

eg) 생존확률이 0.5 이상이면 생존, 아니면 사망 이런식으로 분류하는것이다
이렇게 데이터가 2개의 범주 중 하나에 속하도록 결정하는 것을 2진 분류 라고 한다.

앞서 로지스틱 회귀를 이해하기 위해선 선형회귀에 대한 개념을 이해해야한다.

선형회귀란?
데이터를 놓고 가장 잘 설명할 수 있는 선을 찾는 분석하는 방법을 선형 회귀 분석이라고 한다.

 

python 으로는 scikit-learn을 통해 로지스틱 회귀알고리즘을 사용한다.

from sklearn.linear_model import LogisticRegression

logreg = LogisticRegression()
logreg.fit(X_train, Y_train)

 

728x90

'머신러닝' 카테고리의 다른 글

언어 모델  (0) 2021.12.26
자연어 처리  (0) 2021.12.26
Pytorch GPU 사용 여부 확인  (0) 2021.08.31
PyTorch 설치하기  (0) 2021.08.31
wordcloud + eunjeon  (0) 2021.02.26