Notice
Recent Posts
Recent Comments
Link
250x250
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
Tags
- 카프카
- 동적 차트
- Python
- airflow
- bar cahrt
- 도커
- mysql
- CDC
- KubernetesPodOperator
- spark
- polars
- Java
- dbt_project
- UI for kafka
- spring boot
- 크롤링
- freshness
- query history
- DBT
- docker
- ksql
- 모바일
- proerty
- numpartitions
- 윈도우
- kafka
- 쿠버네티스
- Materializations
- 파이썬
- k9s
Archives
- Today
- Total
데이터 엔지니어 이것저것
로지스틱 회귀분석 본문
728x90
로지스틱회귀분석이란?
회귀를 사용하여 데이터가 어떤 범주에 속할 확률을 0과 1사이의 값으로 예측.
그 확률에 따라 가능성이 더 높은 범주에 속하는 것으로 분류해주는 지도 학습 알고리즘이다.
eg) 생존확률이 0.5 이상이면 생존, 아니면 사망 이런식으로 분류하는것이다
이렇게 데이터가 2개의 범주 중 하나에 속하도록 결정하는 것을 2진 분류 라고 한다.
앞서 로지스틱 회귀를 이해하기 위해선 선형회귀에 대한 개념을 이해해야한다.
선형회귀란?
데이터를 놓고 가장 잘 설명할 수 있는 선을 찾는 분석하는 방법을 선형 회귀 분석이라고 한다.
python 으로는 scikit-learn을 통해 로지스틱 회귀알고리즘을 사용한다.
from sklearn.linear_model import LogisticRegression
logreg = LogisticRegression()
logreg.fit(X_train, Y_train)
728x90
'머신러닝' 카테고리의 다른 글
언어 모델 (0) | 2021.12.26 |
---|---|
자연어 처리 (0) | 2021.12.26 |
Pytorch GPU 사용 여부 확인 (0) | 2021.08.31 |
PyTorch 설치하기 (0) | 2021.08.31 |
wordcloud + eunjeon (0) | 2021.02.26 |