Notice
Recent Posts
Recent Comments
Link
250x250
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
Tags
- 모바일
- polars
- 쿠버네티스
- UI for kafka
- Java
- 도커
- 크롤링
- kafka
- freshness
- airflow
- Python
- Materializations
- docker
- 동적 차트
- 파이썬
- proerty
- mysql
- 카프카
- 윈도우
- query history
- CDC
- DBT
- k9s
- spark
- numpartitions
- KubernetesPodOperator
- spring boot
- bar cahrt
- dbt_project
- ksql
Archives
- Today
- Total
데이터 엔지니어 이것저것
비트코인 데이터 분석 본문
728x90
23만개의 비트코인 데이터를 가져와서 분석을 한다.
col_list = list(data.columns)
for column in col_list:
plt.figure()
sns.distplot(data[column])
각 칼럼의 분포도를 시각화 하여 1차적인 분석을 한다
data = data[new_col_list] # 정규화된 칼럼만 사용
data
선별한 칼럼들만 가지고 다시 dataframe생성
from sklearn.preprocessing import MinMaxScaler
min_max_scaler = MinMaxScaler()
data[new_col_list] = min_max_scaler.fit_transform(data[new_col_list])
data = data * 255 # 0~255까지로 만듬
해당 데이터를 가지고 0~255의 수치화 시킨다
해당 데이터를 3그룹으로 나눈다. (특정 기준을 가지고)
728x90
'기타 > 데이터 분석 및 시각화' 카테고리의 다른 글
Lux (0) | 2021.11.18 |
---|---|
타이타닉 분석 (0) | 2021.09.11 |
판다스 프로파일링 (0) | 2021.09.09 |
서울시 인구-CCTV 현황 산점도 (0) | 2021.06.10 |
워드 클라우드 (0) | 2021.06.03 |