Courses/통계적데이터분석 4

04_1 Data Preprocessing

1) Handling Missing DataMissing Data (결측값)다양한 이유로 측정 data의 값이 missing 일 수 있음 ➢ e.g., 응답을 안했거나, 측정이 불가능 하거나, 기기의 오류, 기술의 한계 등Missing value을 처리 하지 않고 분석을 하면 mean, variance등의 계산 혹은 추후에 모델을 만들 때 에러가 생김 ➢ Package마다 기본으로 내장된 처리 방식이 존재 하기도 함 (e.g., pandas는 missing값 제외하고 계산)다양한 방법으로 Missing value를 처리Removal or deletion of missing value.Impute missing value with Mean/Median/Mode.Inference (Regression / C..

02_시각화

2023-202_1 시각화기술 통계학(Descriptive Statistics): a summary statistic that quantitatively describes or summarizes features from a collection of information추측 통계학(Inferential statistical analysis): infers properties of a population, e.g., by testing hypotheses and deriving estimates시각화(Data Visualization)숫자 형태의 데이터를 그림 형태로 표현하는 것다양한 visualization package 개발됨(e.g., matplotlib, seaborn)데이터의 특성과 보여주기 위한..