Machine Learning
머신러닝 프로젝트의 전체 워크플로우를 Titanic 데이터셋 예시로 설명. 데이터 처리, 시각화, 전처리, 데이터셋 분리, 모델 학습과 평가까지 단계별 정리.
작성일: 2026년 3월 10일
iris with decision tree
붓꽃 데이터셋을 활용한 Decision Tree 분류 모델 구현 및 결정 경계 시각화. 데이터 탐색, 모델 학습, 과적합 분석, 오분류 시각화를 포함한 머신러닝 파이프라인 실습
iris with knn
붓꽃 데이터셋을 활용한 KNN(K-Nearest Neighbors) 분류 모델 구현 및 성능 평가. 데이터 분할, 모델 학습, 정확도 측정, 혼동 행렬 및 분류 리포트를 통한 성능 분석을 수행하고, KNN 알고리즘의 특성과 한계를 학습합니다.
titanic 생존자 예측
타이타닉 데이터셋을 활용한 생존자 예측 머신러닝 프로젝트. 데이터 탐색적 분석(EDA)을 통해 성별, 객실 등급, 나이 등이 생존에 미치는 영향을 분석하고, 의사결정나무 분류기를 사용하여 생존 여부를 예측해보기. 이름에서 호칭을 추출하는 특성 공학 기법과 결측값 처리 방법을 배워보기
와인 분류기
레드와인과 화이트와인을 구별하고, 와인의 품질을 예측하는 머신러닝 프로젝트. MinMaxScaler와 StandardScaler가 결정나무 모델에 영향을 미치는지를 알아보기
logistic regression
와인 데이터셋으로 Logistic Regression과 Decision Tree 모델 학습. ROC AUC 곡선을 이용한 모델 성능 비교.
PIMA 인디언 당뇨병 예측
PIMA 인디언 당뇨병 데이터셋으로 Logistic Regression 모델 학습. 데이터 전처리, 상관관계 분석, 계수값 시각화를 통한 특성 중요도 분석.