728x90
반응형
t2-1. 타이타닉(Titanic) Simple Baseline
생존여부 예측모델 만들기
학습용 데이터 (X_train, y_train)을 이용하여 생존 예측 모형을 만든 후, 이를 평가용 데이터(X_test)에 적용하여 얻은 예측값을 다음과 같은 형식의 CSV파일로 생성하시오(제출한 모델의 성능은 accuracy 평가지표에 따라 채점)
(가) 제공 데이터 목록
- y_train: 생존여부(학습용)
- X_trian, X_test : 승객 정보 (학습용 및 평가용)
(나) 데이터 형식 및 내용
- y_trian (712명 데이터)
시험환경 세팅은 예시문제와 동일한 형태의 X_train, y_train, X_test 데이터를 만들기 위함임
유의사항
- 성능이 우수한 예측모형을 구축하기 위해서는 적절한 데이터 전처리, 피처엔지니어링, 분류알고리즘, 하이퍼파라미터 튜닝, 모형 앙상블 등이 수반되어야 한다.
- 수험번호.csv파일이 만들어지도록 코드를 제출한다.
- 제출한 모델의 성능은 accuracy로 평가함
csv 출력형태

add Codeadd Markdown
[참고]작업형2 문구
- 출력을 원하실 경우 print() 함수 활용
- 예시) print(df.head())
- getcwd(), chdir() 등 작업 폴더 설정 불필요
- 파일 경로 상 내부 드라이브 경로(C: 등) 접근 불가
데이터 파일 읽기 예제
- import pandas as pd
- X_test = pd.read_csv("data/X_test.csv")
- X_train = pd.read_csv("data/X_train.csv")
- y_train = pd.read_csv("data/y_train.csv")
사용자 코딩
답안 제출 참고
- 아래 코드 예측변수와 수험번호를 개인별로 변경하여 활용
- pd.DataFrame({'cust_id': X_test.cust_id, 'gender': pred}).to_csv('003000000.csv', index=False)
728x90
반응형
'PYTHON > 빅데이터분석기사' 카테고리의 다른 글
[캐글-퇴근후딴짓] T1 문제풀이 (코드 저장용) (0) | 2023.11.30 |
---|---|
[캐글-퇴근후딴짓] T3 문제풀이 (코드 저장용) (0) | 2023.11.29 |
빅데이터분석기사 제7회 공지 (0) | 2023.11.26 |
ML_04 (regression s4-19~21 보험 예측) (2) | 2023.11.20 |
ML_04 (regression s4-11~18 웹사이트 방문자 예측) (1) | 2023.11.20 |