[A학점 레포트] 다중회귀분석 프로젝트 레포트
- 최초 등록일
- 2023.06.09
- 최종 저작일
- 2021.06
- 29페이지/ MS 워드
- 가격 2,500원
목차
Ⅰ. 분석 주제 및 목적
1. 분석 주제 및 목적
Ⅱ. 분석 계획 수립 과정
1. 변수 선택
2. 데이터 수집 및 탐색적 분석
3. 선형 회귀 모형 설정
4. 적합방법 선택
Ⅲ. 분석 내용
1. 모형 적합
2. 진단
Ⅳ. 분석 결과 및 결론, 분석의 한계
1. 분석 결과 요약
2. 최종 결론
3. 분석의 한계점
Ⅵ. 부록 : 결과 및 R 코드
1. Output 자료
2. R 코드
본문내용
Ⅰ. 분석 주제 및 목적
i. 분석 주제
코로나 확진자 수와 운항한 항공편에 탑승한 사람들의 수와의 관계
ii. 주제 선정 이유 및 분석 목적
코로나의 장기화에 따라 큰 타격을 입은 것으로 알려져 있는 항공업계와 코로나-19 바이러스의 경과 사이의 관계성을 알아보고자 분석하게 되었다.
Ⅱ. 분석 계획 수립 과정
i. 변수 선택
[반응변수 Y]
코로나 바이러스의 경과가 항공 탑승객 수에 미친 영향을 알아보기 위한 분석이므로 항공 탑승객의 수를 반응변수로 설정한다 (단위: 명, 양적변수).
[설명변수]
X1 (time): 코로나 최초 발생시기로부터의 시간 (단위: 달, 양적변수)
X2 (isolate): 매월 말일, 격리 중 상태인 환자의 수 (단위: 명, 양적변수)
X3 (accum): 매월 말일, 누적 확진자 수 (단위: 명, 양적변수)
X4 (rest): 해당 월에 포함된 휴일의 수 (단위: 일, 양적변수)
ii. 데이터 수집 및 탐색적 분석
[반응변수 Y]
KOSIS 항공통계에서 2020.01~2021.04 시기의 월별 국내선 탑승객 수, 국제선 탑승객 수를 각각 수집 후 취합했다.
자료의 수는 16개, 표준편차 2235082, 왜도 2.419, 첨도 5.362를 가지는 변수다. 부록의 그림 2-2. (a)의 히스토그램과 box plot을 참고하면 Y가 왼쪽으로 치우친 분포를 가지며, 특이값을 두 개 가짐을 알 수 있다.
Y가 한쪽으로 치우친 분포이므로 log변환이 고려된다. 따라서 log(Y)에 대한 탐색적 데이터 분석 또한 진행했다.
자료의 수는 16개, 표준편차 0.493, 왜도 1.25, 첨도 1.413을 가지는 변수이다. 부록의 그림 2-2. (b)의 히스토그램과 box plot을 참고하면 log(Y) 왼쪽으로 약간 치우친 분포를 가지며, 특이값을 한 개 가짐을 알 수 있다.
참고 자료
없음