[바이오통계학] 1. 만 7세 남자 아동의 평균 몸무게를 추정하기 위하여 만 7세 남자 아동 100명을 모집하여 몸무게를 측정하고 평균을 계산하였다. 다음의 개념이 각각 모집단, 표본, 모수, 통계량 중 무엇에 해당하는지 쓰시오. 2. 교재와 강의에서 사용한 췌장암 환자 데이터(biostat_ex_data.csv)를 이용하여 다음의 질문에 답하시오. 3.
레포트왕
다운로드
장바구니
과제정보
학과 | 통계·데이터과학과 | 학년 | 3학년 |
---|---|---|---|
과목명 | 바이오통계학 | 자료 | 3건 |
공통 |
1. 만 7세 남자 아동의 평균 몸무게를 추정하기 위하여 만 7세 남자 아동 100명을 모집하여 몸무게를 측정하고 평균을 계산하였다. 다음의 개념이 각각 모집단, 표본, 모수, 통계량 중 무엇에 해당하는지 쓰시오.
(1) 모집된 만 7세 ...
1. 만 7세 남자 아동의 평균 몸무게를 추정하기 위하여 만 7세 남자 아동 100명을 모집하여 몸무게를 측정하고 평균을 계산하였다. 다음의 개념이 각각 모집단, 표본, 모수, 통계량 중 무엇에 해당하는지 쓰시오.
(1) 모집된 만 7세 남자 아동 100명 (2점) (2) 모집된 100명의 평균 몸무게 (2점) 2. 교재와 강의에서 사용한 췌장암 환자 데이터(biostat_ex_data.csv)를 이용하여 다음의 질문에 답하시오. (1) 바이오통계학 깃허브 웹페이지 https://github.com/biostat81/biostatistics 에서 데이터 파일(biostat_ex_data.csv)을 다운로드 받고 R에 데이터를 읽어들이고 저장하시오. (힌트: 교재 9쪽 프로그램 1-3에서 1행을 본인의 컴퓨터 환경에 맞게 수정하고 실행하여 작업 디렉터리를 설정한 후, 2, 3행을 실행한다.) 교재를 참고하여 범주형 변수를 factor 형태로 저장하시오. (힌트: dplyr 패키지를 설치한 후, 교재 11쪽 프로그램 1-4를 실행한다.) 수축기 혈압(SBP)의 분포를 나타내는 히스토그램을 그리시오. R 명령문과 히스토그램을 제출하시오. (4점) (2) 이 데이터에 포함된 췌장암 환자 156명 전체의 수축기 혈압의 중앙값을 구하시오. R 명령문을 같이 제출하시오. (4점) (3) 이 데이터에 포함된 156명이 대표하는 모집단의 평균 수축기 혈압에 대한 95% 신뢰구간을 구하시오. R 명령문과 출력결과를 같이 제출하시오. (4점) 3. 2번 문항에서 저장한 췌장암 환자 데이터를 이용하여, 그 데이터가 대표하는 흡연자 모집단의 평균 수축기 혈압과 비흡연자 모집단의 평균 수축기 혈압을 비교하는 가설검정을 수행하기 위해 아래의 질문에 답하시오. (1) 귀무가설은 무엇인가? (3점) (2) 대립가설은 무엇인가? (단, 어느 쪽이 더 크다고 방향을 정해놓지 않고, 두 그룹의 평균 수축기 혈압이 같은지 다른지 알아보는 양측 검정을 할 것.) (3점) (3) R을 이용하여 이표본 이분산 t-검정을 수행하시오. R 명령문과 출력결과를 제출하시오. (4점) (4) (3)에서 수행한 가설검정 결과를 해석하시오. (4점) |
* 본 문서는 한글표준문서(*.hwpx)로 작성되었습니다. 최신패치가 되어 있는 2010 이상 버전이나 한글뷰어에서 확인해 주시기 바랍니다.
소개글
과목명 : 바이오통계학레포트 주제 :
1. 만 7세 남자 아동의 평균 몸무게를 추정하기 위하여 만 7세 남자 아동 100명을 모집하여 몸무게를 측정하고 평균을 계산하였다. 다음의 개념이 각각 모집단, 표본, 모수, 통계량 중 무엇에 해당하는지 쓰시오.
(1) 모집된 만 7세 남자 아동 100명 (2점)
(2) 모집된 100명의 평균 몸무게 (2점)
2. 교재와 강의에서 사용한 췌장암 환자 데이터(biostat_ex_data.csv)를 이용하여 다음의 질문에 답하시오.
(1) 바이오통계학 깃허브 웹페이지 https://github.com/biostat81/biostatistics 에서 데이터 파일(biostat_ex_data.csv)을 다운로드 받고 R에 데이터를 읽어들이고 저장하시오. (힌트: 교재 9쪽 프로그램 1-3에서 1행을 본인의 컴퓨터 환경에 맞게 수정하고 실행하여 작업 디렉터리를 설정한 후, 2, 3행을 실행한다.) 교재를 참고하여 범주형 변수를 factor 형태로 저장하시오. (힌트: dplyr 패키지를 설치한 후, 교재 11쪽 프로그램 1-4를 실행한다.) 수축기 혈압(SBP)의 분포를 나타내는 히스토그램을 그리시오. R 명령문과 히스토그램을 제출하시오. (4점)
(2) 이 데이터에 포함된 췌장암 환자 156명 전체의 수축기 혈압의 중앙값을 구하시오. R 명령문을 같이 제출하시오. (4점)
(3) 이 데이터에 포함된 156명이 대표하는 모집단의 평균 수축기 혈압에 대한 95% 신뢰구간을 구하시오. R 명령문과 출력결과를 같이 제출하시오. (4점)
3. 2번 문항에서 저장한 췌장암 환자 데이터를 이용하여, 그 데이터가 대표하는 흡연자 모집단의 평균 수축기 혈압과 비흡연자 모집단의 평균 수축기 혈압을 비교하는 가설검정을 수행하기 위해 아래의 질문에 답하시오.
(1) 귀무가설은 무엇인가? (3점)
(2) 대립가설은 무엇인가? (단, 어느 쪽이 더 크다고 방향을 정해놓지 않고, 두 그룹의 평균 수축기 혈압이 같은지 다른지 알아보는 양측 검정을 할 것.) (3점)
(3) R을 이용하여 이표본 이분산 t-검정을 수행하시오. R 명령문과 출력결과를 제출하시오. (4점)
(4) (3)에서 수행한 가설검정 결과를 해석하시오. (4점)
목차
I. 서론II. 본론
1. 통계학의 기본 개념
2. 췌장암 환자 데이터 분석
3. 가설검정의 결과 및 시사점
4. 시사점 및 향후 과제
III. 결론
IV. 참고문헌
본문내용
통계학은 다양한 학문 분야에서 핵심적인 도구로 사용되며, 데이터의 수집, 분석, 해석을 통해 실세계의 현상과 패턴을 이해하고 예측하는 역할을 한다. 특히 바이오통계학은 생물학적 현상과 의학적 데이터를 다루는 분야로, 환자의 건강 상태를 분석하고 치료 효과를 평가하며, 공중보건 정책을 수립하는 데 중요한 기여를 한다. 통계학적 방법론을 통해 연구자들은 복잡한 데이터 속에서 의미 있는 정보를 추출할 수 있으며, 이를 바탕으로 과학적이고 객관적인 결론을 도출할 수 있다.현대 의학과 보건 연구에서 통계학의 중요성은 갈수록 증가하고 있다. 임상 시험, 역학 연구, 유전학 연구 등 다양한 분야에서 통계적 분석은 필수적인 도구로 자리잡았다. 예를 들어, 임상 시험에서는 새로운 치료법의 효과를 검증하기 위해 환자 데이터를 분석하며, 역학 연구에서는 질병의 발생률과 위험 요인을 분석하여 예방 전략을 수립한다. 이러한 연구들은 모두 정확하고 신뢰성 있는 통계적 분석을 통해 의미 있는 결과를 도출하며, 이러한 결과는 환자 치료와 공중보건 정책 결정에 직접적으로 영향을 미친다.
바이오통계학은 특히 의료 데이터의 복잡성과 다양성을 다루는 데 중요한 역할을 한다. 의료 데이터는 종종 높은 차원성과 비정상적인 분포를 가지며, 다양한 변수가 서로 복잡하게 얽혀 있는 경우가 많다. 이러한 데이터를 분석하기 위해서는 고급 통계적 기법이 필요하며, 이러한 기법들은 의료 데이터의 본질을 이해하고 적절한 분석 방법을 선택하는 데 중요한 지침을 제공한다. 예를 들어, 생존 분석은 환자의 생존율과 치료 효과를 평가하는 데 널리 사용되며, 회귀 분석은 다양한 요인들이 질병 발생에 미치는 영향을 평가하는 데 사용된다.
참고 자료
박서영. (2024). 바이오통계학. 한국방송통신대학교출판문화원.Triola, M. F., Triola, R. A., & Roy, B. (2021). 통계학의 이해와 활용: 생명과학, 보건학, 간호학, 의학을 중심으로 (제2판, 김호, 백도현, & 이수현, 역). 바이오사이언스.