• 통큰쿠폰이벤트-통합

데이터마이닝 6장 연습문제

*바*
최초 등록일
2007.11.14
최종 저작일
2007.11
13페이지/ 한컴오피스
가격 1,500원 할인쿠폰받기
다운로드
장바구니

소개글

자유아카데미 데이터마이닝 방법론의 6장 연습문제를 SAS-Eminer 프로그램을 이용하여 푼 것입니다.

목차

제 6장. 예측모형에 대한 평가
분석사례 1 : 리프트 그래프를 이용한 모형평가
분석사례 2 : 사전확률과 이익을 고려하기
분석사례 3 : Threshold-based 그래프

본문내용

p206 <교차(Cross) 리프트 그래프 (Cumulative %Response)>
위의 그래프는 회귀노드에 대해 분석용, 검증용, 테스트 데이터에 관한 리프트 그래프를 함께 표현한 교차 리프트 그래프이다. 최고의 예측력을 가지도록 학습이 이루어진 연습용 데이터의 성능이 가장 높고 그 다음이 테스트용, 검증용 데이터 순임을 알 수 있다. 그러나 전반적으로 세 데이터 간의 리프트 그래프들이 크게 다르지 않은 것으로 보아 안정성(일반화 가능성) 있는 예측모형이라고 볼 수 있다. 의사결정노드와 신경망 노드에 대한 교차 리프트 그래프도 그려서 살펴 본 결과, 역시 위와 유사한 그래프를 가졌다.
p207 < 리프트 데이터 (Regression 노드) >
위의 그림은 리프트 그래프 윈도우에서 리프트 데이터 보기 아이콘을 클릭해 리프트 그래프 관련정보들을 데이터 형태로 본 것이다. 여기에서는 각 등급에 해당하는 사후확률의 절단값을 알 수 있는데, 예를 들어 연습용 데이터에 의한 상위 50%에 해당하는 절단값은 0.120이다.

리프트 그래프 윈도우에서 풀다운 메뉴의 형식, 수평축 간격 설정을 선택 후 set horizontal scale 대화상자에서 각각 2%, 20%단위로 수평축 간격을 변경해 보았다.
(1-특이도)를 x축으로 삼고, 민감도를 y축으로 삼아 ROC그래프를 그렸다. 그래프 아래의 면적이 넓을수록(1에 가까울수록) 예측모형의 성능이 좋음을 나타내는데, 육안상으로는 전반적으로 모형들의 성능이 좋으며 그 중에서도 의사결정나무 모형의 성능이 가장 좋은 것을 알 수 있다. 하지만 객관적인 수치로 모형의 성능을 측정하기 위해 실제로 면적을 구하면 다음과 같다.

BUYTEST 데이터세트의 변수 `RESPOND`의 역할을 target으로 삼고, 변수 ‘C1~C7, PURCHTOT`의 역할을 rejected로, 변수 BUY6, 12, 18의 변수측도를 interval로 수정했다.

참고 자료

없음
*바*
판매자 유형Bronze개인

주의사항

저작권 자료의 정보 및 내용의 진실성에 대하여 해피캠퍼스는 보증하지 않으며, 해당 정보 및 게시물 저작권과 기타 법적 책임은 자료 등록자에게 있습니다.
자료 및 게시물 내용의 불법적 이용, 무단 전재∙배포는 금지되어 있습니다.
저작권침해, 명예훼손 등 분쟁 요소 발견 시 고객센터의 저작권침해 신고센터를 이용해 주시기 바랍니다.
환불정책

해피캠퍼스는 구매자와 판매자 모두가 만족하는 서비스가 되도록 노력하고 있으며, 아래의 4가지 자료환불 조건을 꼭 확인해주시기 바랍니다.

파일오류 중복자료 저작권 없음 설명과 실제 내용 불일치
파일의 다운로드가 제대로 되지 않거나 파일형식에 맞는 프로그램으로 정상 작동하지 않는 경우 다른 자료와 70% 이상 내용이 일치하는 경우 (중복임을 확인할 수 있는 근거 필요함) 인터넷의 다른 사이트, 연구기관, 학교, 서적 등의 자료를 도용한 경우 자료의 설명과 실제 자료의 내용이 일치하지 않는 경우

이런 노하우도 있어요!더보기

찾던 자료가 아닌가요?아래 자료들 중 찾던 자료가 있는지 확인해보세요

  • 국내 에듀테크 TOP 기업 조사 (2022년 버전) 8페이지
    지식재산권 보유 자연언어처리 , 의미기반 정보검색 , 인공신경망 , 텍스트마이닝 ... 평가 AI 영어학습 ( 실시간 발음교정 , 수준별 / 상황별 시나리오 연습 ... 작문 · 기계독해 (MRC), 설명가능한 텍스트 분류기 (XDC) 엔진 6
  • [A+과제]대전과기대 - 4차산업혁명과 미래기술 - 5장 '인공지능 기술' 문제풀이 과제 8페이지
    5주 과제 [제5장 인공지능 기술]연습문제1. ... , 고객정보, 자산정보 분석(ERP, CRM, 데이터 마이닝 등)빅데이터 ... 주고 잘못한 행동에 대해 벌을 주는경험을 통해 지식을 학습하는 방식이다.6.
  • 1년 이상 지속되고 있는 코로나19와 관련한 사회문제의 주제를 선정하여 5페이지
    실내 문화 시설의 폐쇄, 실외 공공체육시설 내 인원 제한, 영화관이나 노래연습장 ... 집중적으로 수집하여, 텍스트 마이닝의 방식으로 통해 키워드를 분석하였는데 ... 느낀다고 답하였으며 메르스 진료를 했던 의사들의 경우 우울 증상(26.6%
  • 데이터마이닝 기말문제 6페이지
    제1장 데이타마이닝의 주요 개념- CRM 이란? ... 토대로 고객특성에 맞게 마케팅 활동을 계획·지원·평가하는 과정이다.- 데이타마이닝의 ... 해석이 불가능, 어떤 입력변수가 중요하고 상호작용하는지 결정하기 어려움.제6장
  • 오픈마켓 11번가의 문제점과 전략적 방안 13페이지
    혹은 digg.com의 swarm과 비슷한 데이터 마이닝 화면 구성(data ... mining visualization)이라는 느낌이 들었다. ... ‘오늘 본 상품’과 ‘찜한 상품’, ‘장바구니’는 다른 쇼핑몰과 다를 바
더보기
최근 본 자료더보기
탑툰 이벤트
데이터마이닝 6장 연습문제
  • 아이템매니아 이벤트
  • 유니스터디 이벤트
AI 챗봇
2024년 09월 21일 토요일
AI 챗봇
안녕하세요. 해피캠퍼스 AI 챗봇입니다. 무엇이 궁금하신가요?
9:02 오전
문서 초안을 생성해주는 EasyAI
안녕하세요. 해피캠퍼스의 방대한 자료 중에서 선별하여 당신만의 초안을 만들어주는 EasyAI 입니다.
저는 아래와 같이 작업을 도와드립니다.
- 주제만 입력하면 목차부터 본문내용까지 자동 생성해 드립니다.
- 장문의 콘텐츠를 쉽고 빠르게 작성해 드립니다.
9월 1일에 베타기간 중 사용 가능한 무료 코인 10개를 지급해 드립니다. 지금 바로 체험해 보세요.
이런 주제들을 입력해 보세요.
- 유아에게 적합한 문학작품의 기준과 특성
- 한국인의 가치관 중에서 정신적 가치관을 이루는 것들을 문화적 문법으로 정리하고, 현대한국사회에서 일어나는 사건과 사고를 비교하여 자신의 의견으로 기술하세요
- 작별인사 독후감
방송통신대학 관련 적절한 예)
- 국내의 사물인터넷 상용화 사례를 찾아보고, 앞으로 기업에 사물인터넷이 어떤 영향을 미칠지 기술하시오
5글자 이하 주제 부적절한 예)
- 정형외과, 아동학대