2023년 1학기 방송통신대 다변량분석 출석수업대체과제물)R과 파이썬을 각각 이용하여 작성하시오 (결과+분석) 교재 연습문제 1장(p.38) 4번 2장(p.78) 4번 4장(p.1
2023년 1학기 방송통신대 다변량분석 출석수업대체과제물)R과 파이썬을 각각 이용하여 작성하시오 (결과+분석) 교재 연습문제 1장(p.38) 4번 2장(p.78) 4번 4장(p.1 다변량분석.zip
해당 자료는 해피레포트에서 유료결제 후 열람이 가능합니다.분량 : 36 페이지 /zip 파일설명 : 교재를 중심으로 여러 문헌을 참고하여 상세히 작성했습니다.리포트 작성에 참고하시어 좋은 성적 받으세요~
(다변량분석_2023_1학기.pdf, 다변량분석_2023_1학기.ipynb 파일 첨부)
데이터는 exdata.zip (김성수 교수 홈페이지 자료실에 있음)
행복하세요, Now목차
R과 파이썬을 각각 이용하여 작성하시오 (결과+분석)
1(10점). 교재 연습문제 1장(p.38) 4번
(1)R을 이용하여 산점도행렬, 별그림, 얼굴그림을 그리고 해석하시오.
(2)“longley" 데이터를 CSV 파일로 저장하시오.
(3)파이썬을 이용하여 데이터를 읽고, 산점도행렬을 그리시오. 출력결과를 비교하여 설명하시오.
2(10점). 교재 연습문제 2장(p.78) 4번
(1) R을 이용하여 주성분분석을 실행하고 해석하시오.
①자료 가져오기 및 요약통계량 ② 주성분분석 실행하기
③주성분분석 결과
(2) 파이썬을 이용하여 주성분분석을 실행하고 R의 결과와 비교, 분석하시오.
①데이터 읽기 및 기술통계량 구하기 ②변수표준화
③파이썬 초기 주성분분석 ④파이썬 주성분분석
3(10점). 교재 연습문제 4장(p.176) 5번
R
(1) 각 변수별로 관찰값들을 표준화하시오.
(2) 와드의 방법을 이용하여 고객들을 군집화하고 덴드로그램으로 표현하시오. 몇 개의 군집이 적절하다고 판단되는지 설명하시오.
(3) 최장연결법을 이용하여 고객들을 군집화하고 덴드로그램으로 표현하시오. 몇 개의 군집이 적절하다고 판단되는지 설명하시오.
(4) 와드의 방법과 최장연결법을 이용한 군집분석의 결과를 서로 비교하시오.
(5) K-평균 군집분석방법을 이용하여 6개 군집에 대한 군집분석을 실시하시오. 각 군집별 평균을 이용하여, 군집별 특성을 기술하시오.
Python
(1) 각 변수별로 관찰값들을 표준화하시오.
(2) 와드의 방법을 이용하여 고객들을 군집화하고 덴드로그램으로 표현하시오. 몇 개의 군집이 적절하다고 판단되는지 설명하시오.
(3) 최장연결법을 이용하여 고객들을 군집화하고 덴드로그램으로 표현하시오. 몇 개의 군집이 적절하다고 판단되는지 설명하시오.
(4) 와드의 방법과 최장연결법을 이용한 군집분석의 결과를 서로 비교하시오.
(5) K-평균 군집분석방법을 이용하여 6개 군집에 대한 군집분석을 실시하시오. 각 군집별 평균을 이용하여, 군집별 특성을 기술하시오.
4. 참고문헌
본문일부
얼굴그림은 열굴의 각 특성을 변수와 대응시켜 관찰값을 표시한 것이다.
얼굴그림은 다변량 변수의 속성값들을 15가지의 얼굴의 생김새(얼굴 높이, 얼굴 넓이, 입 높이, 입 넓이 등) 특성에 매핑해서 얼굴 모양이 달라지게 하는 방식이다.
위 결과의 effect of variables에 얼굴의 특성과 매핑된 변수가 나열되어 있다.
얼굴그림은 얼굴 모양을 가지고 데이터 관측치들의 특성을 직관적으로 파악할 수 있다.
그러나 매핑된 변수가 많아 레이더 차트, 별그림, 평행좌표그림 등과 비교하면 불편하다는 단점도 있다.
face.type = 0 (line drawing faces)은 색깔 없이 선으로만 얼굴을 그린다.
face.type = 1 (the elements of the faces are painted)는 색깔도 같이 칠한다(디폴트).
face.type = 2 (Santa Claus faces are drawn)는 산타클로스 얼굴에 색을 칠한다.
얼굴의 폭(GNP)과 높이(GNP.deflator)가 커지고 있으므로 경제발전이 지속적으로 이루어지면서 물가는 꾸준히 상승하고 있음을 알 수 있다.
또한 인구에 해당하는 코의 높이(Population)도 계속 커지고 있어 인구도 꾸준히 증가하고 있음을 알 수 있다.
전체적으로 얼굴 크기가 시간에 따라 계속 커지고 있으므로, 앞서 설명한 것처럼 경제가 꾸준히 성장해오고 있음을 보여준다.
참고문헌
김성수·김현중·정성석·이용구(2022), 다변량분석, 출판문화원.
https://professor.knou.ac.kr/sskim/index.do?epTicket=LOG(담당교수 홈페이지)
https://github.com/tirthajyoti/Machine-Learning-with-Python/blob/master/Clustering-Dimensionality-Reduction/Hierarchical_Clustering.ipynb(Machine-Learning-with-Python)
https://angeloyeo.github.io/2019/08/20/correlation_and_inner_product.html (상관계수는 벡터의 내적이다)
http://www.nextobe.com/2020/04/15/%EC%A3%BC%EC%84%B1%EB%B6%84%EB%B6%84%EC%84%9Dprincipal-component-analysis/ (주성분분석)
https://datasciencee.tistory.com/5 (주성분분석)
댓글 없음