티스토리 뷰

728x90

24년 1월 31일 부터 데이터 분석 1주차 시작

 

공부 메모하기

 

* 엑셀

1.  A에서 G까지 다 선택할 때에는 A를 클릭한 후 Shift 키를 누른후 G를 선택하면 다 선택된다.

2. 필터만들기 : 시트를 선택한 후 ...모양을 클릭하면 깔데기모양의 '필터만들기'를 선택하면 필터만들기가 완성

3. 시트에서 공백을 지우고 싶을 때 필터를 선택 후 '공백'을 클릭 후 확인 하면 '공백'만 없어지고 다른 데이터는 그대로 정렬

-> 여기까지 정리하는 과정을 '데이터 전처리' 과정이라고 한다.

 

맨 윗 부분에 '확장프로그램' 선택 후 '부가기능' - '부가기능 설치하기' 를 선택한다. : 스트레드 시트에 시트기능을 추가할 수 있는 기능

 

1. analysis toolpak 을 쳐서 빨간색 프로그램을 선택 후 다운로드 한다.

2. '확장프로그램' 아래에 'XLMiner Analysis ToolPak 을 선택한다.

3. A라는 요인이 B라는 결에 어떤 영향을 미치는지를 알아본다. : Correlation(상관관계 분석)

4. Input Range 에 B1:G892 를 넣어 알아보고 Output Range 를 J:Q J부터 Q까지 아무 빈칸에 결과를 받아본다고 입력한다. (Labels in First Row 를 선택해야 어떤 데이터를 분석했는지 제목을 부여받을 수 있다.)

 

어떤 결과인지 확인해보자

 

1. J1부터 Q7까지 Shift를 누른 후 선택한다.

2. 누른 상태에서 '삽입'-'차트'를 입력하면 데이터를 쉽게 '시각화' 할 수 있다.

3. 차트 편집기에서 계열 중 Survived를 제외한 다른 데이터를 삭제한다.

4. 맞춤설정에서 계열 - 데이터 라벨 을 선택하면 그레프 위에 값이 뜬다.

5. 해석 : 음의 값이든 양의 값이든 숫자가 크면 상관관계가 크다고 볼 수 있다.

6. 결과 : 예상은 돈을 많이 지불한 사람일 수록 많이 살아남은 것이다라고 예상했지만 결과적으로는 성별이 여성일 수록 많이 살아남았다는 결과를 얻을 수 있다. 돈을 많이 지불할 수록, 좌석등급이 낮을 수록(1등급일수록) 살아남았다는 것에는 영향을 미치지만 그것이 성별보다는 영향력이 낮다라고 해석된다.

반응형
반응형
TAG
more
최근에 올라온 글