[통계] 빅데이터 분석 프로그램 R studio/RStudio 기본 툴 사용법 및 프로젝트 생성

R studio/RStuido 기본 툴(tool) 구성은 어떻게 되어있는지, 대략적으로 살펴보고, 프로젝트 생성 방법에 대해서 설명하겠습니다. 프로젝트는 R 소스 코드와 참조하는 데이터가 유효한 범위를 이루는 단위입니다.

1. 신규 프로젝트 생성

시작 전에 간단히 프로젝트와 데이터의 개념을 간단히 설명드리면, R은 소스코드를 기반으로 동작하는 프로그램입니다. 다시 말해, 통계 분석을 하기 위해 소스코드를 직접 사용자가 입력하고, 실행 명령을 통해서 프로그램이 동작합니다. 예를 들어, 1+1을 계산하는 것도 하나의 소스코드가 필요하고, 그래프를 그리는 것도 하나의 소스코드가 필요합니다. 이 소스코드가 영향을 미치는 범위(Range)를 R에서는 프로젝트라고 합니다.

R에서의 데이터는 값들의 묶음을 의미합니다. 예를 들어, 사람 A의 나이가 10살, 사람 B의 나이가 11살, 사람 C의 나이가 12살이라고 하면, 이 모든 사람들의 나이(사람 A,B,C의 나이)의 그룹을 데이터라고 지칭합니다. 이 데이터가 의미하는 바를 정확하게 알아야 소스코드를 구성할 때, 변수와 변수값을 핸들링 하는 것인지, 데이터를 핸들링하는 것인지에 따라 달라지기 때문에 이 의미를 이해하고 있는 것은 중요합니다.

그럼 R studio/RStudio를 통해 프로젝트를 생성해보겠습니다. R studio/RStuio 상단 "File" 메뉴를 선택하여 "New Project" 항목을 선택합니다.

create_project_step_1

아래와 같이 Create Project 창이 출력되면, 신규 프로젝트 경로에 프로젝트를 생성할지, 기존 프로젝트 경로에 프로젝트를 생성할지를 선택할 수 있습니다. 여기서 신규 프로젝트 경로라고 하는 것은 프로젝트를 묶는 상위 단위의 경로라고 보면 됩니다. 예를 들어, A 프로젝트가 C:\에 생성되어 있다고 가정하면 B 프로젝트를 새로 생성하려고 할 때, 기존의 A 프로젝트가 있는 C:\에 프로젝트를 생성할지, 신규 프로젝트 경로로 D:\를 지정할지를 묻는 겁니다.

참고로 신규 프로젝트 경로를 지정하고, 자유롭게 프로젝트 경로를 변경할 수 있습니다. (어떤 옵션을 선택해도 처음 프로젝트 생성을 하는 단계에서는 크게 중요하지 않습니다.)

create_project_step_2

위 단계에서 "New Directory"를 선택하면 아래와 같은 창이 추가로 출력됩니다. 새로운 프로젝트를 생성할 것이기 때문에 "New Project"를 선택합니다.

create_project_step_3

신규 프로젝트명을 지정합니다. 앞서 설명한 것처럼 프로젝트 상위 폴더를 변경할 수 있습니다. 그대로 두면 처음 설치 시, 지정된 프로젝트 상위 폴더로 세팅됩니다. 신규 프로젝트명을 지정하고, "Create Project" 버튼을 눌러 프로젝트 생성을 완료합니다.

create_project_step_4

프로젝트가 생성되면 아래와 같은 창이 출력됩니다. 아래 위치에서 지정한 프로젝트명이 정상적으로 생성되었는지를 확인할 수 있습니다. 우측 하단 창의 "Files" 탭(tab)에서 해당 내용을 확인할 수 있습니다.

create_project_step_5

신규로 생성된 프로젝트 명 상위 경로를 선택하면 프로젝트 상위 폴더로 이동을 할 수 있습니다.

create_project_step_6

생성한 프로젝트 리스트가 폴더 형태로 구성되어 있는 것을 확인할 수 있습니다. 각 프로젝트 폴더 내에 프로젝트에서 사용할 데이터 파일(예: SPSS, SAS, Excel) 들이 포함되어야 합니다. 여기서의 데이터 파일이란 위에서 설명한 값들의 묶음으로서의 데이터를 포함하고 있는 파일을 의미합니다. (중요)

create_project_step_7

2. R studio/RStudio 기본 사용 설명

R studio/RStuio를 처음 실행하면 Source 창이 최소화되어 있는 것을 볼 수 있습니다. 아래의 Source 창 확대 아이콘을 선택하여 Source 창의 크기를 조절합니다.

RStudio_windows_explanation_1

Source 창을 키우고 나면 아래와 같이 4분할된 화면을 볼 수 있습니다.

1번. 소스(Source) 코드 창

R을 사용하면서 가장 많이 사용하게 되는 창이 될 것입니다. 이 창에 "값을 더하라.", "값을 불러와라.", "그래프를 그려라." 등등의 각종 명령을 실행하기 위한 소스코드를 입력합니다.

2번. 결과 확인 창

1번 창에서 입력한 소스 코드들이 실행된 결과가 출력되는 창입니다. 해당 창에는 "Console", "Terminal", "Jobs"등의 세부 탭(tab)들이 구성되는데, 대부분의 실행 결과는 "Console" 탭을 통해서 확인하게 됩니다.

3번. 환경 확인 창

1번 창에서 데이터를 불러오거나, 복사 등을 하게 되면 해당 창에서 데이터 항목 등을 확인할 수 있습니다. "Environment"탭에서 대부분 확인합니다.

4번. 파일 및 그래프 확인 창

프로젝트 생성 경로, 프로젝트에 포함된 데이터 파일 확인, 그래프가 출력되는 창입니다. "Files", "Plots" 탭이 가장 많이 사용됩니다. 1번 창에서 그래프를 그리라는 명령을 실행하면, 4번 창의 "Plots" 탭에 그래프가 출력됩니다.

RStudio_windows_explanation_2

각 세부 탭(tab)에 대한 참고 화면입니다. 탭은 선택하여 항목을 변경할 수 있습니다.

RStudio_windows_explanation_3

다음 포스팅에서는 R 소스를 작성하고, 실행하기 전에 필요한 패키지 설치 및 소스 실행 방법, 분석 데이터 준비 등을 예제를 통해서 설명해 보겠습니다.

댓글

인기 게시글

[오류해결] KMS 인증(Activation) 오류(error) 0xC004F017 문제 원인 및 해결 방법

[오류해결] 카카오톡 PC 버전 접속 오류(일시적인 장애이거나 네트워크 문제일 수 있습니다. 잠시 후 다시 이용해 주세요. 오류코드 70101, 11002, LL)와 다음(daum.net), 티스토리(tistory.com) 접속 오류(오류코드 DNS_PROBE_FINISHED_NXDOMAIN) 문제