# 데이터 시각화 {{tag>데이터 시각화 R visualization data}} ## 데이터 시각화란 무엇인가 1. 데이터 시각화의 개념과 배경을 이해 2. 데이터의 숨은 의미를 발견하여 의사결정에 도움 3. 데이터를 바탕으로 효율적인 소통 도모 4. R에 의한 시각화 구현 최적의 그래프 선택 TED: The beauty of data visualization ## 시각화는 왜? 시각화의 목표 : 통계적 정보를 효과적인 그림으로... - 데이터 : 가공되지 않은 원재료 - 정보 : 데이터로부터 추출되는 가치 있는 것 - 시각화 : 정보의 인지 ## 시각화는 어떻게 ### 1단계: 데이터의 이해 - 개체의 수집 범위와 방법, 그리고 개체 수의 파악 - 변수의 측정(기록), 그리고 수준(명목형, 순서형, 수치형) - 예: 병원 A의 내원환자들에 대한 지료 기록(수집범위, 방법), 000명(개체 수), 성별(명목형), 나이대(순서형), 질병의 지속일(수치형) ### 2단계: 목표 설정 - 무엇을 알고 싶은가 - 이 데이터가 답해 줄 수 있는가 - 배경지식의 습득 - 예: 질병의 지속이은 대체로 어느 정도인가? 성별로 차이가 있는가? ### 3단계: 그래프 선정 - 어떤 그래프가 좋을까? ### 4단계: 소프트웨어의 활용 R - 오픈소스의 데이터분석 도구, 시각화에 강점 ### 5단계: 스토리텔링 - 핵심적 의미를 일반인에 전달 ## 용어 1. 데이터 시각화 : 데이터에 내재된 통계적 정보를 그림의 형태로 드러내는 것 2. R : 오픈소스의 통계계산 소프트웨어로서 시각화에 강점이 있음 3. (R, G, B) 컬러 : 'red', 'green', 'blue' 의 조합으로 모든 컬러가 표현됨 4. 점, 선, 사각형(다각형) : 그래프의 기본 요소 ## 시각화 도구 R ### R 이란 - 오픈소스, 사용자의 자발적 기여 - 개별적 needs에 맞추는 변형과 창작이 가능 - 그래프가 멋짐, R 그래픽스 팩키지를 활용 - lattice - ggplot2 - rgl - RColorBrewer ### R 스크립트의 실행 ### R 팩키지의 설치 - R Gui의 Packages 메뉴에서 Install package(s) - CRAN mirror를 선택 - R 팩키지를 선택 ## R 시각화 사례 ### 조선의 임금님들은 몇 년이나 재위하였나 R 스크립트 ```r kings <- read.table("chosun kings.txt", header=T) str(kings) ... ``` ## R의 컬러 체계 ### RGB 시스템 ### Chart of R Colors http://research.stowers-institute.org/efg/R/Color/Chart/ ## 정리 - 시각황: 데이터에 담긴 통계적 정보를 그림의 형태로 드러내는 것 - 데이터 시각화의 과정 - 데이터의 이해 → 목표 설정 → 그래프 선정 → 그래프 구현 → 스토리텔링 - R은 오픈소스의 통계 소프트웨어, 시각화에 강점 - R의 컬러체계: (R, G, B) 시스템, 2자리의 헥사코드 - 스토리텔링은 그림의 핵심적 의미를 일반인에게 전달하는 커뮤니케이션 파이 차트 ```r pie(rep(1,12), col=rainbow(12), border="white", clockwise=TRUE, labels="") par(new=T) pie(rep(1,1), col="white", radius=0.5, border="white", labels="") ``` ## 데이터 시각화 도구 1. 태블로(Tableau) 2. 마이크로소프트 파워BI 3. 클릭뷰 4. 구글 데이터 스튜디오 5. 시센스(Sisense) ## 데이터 시각화 단계 1. 데이터 조직화 - 사용자가 관련 데이터를 파악하는 과정으로 복잡하게 혼란스러운 상태의 데이터를 분류해 배열하는 등 정리하고 조직화하는 과정입니다. 2. 정보 시각화 - 사용자가 정보를 알고 깨닫는 데 참여하는 단계로 효율적인 정보 전달을 위해 시각적 방법을 제시하는 과정입니다. 3. 상호작용 단계 - 사용자와 정보가 서로 교류하는 상호작용 측면에서 사용자 경험을 디자인하는 과정입니다. 1~2 단계의 정보 인지 부분을 모두 활용합니다. 또한, 정보 시각화 단계와 밀접하게 연동되고 입력하는 기술의 특성도 동시에 함께 고려되는 단계입니다.