데이터 시각화

  1. 데이터 시각화의 개념과 배경을 이해
  2. 데이터의 숨은 의미를 발견하여 의사결정에 도움
  3. 데이터를 바탕으로 효율적인 소통 도모
  4. R에 의한 시각화 구현

최적의 그래프 선택

TED: The beauty of data visualization

시각화의 목표 : 통계적 정보를 효과적인 그림으로…

  • 데이터 : 가공되지 않은 원재료
  • 정보 : 데이터로부터 추출되는 가치 있는 것
  • 시각화 : 정보의 인지
  • 개체의 수집 범위와 방법, 그리고 개체 수의 파악
  • 변수의 측정(기록), 그리고 수준(명목형, 순서형, 수치형)
  • 예: 병원 A의 내원환자들에 대한 지료 기록(수집범위, 방법), 000명(개체 수), 성별(명목형), 나이대(순서형), 질병의 지속일(수치형)
  • 무엇을 알고 싶은가
  • 이 데이터가 답해 줄 수 있는가
  • 배경지식의 습득
  • 예: 질병의 지속이은 대체로 어느 정도인가? 성별로 차이가 있는가?
  • 어떤 그래프가 좋을까?
  • 오픈소스의 데이터분석 도구, 시각화에 강점
  • 핵심적 의미를 일반인에 전달
  1. 데이터 시각화 : 데이터에 내재된 통계적 정보를 그림의 형태로 드러내는 것
  2. R : 오픈소스의 통계계산 소프트웨어로서 시각화에 강점이 있음
  3. (R, G, B) 컬러 : 'red', 'green', 'blue' 의 조합으로 모든 컬러가 표현됨
  4. 점, 선, 사각형(다각형) : 그래프의 기본 요소
  • 오픈소스, 사용자의 자발적 기여
  • 개별적 needs에 맞추는 변형과 창작이 가능
  • 그래프가 멋짐, R 그래픽스 팩키지를 활용
    • lattice
    • ggplot2
    • rgl
    • RColorBrewer
  • R Gui의 Packages 메뉴에서 Install package(s)
    • CRAN mirror를 선택
    • R 팩키지를 선택

R 스크립트

snippet.r
kings <- read.table("chosun kings.txt", header=T)
str(kings)
...
  • 시각황: 데이터에 담긴 통계적 정보를 그림의 형태로 드러내는 것
  • 데이터 시각화의 과정
    • 데이터의 이해 → 목표 설정 → 그래프 선정 → 그래프 구현 → 스토리텔링
  • R은 오픈소스의 통계 소프트웨어, 시각화에 강점
  • R의 컬러체계: (R, G, B) 시스템, 2자리의 헥사코드
  • 스토리텔링은 그림의 핵심적 의미를 일반인에게 전달하는 커뮤니케이션

파이 차트

snippet.r
pie(rep(1,12), col=rainbow(12), border="white", clockwise=TRUE, labels="")
par(new=T)
pie(rep(1,1), col="white", radius=0.5, border="white", labels="")
  1. 태블로(Tableau)
  2. 마이크로소프트 파워BI
  3. 클릭뷰
  4. 구글 데이터 스튜디오
  5. 시센스(Sisense)
  1. 데이터 조직화
    - 사용자가 관련 데이터를 파악하는 과정으로 복잡하게 혼란스러운 상태의 데이터를 분류해 배열하는 등 정리하고 조직화하는 과정입니다.
  2. 정보 시각화
    - 사용자가 정보를 알고 깨닫는 데 참여하는 단계로 효율적인 정보 전달을 위해 시각적 방법을 제시하는 과정입니다.
  3. 상호작용 단계
    - 사용자와 정보가 서로 교류하는 상호작용 측면에서 사용자 경험을 디자인하는 과정입니다. 1~2 단계의 정보 인지 부분을 모두 활용합니다. 또한, 정보 시각화 단계와 밀접하게 연동되고 입력하는 기술의 특성도 동시에 함께 고려되는 단계입니다.

  • open/데이터-시각화.txt
  • 마지막으로 수정됨: 2020/06/02 09:25
  • 저자 127.0.0.1