DATOR


시각화 패턴 탐색을 위한 시각화

시각화는

정보를 명확하고 효과적으로 전달하기 위해서

이해하기 쉽게 그래픽을 이용하여 시각적으로 표현하고 전달

 

 

 

 

(1) 시각화의 종류

크게 분석전 시각화와 분석 후에 하는 분석 후 시각화

 

(2) 분석전 시각화의 목적

- 시각화 하는 함수들을 실행하고 패턴을 탐색하기 위한 시각화

- 많은 정보를 직관적으로 표현 

- 분석전의 도표는 데이터 전체를 직관적으로 파악에 목적

 

(3) 분석결과 시각화는

- 분석 후에 도표는 분석결과를 직관적으로 요점을 전달에 목적

 

본단계에서는 분석전 시각화의 단계로, 학습을 시각화 함수 기본기술(함수)시각화 도표 이해 및 패턴 찾기로 구분하여 학습


시각화이해1001.jpg

위에 상세설명한 과정 중

기본 기술 함수 중  심볼 모양에 대해 아래에서 설명한다.


pch 심볼 모양 

  
점 모양은 plot 함수의 pch 옵션을 통해 변경이 가능
점 모양(symbol)은 Windows 환경에서 256(0 ~ 255)가 가능
pch=0
점 모양 바로 아래 pch 번호가 적혀있다
아무런 모양지정을 안해주는 경우 pch 의 기본값은 
번호 26에서 31까지는 아직 할당 기호가 없는 빈공란임을 유의
번호 33에서 127까지는 ASCII 문자기호이고그 이후는 Windows 문자기호 
16번째 기호와 19번째 기호는 테두리가 없는 것과 있는 것의 차이
 
❶ 빈 도표 생성
  
-축에대한 설정 *xaxt, yaxt
xaxt="n", yaxt="n"
A character which specifies the x axis type.
Specifying "n" 축의 플로팅을 금지
  
-축의 이름
xlab="",ylab="" x축의 이름 y축의 이름 아무것도 입력하지 않는
  
-축의 범위
xlim x축의 범위
ylim y축의 범위
  
내부 점찍기
type="n"은 내부에 점을 하나도 찍지 않는
  
>par(mfrow=c(1,1))
>plot(0:10,0:10,xlim=c(0,64),ylim=c(0,105), type="n",xaxt="n",yaxt="n",xlab="",ylab="")

❷ 점찍고 문자 추가
# plotting symbols, pch
#seq(from, to, by)의 형태로 시작값과 마지막 값단위값의 형태로 
#seq(1,31,2) 1부터 31까지 2간격씩 데이터 추출
#rep(x, times,length.out, each)
#rep(4,16) 4값을 16번 반복
  
>x <- seq(1,64,4); y <- rep(10,16)
  
  
# x 데이터셋에 있는 값에 위치에 점이 찍음
# (x,y) ==> (1,4) (3,4) ( 5,4)
>points(x,y,pch=0:15, cex=1.2)
  
# y축의 위치에서 아래 위치에 문자 추가
결과적으로 (1,5) (3,5) (5,5)........... 위치에 점을 찍음

> text(x,y-5,paste("점모양",as.character(0:15)),cex=0.6)


pch.gif








 패턴을 찾기위한 탐색적 시각화  학습 목록


내용

시각화

함수

(기본 기술)

주도표함수와 보조도표함수

도표의 색 설정

도표모양과 배치

축설정

도표 저장 및 생성 조회

시각화 

도표 이해

 

 

패턴 찾기

도수분포표,

히스토그램(Histograms)

밀도그림(Density plot)

박스 플롯(Boxplots)

데이터 집중화 정도

데이터 흡어짐 정도

비대칭도

산점도

케이스가 많은 데이터

Pie

막대그래프

연속형 속성이 많은 데이터

명목형 속성이 많은 데이터

지도 Mapping

비정형데이터

시각화

단어클라우드

동적차트



(1) 시각화 함수의 사용(기본 기술)


(가)  시각화 함수: 주도표함수와 보조도표함수(제목 클릭하세요)



제목

기본 도표 함수와 보조 도표함수 이해

http://playdata.io/bigdatavisualization

강의 시간에 학습

강좌명 : 플레이데이터 "빅데이터 분석 및 시각화 전문가 양성과정"


메일 제목과 소제목(클릭)

심볼의 모양 설정하기

현재글

심볼의 컬러 설정

 

글씨의 위치

 

여백

심볼, 그리스 문자, 수학공식 표시

점을 덧그리기

선 덧그리기

곡선 그리기

주어진 절편과 기울기에 따라 직선 그리기

화살표를 덧그리기

여러 선을 동시에 그리기

격자 덧그리기

심볼의 모양

범례 추가

http://playdata.io/bigdatavisualization

강의 시간에 학습

강좌명 플레이데이터 "빅데이터 분석 및 시각화 전문가 양성과정

붓꽃 종의 특성 측정데이터의 시각화 보고서

마우스 커서를 이용하여 그리기

 다각형 함수(polygon)따라하기: 정규분포에 표준편차 범위 표시하기

자동차 스피드와 제동거리 데이터에 추정선과 신뢰구간 표시하기

http://playdata.io/bigdatavisualization

강의 시간에 학습

강좌명 플레이데이터 "빅데이터 분석 및 시각화 전문가 양성과정

관련 warning 해결

http://playdata.io/bigdatavisualization

강의 시간에 학습

강좌명 플레이데이터 "빅데이터 분석 및 시각화 전문가 양성과정




(나) 도표 색 설정하고 관리하기


제목

URL

도표 설정 옵션 조회 및 설정

http://cafe.naver.com/dataan/87

사용가능 색상과 색 설정하기

http://cafe.naver.com/dataan/88

RGB 16진법을 사용한 3D 그림 그리기

http://cafe.naver.com/dataan/89

rgb()함수를 사용한 색의 표현

http://cafe.naver.com/dataan/90

RGB로 색 지정

http://cafe.naver.com/dataan/91

색의 짙기 조정하기

http://cafe.naver.com/dataan/92

투명한 색 만들기

 

색 계열별 사용가능 색의 개수 보기

http://cafe.naver.com/dataan/94

palette()가 제공하는 색

http://cafe.naver.com/dataan/95

그린 게열의 제공되는 색

http://cafe.naver.com/dataan/96

회색 계열의 제공되는 색

http://cafe.naver.com/dataan/97

붉은 색 계열의 제공되는 색

http://playdata.io/bigdatavisualization

강의 시간에 학습

강좌명 : 플레이데이터 "빅데이터 분석 및 시각화 전문가 양성과정"

terrain.color 계열의 제공 색

http://playdata.io/bigdatavisualization

강의 시간에 학습

강좌명 : 플레이데이터 "빅데이터 분석 및 시각화 전문가 양성과정"

색 기본값으로 복원하기

http://playdata.io/bigdatavisualization

강의 시간에 학습

강좌명 : 플레이데이터 "빅데이터 분석 및 시각화 전문가 양성과정"

이름이 지정된 색

http://playdata.io/bigdatavisualization

강의 시간에 학습

강좌명 : 플레이데이터 "빅데이터 분석 및 시각화 전문가 양성과정"

rainbow 색계열로 표현한 side by side 바차트

http://playdata.io/bigdatavisualization

강의 시간에 학습

강좌명 : 플레이데이터 "빅데이터 분석 및 시각화 전문가 양성과정"

닭모이 종류별 색으로구분한 산점도

http://playdata.io/bigdatavisualization

강의 시간에 학습

강좌명 : 플레이데이터 "빅데이터 분석 및 시각화 전문가 양성과정"


(다) 도표 모양과 배치 설정하고 관리하기

제목

URL

그림 영역의 모양

http://cafe.naver.com/dataan/81

화면에서 도표의 위치, 여백 조정

http://cafe.naver.com/dataan/82

한 화면에 여러 도표 배치하기

http://cafe.naver.com/dataan/83

그림 겹쳐 그리기

http://cafe.naver.com/dataan/84

도표 배열 : 행의 개수와 열의개수가 다르게 설정하기

http://cafe.naver.com/dataan/85

 

도표 배열서 한칸의 배치 건너 뛰고 그림그리기

http://cafe.naver.com/dataan/86


(라) 도표 저장 및 도표 생성 관리

제목

URL

1,도표 파일로 저장하기

http://cafe.naver.com/dataan/104

2.pdf로 도표저장하기

http://cafe.naver.com/dataan/105

3.여러 도표를 pdf로 저장하기

http://cafe.naver.com/dataan/106

4.도표를 ps 파일로 저장하기

http://cafe.naver.com/dataan/107

 

5도표 작업를 위한 기타 사항

http://cafe.naver.com/dataan/108


(2) 시각화 도표의 이해와 패턴 찾기


(가) 도수분포표,히스토그램, 밀도그림

제목

URL

 

도수분포표와 히스토그램 이해

http://cafe.naver.com/dataan/109

 

도수분포표 작성하기

http://cafe.naver.com/dataan/110

히스토그램 작성하기

http://cafe.naver.com/dataan/111

과소평활과 과대평활

http://cafe.naver.com/dataan/112

 

계급구간의 설정

http://cafe.naver.com/dataan/113

화산분화데이터에서 구간과 빈도

http://cafe.naver.com/dataan/114

차의 스피드와 제동거리 데이터에서 히스토그램 사용함수의 선택

http://cafe.naver.com/dataan/115

그룹별 히스토그램 그리기 : 붓꽃의 종류별 히스토그램

http://cafe.naver.com/dataan/116

커널 밀도 추정(밀도 그림)

http://cafe.naver.com/dataan/117

화산 분화 데이터에서 밀도와 히스토드램 하나의 도표로 그리기, ggplot 패키지사용

http://cafe.naver.com/dataan/118

붓꽃의 종류 데이터에서 밀도와 히스토그림 하나의 도표로 그리기, hist()density()함수 사용

http://cafe.naver.com/dataan/119

붓꽃의 종류 데이터에서 밀도 및 히스토그림에서 실데이터의 위치 표시하기

http://playdata.io/bigdatavisualization

강의 시간에 학습

강좌명 : 플레이데이터 "빅데이터 분석 및 시각화 전문가 양성과정"

남녀 그룹별로 색 다르게 설정하기

http://playdata.io/bigdatavisualization

강의 시간에 학습

강좌명 : 플레이데이터 "빅데이터 분석 및 시각화 전문가 양성과정"

히스토그램에 숫자 표시 및 설정 변경하기

http://playdata.io/bigdatavisualization

강의 시간에 학습

강좌명 : 플레이데이터 "빅데이터 분석 및 시각화 전문가 양성과정"

패턴 탐색 시각화 히스토그램 예제

- 어린이 교통사고 시간적 추세(패턴)

http://playdata.io/bigdatavisualization

강의 시간에 학습

강좌명 : 플레이데이터 "빅데이터 분석 및 시각화 전문가 양성과정"

패턴 탐색 시각화 히스토그램 예제2

- 어린이 교통사고 도로형태별 추세(패턴)

http://playdata.io/bigdatavisualization

강의 시간에 학습

강좌명 : 플레이데이터 "빅데이터 분석 및 시각화 전문가 양성과정"

관련 함수 정리 및 기타 유의사항

http://playdata.io/bigdatavisualization

강의 시간에 학습

강좌명 : 플레이데이터 "빅데이터 분석 및 시각화 전문가 양성과정"


(나) 박스 플롯

제목

URL

박스 플롯 이해 및 정규 분포와 연관

옆에 제목 클릭하세요

박스플롯에 색표현하기

옆에 제목 클릭하세요.

수직 박스 플롯, 수평 박스 플롯 그리기

옆에 제목 클릭하세요.

박스플롯에 범례표시하기

옆에 제목 클릭하세요.

정규분포와 박스플롯 비교하기

옆에 제목 클릭하세요.

스프레이 종류별 퇴치한 벌의 수, 박스플롯

정규분포와 박스플롯 비교하기

옆에 제목 클릭하세요.

꽃받침 넒이에대한 박스플롯과 이상치 값 표시

옆에 제목 클릭하세요.

ggplot패키지 사용하여 박스플롯 그리기

옆에 제목 클릭하세요.

박스 플롯에 점 찍기(ggolot)

옆에 제목 클릭하세요.

겹쳐서 안보이는 점 나타내기

옆에 제목 클릭하세요.

기어의 수가 4개에서 5로 증가할 때 mpg가 감소한 것에 대한 원인 찾기, 박스플롯

옆에 제목 클릭하세요.

그룹별로 색으로 구분해서 박스플롯 그리기

http://cafe.naver.com/dataan/131

붓꽃의 종류별 꽃잎의 길이 분포 파악하기, 박스플롯

http://playdata.io/bigdatavisualization

강의 시간에 학습

강좌명 : 플레이데이터 "빅데이터 분석 및 시각화 전문가 양성과정"

박스플롯에 유의수준 추가하기

http://playdata.io/bigdatavisualization

강의 시간에 학습

강좌명 : 플레이데이터 "빅데이터 분석 및 시각화 전문가 양성과정"

지진이 관측된 관측소의 개수와 지진강도에 차이가 있는가?

http://playdata.io/bigdatavisualization

강의 시간에 학습

강좌명 : 플레이데이터 "빅데이터 분석 및 시각화 전문가 양성과정"

보이스 파트별 키의 분포

http://playdata.io/bigdatavisualization

강의 시간에 학습

강좌명 : 플레이데이터 "빅데이터 분석 및 시각화 전문가 양성과정"

어린이 하교 유형 및 이동 수단별 하교시간대 분포,

http://playdata.io/bigdatavisualization

강의 시간에 학습

강좌명 : 플레이데이터 "빅데이터 분석 및 시각화 전문가 양성과정"

박스 플롯 명목형속성2, 연속형 속성1개 일때 그리기

http://playdata.io/bigdatavisualization

강의 시간에 학습

강좌명 : 플레이데이터 "빅데이터 분석 및 시각화 전문가 양성과정"

박스 플롯, 이상치 판정하기

http://playdata.io/bigdatavisualization

강의 시간에 학습

강좌명 : 플레이데이터 "빅데이터 분석 및 시각화 전문가 양성과정"

박스 플롯 함수 정리

http://playdata.io/bigdatavisualization

강의 시간에 학습

강좌명 : 플레이데이터 "빅데이터 분석 및 시각화 전문가 양성과정"



(다) 데이터 집중화 정도(제목 클릭하세요)

제목

기술 통계의 이해

집중화 경향의 이해(Central tendency)

산술평균(Arithmatic mean)이해

중위수(Mediam)

연비, 배기량, 후방차축 비율,무게 및 402미터기록 속성의 평균과 중위수 비교하고 해석하기

최빈수

종을 분류하기에 기준으로 사용할 꽃의 속성 찾기

기하평균

조화평균

범위중앙치


* 관련 자격증

자격증

관련 과목

ADsP

데이터 이해 과목 및 데이터 기획 과목, R에 대한 출제 문제

기술사

정보관리 기술사에 디지털 서비스, 빅데이터 시각화 문제

사회조사분석사

사회 통계 과목



*  "빅데이터 분석 및 시각화" 교육과정(http://playdata.io/bigdatavisualization)에서 뵙겠습니다.   한 희 선

Tag

Leave Comments