Skip links

어떤 상황에서 어떤 차트를 사용해야하는걸까 ?

안녕하세요 연구소 데이터분석팀 엄태영PM 입니다.

데이터 시각화 란, 복잡한 데이터를 시각적으로 쉽고 명확하게 표현하는 과정입니다.
간혹 우리는 실제로 주간 및 월간 리포트를 만들면서 시각화 작업을 시작할 때, 
어떤 정보를 전달해야 하며 어떻게 효과적으로 시각화해야 할지 막막할 때가 많이 있습니다.

이 글에서는 데이터 시각화의 주요 목적들을 여섯 가지로 나누고, 각 목적에 맞는 다양한 시각화 유형들을 정리했습니다.
차트 비교에서부터 흐름에 이르기까지, 각 시각화 목적에 따른 차트 사용법에 대해 자세히 살펴보도록 하겠습니다.

여러분들이 리포트를 제작할 떄 도움이 되었으면 좋겠습니다.

1

1. 비교  Comparison

데이터 포인트들 간의 차이점이나 유사점을 보여주고 싶을 때 사용합니다. 

데이터의 어떤 부분을 비교하고 싶은지에 따라 아래의 차트 유형을 선택하여 사용할 수 있습니다.

2

바 차트(Bar chart)는 다른 그룹들 간의 수치를 비교할 때 사용합니다. 
예를 들어, 다양한 브랜드의 자동차 판매량을 비교할 때 각 브랜드를 막대로 표현하여 수치 비교를 용이하게 합니다.

선 차트(Line chart)는 시간에 따른 데이터의 변화를 비교할 때 적합합니다.
지난 몇 년 동안 여러 기업의 주가 상승률을 비교할 때 사용할 수 있습니다.

레이더 차트(Radar chart)는 다차원 데이터를 비교하는 데 유용합니다.
국제축구연맹(Fédération Internationale de Football Association, FIFA)에서 제공하는 레이더 차트에서 볼 수 있듯이 선수들의 경기 능력(속도, 힘, 기술 등)을 한눈에 비교할 때 사용됩니다.
*게임에서도 많이 활용됩니다.

2. 추세  Trend

데이터의 시간에 따른 변화를 보여줄 때 사용합니다. 

데이터의 형태나 내용에 따라 적합한 차트를 선택할 수 있습니다.

3

바 차트(Bar chart)는 불연속적인 데이터 포인트가 시간의 흐름에 따라 변하는 모습을 보여주기 위해 사용됩니다. 기업의 분기별 매출을 나타낼 때 사용할 수 있습니다.

선 차트(Line chart)는 시간의 흐름에 따른 연속적인 데이터의 추세를 나타낼 때 사용합니다. 예컨대, 웹사이트의 일일 방문자 수를 선차트로 나타내어 방문자 수의 증감 추세를 파악할 수 있습니다.

면적 차트(Area chart)는 선 차트와 비슷하지만, 선 아래의 면적이 채워져 있어 총량의 변화를 보여줍니다. 예를 들어, 연도별 강수량의 변화를 시각화할 때 유용합니다.

3. 구성  Composition

전체에서 각 부분이 어떤 비중을 차지하는지 보여주는 차트입니다. 

각 구성하는 비율은 아래와 같이 다양한 형태로 시각화될 수 있습니다.

4

파이 차트(Pie chart)는 전체 중 부분이 차지하는 비율을 파이의 각도로 표현합니다. 
시장 점유율을 나타낼 때 각 경쟁사의 점유율을 파이 조각으로 보여줄 수 있습니다.

누적 바 차트(Stacked bar chart)는 총합을 구성하는 각 부분의 비율을 바(Bar)의 길이로 보여줍니다. 전체 매출 중 각 제품 카테고리가 차지하는 비율을 비교할 때 유용합니다.

트리맵(Treemap)은 전체 중 부분이 차지하는 비율을 사각형의 면적으로 나타낼 때 사용합니다. 예를 들어, 웹사이트의 트래픽을 다양한 소스별로 구분하여 보여줄 때 사용할 수 있습니다.

4. 분포  Distribution

데이터가 어떤 범위 내에서 어떻게 분포하는지를 보여주기 위한 시각화입니다. 

데이터가 집중되어 있는 부분, 흩어져 있는 부분, 이상치 등을 식별할 수 있도록 돕습니다.

5

히스토그램(Histogram)은 연속적인 데이터의 전체 범위를 일정한 크기의 구간으로 나누어, 각 구간별 빈도수를 나타낼 때 사용합니다. 예를 들어, 시험 점수의 분포를 보여줄 때 이용할 수 있습니다.

박스 플롯(Box plot)은 최소값, 최대값, 중앙값과 사분위수를 나타내어 데이터의 분포를 한눈에 파악할 수 있습니다. 주식 시장에서는 가격 변동성, 중간값, 이상치 등을 파악하는 것이 중요한데, 박스 플롯은 이러한 정보를 간결하고 명확하게 전달합니다.

산점도(Scatter plot)는 두 변수 간의 데이터 분포를 나타내는 데 효과적입니다. 다양한 연령대 사람들의 소득 수준을 산점도로 표현하여 특정 연령대에서의 평균 소득 수준이나 소득의 분포 범위를 확인할 수 있습니다.

5. 상관관계  Relationship

두 개 이상의 변수 간의 상관관계나 연결성을 파악하기 위한 것입니다. 

이는 변수들 사이의 상호 작용을 이해하고, 원인과 결과, 상관성 등을 분석하는 데 적합합니다.

6

산점도(Scatter plot)는 두 변수 간의 상관관계를 나타낼 때 적합합니다. 예를 들어, 산점도를 통해 교육 수준이 높아짐에 따라 소득이 증가하는 경향이 있는지 확인할 수 있습니다.

히트맵(Heatmap)은 일반적으로 격자 형태로 구성되며, 각 셀의 색상 강도를 통해 두 변수 간의 상관관계를 보여줍니다. 웹사이트의 특정 페이지에서 사용자들이 어디를 가장 많이 클릭하는지 시각화하는 데 사용될 수 있습니다

네트워크(Network)는 개체 간의 관계나 연결망을 시각화합니다. 점들이 개체를 나타내고, 선들이 연결 관계를 표현합니다. 예를 들어, 페이스북에서 사용자들이 어떻게 서로 연결되어 있는지, 누가 중심 역할을 하는지를 분석하고 시각화하는 데 활용할 수 있습니다.

6. 흐름  Flow

데이터가 시간이나 공간을 통해 어떻게 이동하고 변화하는지를 보여주기 위한 시각화입니다. 

어떤 정보에 초점을 맞추느냐에 따라 아래의 차트 유형을 선택하여 사용할 수 있습니다.

7

네트워크(Network)는 개체와 연결선으로 구성됩니다. 연결선은 흐름의 방향을 나타낼 수 있습니다. 예를 들어, 감염자 간의 상호작용 및 전염병 전파 경로를 시각화하는 데 사용될 수 있습니다.

생키 다이어그램(Sankey diagram)은 양의 흐름과 그 크기를 나타낼 때 사용합니다. 이 다이어그램은 출발점으로부터 여러 목적지로 흘러가는 흐름을 보여주며, 특히 에너지, 자재, 비용 등의 흐름을 나타내는 데 적합합니다.

스트림 그래프(Stream graph)는 시간에 따른 다양한 데이터의 흐름을 연속적으로 나타낼 때 적합합니다. 예를 들어, 음악 스트리밍 서비스에서 시간대별 장르별 스트리밍 양을 보여줄 때 사용할 수 있습니다.

이 글에서는 데이터 시각화의 대표적인 목적들을 살펴보고, 그에 맞는 다양한 차트 유형들을 알아보았습니다. 시각화를 통해 정보를 효과적으로 전달하기 위해서는 무엇을 전달하고자 하는지, 즉 목적을 명확히 파악하고 이에 적합한 차트 유형을 선택하는 것이 핵심입니다.
 
각 차트 유형은 데이터로부터 특정 종류의 인사이트를 전달하는 데 각각 다른 장점이 있습니다. 예를 들어, 산점도는 두 변수 사이의 관계를 분석하는 데 적합하고, 바 차트는 서로 다른 카테고리들을 비교하는데 매우 효과적입니다. 


따라서, 각 차트의 고유한 특성과 장점을 이해하고 적절히 활용하는 것이 중요합니다.


오늘의 글은 여기까지입니다. 감사합니다.

View
Drag