본문 바로가기
Computer Science(컴퓨터 과학)/빅데이터

빅데이터 다루기2 - 그래프 사용

by BioLearner 2024. 10. 23.
반응형

빅데이터 다루기1 - 통계

실제로 빅데이터를 어떻게 다룰까? 그 방법 중 하나는 데이터를 시각적으로 이해하기 쉽게 통계를 사용하는 것이다. 가장 잘 알려진 통계적 개념 중 하나인 '평균'도 빅데이터를 효과적으로 분

insight0591.tistory.com

 
이전 포스터에서는 빅데이터를 분석하는 다양한 방법을 다루었다. 수치 비교, 평균, 분산, 표준편차 등의 개념과 함께, 데이터를 시각적으로 표현하기 위한 여러 그래프에 대해 설명했다.
 
이번 포스터에서는 그 중 빅데이터 분석에 자주 사용되는 다양한 그래프에 대해 자세히 살펴보겠다.
 

1. 막대그래프(Bar Grape)

 
먼저 막대그래프를 살펴보자. 막대그래프는 여러 항목 간의 비교를 직관적으로 보여주는 강력한 도구이다. 예를 들어, 특정 인구 집단의 수를 단순히 나열하는 것보다, 다른 집단과의 차이를 한눈에 파악할 수 있어 더욱 효과적이다.
 
이처럼 막대그래프는 데이터의 상대적 차이를 시각적으로 명확하게 보여준다.

2. 파이그래프(Pie Grape)

 
파이그래프는 항목별 비율이나 분포를 쉽게 파악할 수 있는 도구다. 수치로는 확인하기 어려운 비율 차이를 시각적으로 한눈에 이해할 수 있어, 예를 들어 특정 학과의 학생 수가 다른 학과와 비교해 얼마나 많은지 직관적으로 알 수 있다.
 
따라서 파이그래프는 데이터의 비율을 명확하게 보여주는 시각적 도구로 매우 유용하다.

3. 꺽은선 그래프(Line Grape)

 
이제 꺾은선 그래프를 살펴보자. 꺾은선 그래프는 시간에 따른 데이터의 변화와 추세를 시각적으로 보여주는 데 매우 효과적이다. 데이터를 선으로 연결하여 시간에 따른 변화 패턴을 한눈에 파악할 수 있다.
 
이처럼 꺾은선 그래프는 데이터의 시간적 변화를 시각적으로 이해하기 쉬운 강력한 도구다.
 

4. 산점도(Scatter Plot)

 
산점도는 두 변수 간의 관계를 시각적으로 보여주는 그래프다. 점들의 분포를 통해 변수 간의 상관관계를 파악할 수 있다. 예를 들어, 방문객 수와 즉석식품 판매량의 관계를 산점도로 분석하면, 방문객이 많을수록 즉석식품 판매량이 감소하는 패턴을 확인할 수 있다.
 
이처럼 산점도는 데이터의 상관관계를 분석하는 데 유용하다.
 

5. 줄기-잎 그래프(Stem and Leaf Plot)

줄기-잎 그림은 우리나라 교육과정에서 어린 시절에 가장 먼저 접하는 그래프 중 하나다. 이 그래프는 데이터를 쉽게 이해할 수 있도록 돕는 시각적 도구로, 숫자를 직관적으로 보여준다.

비록 정확한 이유는 명확하지 않지만, 앞선 이유로 줄기-잎 그림의 특성이 그래프에 특성과 가장 적합하기에 교육용으로 쓰이는게 아닌가 싮다.


이러한 도구들은 빅데이터에서 자주 사용된다. 특히, 빅데이터에서 중요한 것은 데이터의 양과 복잡성을 효과적으로 처리하는 것이므로, 이러한 시각적 도구들을 통해 데이터의 이해와 분석을 보다 효율적으로 할 수 있다. 물론 이말고도 빅데이터에 사용되는 그래프들이 많다. 히트맵, 트리맵, 박스플롯, 버블 차트, 히스토그램, 산점도 행렬, 네트워크 그래프 등 여러가지가 있다. 앞서 소개한 그래프는 기초적인 그래프로 인지하면 좋겠다.
 
요약

  • 막대그래프 (Bar Graph): 여러 항목 간의 차이를 시각적으로 명확하게 보여주는 도구이다.
  • 파이그래프 (Pie Graph): 각 항목의 비율과 분포를 한눈에 파악할 수 있는 그래프이다.
  • 꺾은선 그래프 (Line Graph): 시간에 따른 데이터의 변화와 추세를 선으로 연결하여 시각화하는 도구이다.
  • 산점도 (Scatter Plot): 두 변수 간의 관계를 점들의 분포로 시각적으로 분석하는 그래프이다.
  • 줄기-잎 그래프 (Stem and Leaf Plot): 데이터를 직관적으로 이해하기 쉽게 돕는 교육용 시각적 도구이다.

 
 
 

반응형