데이터 베이스/SQL 첫걸음(인프런 강의)

Ch01. 데이터 베이스 소개 - 데이터와 정보

webmaster 2025. 9. 21. 23:17
728x90

데이터와 정보

어떤 개념을 학습할 개념의 핵심 단어를 먼저 이해하는 것이 중요하다. 데이터베이스(Database) 제대로 이해하려면, 먼저 이름의 주인공인 데이터(Data)라는 개념과 친해져야 한다.

데이터는 언뜻 쉬워 보이지만, 정보(Information)라는 단어와 비교할 의미가 비로소 명확해진다.

 

데이터와 정보, 무엇이 다른가?

이제 시작한 우리 쇼핑몰이 제법 인기를 얻어 정신없이 바쁘다고 상상해보자. 고객 주문이 쏟아지고, 상품이 팔려나

가며, 새로운 회원들이 계속 가입한다. 과정에서 수많은 기록, 데이터 쌓인다. 하지만 기록들을 그냥 쌓아두기만 한다면, 우리 쇼핑몰이 성장하고 있는지, 어떤 상품이 가장 인기가 많은지, 누가 우리의 VIP 고객인지 있을까? 아마 어려울 것이다. 이것이 바로 데이터를 정보 만드는 과정이 필요한 이유다.

 

1) 데이터(Data) - 의미 없는 기록 조각 만들기

데이터(Data)**, 아직 가공되지 않은 개별적인 사실이나 자체를 의미한다. 문맥(Context) 없어서 자체만으로는 온전한 의미를 갖기 어려운, 그대로 '날것(Raw)' 기록 조각이다.

 

2) 구조화된 데이터(Structured Data) - 의미를 담은 재료

구조화된 데이터

현실에서 데이터는 이전처럼 완전히 흩어져 있기보다는, 수집 단계부터 최소한의 구조를 가지고 정리된다. , 데이터 조각에 '꼬리표(Label)' 붙여주는 단계다. 이는 정보라는 '요리' 만들기 위해 재료를 손질해서 잘 정리해 두는과정과 같다.

하지만 표는 여전히 '기록의 목록'일 뿐이다. 자체만으로는 "어떤 상품이 가장 인기가 많지?" 와 같은 질문에 바로 답해주지 않는다. , 의미 생겼지만 의사결정에 필요한 통찰(Insight) 아직 없다.

 

3) 정보(Information) - 목적을 가진 결과물

정보(Information) 이렇게 구조화된 데이터를 특정한 질문이나 목적을 가지고 분석하고 가공해서 얻어낸 유의미한 결과물이다. 데이터라는 '재료' 가지고 질문에 대한 답을 찾아낸 '완성된 요리' 셈이다.

 

쇼핑몰 대표님이 우리에게 이렇게 질문했다고 가정해보자. "2025 5 30일에 가장 많이 팔린 상품은 무엇이고, 개나 팔렸는가?"

질문에 답하기 위해, 우리는 1.5단계의 '구조화된 데이터' 다음과 같이 가공한다.

  • 필터링(Filtering): '주문일자'가 '2025-05-30'인 데이터만 골라낸다.
    • 주문 1003, 1004, 1005 해당된다.
  • 그룹화 집계(Grouping & Aggregation): 골라낸 데이터를 '상품명'으로 묶고, '수량' 합산한다.
    • 티셔츠: 1 (1003) + 3 (1005) = 4
    • 운동화: 1 (1004)

그래서, 이게 중요한가?

우리 쇼핑몰이 성공하려면 위와 같은 정보를 바탕으로 똑똑한 결정을 내려야 한다.

  • 어떤 상품이 잘 팔리는지 (정보) 알아야 재고 관리를 효율적으로 할 수 있다 (의사결정).
  • 누가 우리의 VIP 고객인지 (정보) 알아야 맞춤형 마케팅을 제공할 수 있다 (의사결정).
  • 날짜별 매출 추이가 어떤지 (정보) 알아야 새로운 프로모션을 기획할 있다 (의사결정).

모든 것은 흩어져 있는 데이터 의미 있는 정보 만들 비로소 가능해진다그리고 우리가 앞으로 배울 데이터베이스 바로 데이터를 체계적으로 저장하고(1.5단계), 우리가 원하는 조건으로 쉽고 빠르게 찾아내고 가공해서(2단계) 정보로 만들 있도록 도와주는 가장 강력한 핵심 도구다.

 

베이스(base): "기반, 토대, 기지"라는 의미로, 여기서는 데이터가 체계적으로 저장되고 관리되는 "저장소" 또는 "기반 시설" 나타낸다. 마치 군사 기지가 군사 활동의 거점이 되듯이, 데이터베이스는 데이터 관리의 중심 거점 역할을 한다.
정리하면 데이터베이스는 "데이터를 체계적으로 모아 놓은 핵심 저장소"라는 뜻이다.
728x90