데이터 베이스 기초
데이터 리터러시
DIKW 피라미드란?
DIWK 피라미드는 Data, Information, Knowledge, Wisdom로 구성되어 있습니다.
이는 데이터, 정보, 지식을 통해 지혜를 얻어내는 과정을 계층적 구조로 표현한 것이죠.
DIKW의 구성들을 하나씩 살펴보자면 아래와 같습니다.
- 데이터
- 개별 데이터 자체로는 의미가 중요치 않은 객관적인 사실
- 문자, 숫자 등의 단편적인 조합과 어떠한 사실로 구성
- Ex: 2022.12.20, 화, 30,000원, A상품
- 정보
- 데이터의 가공, 처리와 데이터 간 연속 관계 속에서 의미가 도출되는 것
- 분석을 통해 의미가 부여된 데이터
- Ex: 크리스마스 시즌에 A 상품의 수요가 증가한다.
- 지식
- 데이터를 통해 도출된 다양한 정보를 구조화해 유의미한 정보를 분류하고
개인적인 경험을 결합시켜 고유의 지식을 내재화하는 것 - 경험이 쌓인 데이터
- Ex: 크리스마스 시즌에는 A 상품의 재고를 늘려야 한다.
- 데이터를 통해 도출된 다양한 정보를 구조화해 유의미한 정보를 분류하고
- 지혜
- 지식의 축적과 아이디어가 결합된 창의적 산물
- 지식의 발전
- Ex: 각 시즌마다 연관된 상품과 서비스를 준비하면 수익이 늘어날 것이다.
데이터 리터러시(Literacy)의 의미와 하위 역량
데이터 리터러시란 "데이터를 활용해 문제를 해결할 수 있는 능력"을 의미합니다.
이 리터러시를 세분화해서 표현한 하위 역량들은 아래와 같습니다.
크게 분류한 4가지를 조금 더 깊게 살펴볼까요?
우선 4가지 역량의 바탕에는 "정확한 목적을 세우고 이를 이해하는 것"이 깔려 있어야 합니다.
(AI Project의 Workflow를 검색하면 가장 강조되는 부분이죠.)
그리고 데이터를 분석하고 시각화하기 위해서는 "도메인의 이해"도 중요합니다.
어떠한 산업에서 수집한 데이터인지, 데이터의 타입은 무엇인지 등을 의미하죠.
위 2가지를 바탕으로 기획, 수집, 시각화, 분석 등의 능력을 가져야 합니다.
데이터 베이스 & 데이터 베이스 시스템
데이터 베이스 (DB)
데이터 베이스는 "여러 사용자가 공유하여 사용할 수 있도록 통합하여 저장한 운영 데이터의 집합"을 의미해요.
또는 "컴퓨터에 저장된 데이터들을 통합해 저장하고 관리하는 모임"이라고도 합니다.
조금 더 자세히 들여다볼까요?
- 데이터 베이스의 정의 (구성)
- 통합 데이터
- 최소의 중복과 통제 가능한 중복만 허용하는 데이터
- 저장 데이터
- 컴퓨터가 접근할 수 있는 매체에 저장된 데이터
- 공유 데이터
- 특정 조직의 여러 사용자가 함께 소유하고 이용할 수 있는 공용 데이터
- 운영 데이터
- 조직의 주요 기능을 수행하기 위해 지속적으로 꼭 필요한 데이터
- 통합 데이터
데이터 베이스에는 아래와 같은 특징들이 있습니다.
- 데이터 베이스의 특징
- 실시간 접근
- 사용자의 데이터 요구에 실시간으로 응답
- 계속 변화
- 데이터의 계속적인 삽입, 수정, 삭제를 통해 현재의 정확한 데이터를 유지
- 동시 공유
- 서로 다른 데이터의 동시 사용뿐만 아니라 같은 데이터의 동시 사용도 지원
- 내용 기반 참조
- 데이터가 저장된 주소나 위치가 아닌 내용으로 참조
- 데이터는 DB의 특정 메모리 주소에 기계어로 저장되지만
사용자가 데이터를 찾을 때는 메모리의 주소나 기계어가 아니라 "원하는 조건, 내용"을 검색해서 찾는다.
- 실시간 접근
데이터 베이스 시스템 (DBS DBMS)
데이터 베이스 시스템의 정의를 볼까요?
"데이터 베이스에 데이터를 저장하고, 관리해 조직에 필요한 정보를 생성해주는 시스템"입니다.
데이터 베이스 시스템(DBS)은 데이터 베이스 관리 시스템(DBMS)을 포함한 전체 시스템을 의미합니다.
데이터 베이스 관리 시스템(DBMS)에 대한 내용이 궁금하시면 아래 링크를 확인해 보세요.
데이터 베이스 시스템은 전에는 파일 처리 시스템이라는 방식을 사용했습니다.
파일 처리 시스템은 각 프로그램마다 별도의 데이터 파일을 생성하고 관리하죠.
그런데 효율성 측면에서 몇 가지 문제점이 있었습니다.
- 데이터 종속: 파일 구성이 바뀌면 프로그램도 변경돼야 함.
- 데이터 중복: 동일한 데이터라도 각 프로그램마다 별도로 유지해서 공간적 낭비와 데이터 불일치가 발생함.
이런 문제들을 데이터 베이스 시스템이 나오면서 해결됩니다.
데이터 베이스 시스템은 사용자, 인터페이스, 데이터 베이스 관리 시스템, 데이터 베이스로 구성되어 있습니다.
데이터 베이스에 관심이 있으시다면 "DB, DBMS, SQL"를 들어보신 적 있으실 겁니다.
모두 데이터 베이스 시스템의 구성 요소이죠.
- 사용자
- 최종 소비자, 프로그래머, 데이터 분석가, 데이터 베이스 관리자, 데이터 베이스 설계자
데이터를 사용하는 시스템 - 사용자는 DB에 직접 접근하는 것이 아니라 DBMS라는 SW를 통해서 접근
이때 사용하는 인터페이스 중 하나가 SQL (Structed Query Language)
- 최종 소비자, 프로그래머, 데이터 분석가, 데이터 베이스 관리자, 데이터 베이스 설계자
- 인터페이스
- SQL, 응용프로그램 화면, 데이터 베이스 스키마
- DBMS
- 사용자가 DB에 접근하기 위해 사용하는 SW
- 관계형 DBMS (RDB), NoSQL 등의 종류가 있음
- DB
- 데이터의 집합
데이터 베이스 관리 시스템(DBMS)에 대해서는 아래 글에서 상세하게 다뤘으니 확인해 보세요.
데이터 베이스에 대해 정리해 봤습니다.
제 글이 도움이 되면 좋겠습니다.
감사합니다.😊
'Database > 이론' 카테고리의 다른 글
[Data] Database 기초 다기지 - DBMS의 종류와 구조, 특징 (Ft. 데이터 무결성, 옵티마이저, 트랜잭션) (0) | 2022.12.22 |
---|---|
[Data] Database 기초 다지기 - 데이터 베이스 관리 시스템이란? (DBMS) (0) | 2022.12.21 |