데이터베이스 시스템 (DBS)
- 데이터베이스에 데이터를 저장하고, 이를 관리하여 조직에 필요한 정보를 생성해주는 시스템
데이터베이스의 구조
- 스키마
- 데이터베이스에 저장되는 데이터 구조와 제약조건을 정의한 것
- 인스턴스
- 스키마에 따라 데이터베이스에 실제로 저장된 값
- 3단계 데이터베이스 구조
- 미국 ANSI/SPARC 표준화 기관에서 제안
- 데이터베이스를 쉽게 이해하고 이용 가능하도록 하나의 데이터베이스를 관점에 따라 세 단계로 나눔
- 외부 단계 : 개별 사용자 관점, 외부 스키마
- 개념 단계 : 조직 전체의 관점, 개념 스키마
- 내부 단계 : 물리적인 저장 장치 관점, 내부 스키마
- 각 단계별로 다른 추상화 제공
- 내부 단계에서 외부 단계로 갈수록 추상화 레벨이 높아짐
3단계 데이터베이스 구조의 매핑
- 스키마 사이의 대응 관계
- 외부 / 개념 매핑 : 외부 스키마와 개념 스키마의 대응 관계
- 응용 인터페이스라고도 함
- 개념 / 내부 매핑 : 개념 스키마와 내부 스키마의 대응 관계
- 저장 인터페이스라고도 함
- 외부 / 개념 매핑 : 외부 스키마와 개념 스키마의 대응 관계
- 미리 정의된 매핑을 이용해, 사용자가 원하는 데이터에 접근.
- 데이터베이스를 3단계 구조로 나눠 단계별로 스키마를 유지하며, 스키마 사이의 대응 관계를 정의하는 궁극적인 목적이 있음
- 데이터 독립성의 실현이다 !
데이터 독립성
- 하위 스키마를 변경하더라도 상위 스키마가 영향을 받지 않는 특성
- 논리적 데이터 독립성
- 개념 스키마가 변경되어도 외부 스키마는 영향을 받지 않음
- 개념 스키마가 변경되면 관련된 외부 / 개념 매핑만 정확하게 수정해주면 됨
- 물리적 데이터 독립성
- 내부 스키마가 변경되어도 개념 스키마는 영향을 받지 않음
- 내부 스키마가 변경되면 관련된 개념 / 내부 매핑만 정확하게 수정해주면 됨
데이터베이스 사용자
- 데이터베이스를 이용하기 위해 접근하는 모든 사람
- 데이터베이스관리자(DBA), 최송 사용자, 응용 프로그래머로 구분
데이터베이스 관리자
- 데이터베이스 시스템을 운영 및 관리하는 사람
- 주로 데이터 정의어(DDL)와 데이터 제어어(DCL)를 이용
- 주요 업무
- 데이터베이스 구성 요소 선정
- 데이터베이스 스키마 정의
- 물리적 저장 구조와 접근 방법 결정
- 무결성 유지를 위한 제약조건 정의
- 보안 및 접근 권한 정책 결정
- 백업 및 회복 기법 정의
- 시스템 데이터베이스 관리
- 시스템 성능 감시 및 성능 분석
- 데이터베이스 재구성
최종사용자와 응용 프로그래머
- 최종 사용자 (End User)
- 데이터베이스에 접근해 데이터를 조작(삽입,삭제,수정,검색)하는 사람
- 주로 데이터 조작어(DML)를 사용
- 캐주얼 사용자와 초보 사용자로 구분
- 응용 프로그래머
- 데이터 언어를 삽입하여 응용 프로그램을 작성하는 사람
- 주로 데이터 조작어(DML)를 사용
데이터 언어
- 사용자와 DBMS 간의 통신 수단
- 사용 목적에 따라 데이터 정의어(DDL), 데이터 조작어 (DML), 데이터 제어어 (DCL)로 구분
데이터 정의어와 데이터 조작어
- 데이터 정의어 (DDL)
- 스키마를 정의하거나, 수정 또는 삭제하기 위해 사용
- 데이터 조작어 (DML)
- 데이터의 삽입,삭제,수정,검색 등의 처리를 요구하기 위해 사용
- 절차적 데이터 조작어
- 사용자가 어떤 데이터를 원하고 그 데이터를 얻기 위해 어떻게 처리해야 하는지 설명
- 저수준 프로그래밍 언어
- 비절차적 데이터 조작어
- 사용자가 어떤 데이터를 원하는지만 설명
- SQL
- 데이터 제어어 (DCL)
- 내부적으로 필요한 규칙이나 기법을 정의하기 위해 사용
- 데이터를 보호하고 관리하는 언어
- 사용 목적
- 무결성 : 정확하고 유효한 데이터만 유지
- 보안 : 허가받지 않은 사용자의 데이터 접근 차단, 허가된 사용자에 권한 부여
- 회복 : 장애가 발생해도 데이터 일관성 유지
- 동시성 제어 : 동시 공유 지원
DBMS의 구성
- 데이터베이스 관리와 사용자의 데이터 처리 요구 수행
- 주요 구성 요소
- 질의 처리기
- 사용자의 데이터 처리 요구를 해석해, 처리
- DDL 컴파일러, DML 프리 컴파일러, DML 컴파일러, 런타임 데이터베이스 처리기, 트랜잭션 관리자 등을 포함
- 저장 데이터 관리자(Stored Data Manager)
- 디스크에 저장된 데이터베이스와 데이터 사전을 관리하고 접근함
- 질의 처리기
데이터 모델링
- 현실 세계에 존재하는 데이터를 컴퓨터 세계의 데이터베이스로 옮기는 변환 과정
- 데이터베이스 설계의 핵심 과정이다.
- 2단계 데이터 모델링
- 개념적 데이터 모델링
- 현실 세계의 중요 데이터를 추출하여 개념 세계로 옮기는 작업
- 논리적 데이터 모델링
- 개념 세계의 데이터를 데이터베이스에 저장하는 구조로 표현하는 작업
- 개념적 데이터 모델링
데이터 모델
- 데이터 모델링의 결과물을 표현하는 도구
- 개념적 데이터 모델
- 사람의 머리로 이해할 수 있도록 현실 세계를 개념적 모델링하여 DB의 개념적 구조로 표현하는 도구
- 개체-관계 모델
- 사람의 머리로 이해할 수 있도록 현실 세계를 개념적 모델링하여 DB의 개념적 구조로 표현하는 도구
- 논리적 모델
- 개념적 구조를 논리적 모델링하여 데이터베이스의 논리적 구조로 표현하는 도구
- 관계 데이터 모델
- 개념적 구조를 논리적 모델링하여 데이터베이스의 논리적 구조로 표현하는 도구
개체-관계 모델
피터 첸이 제안한 개념적 데이터 모델,
개체와 개체 간의 관계를 이용해 현실 세계를 개념적 구조로 표현함
핵심 요소 : 개체, 속성, 관계
개체-관계 다이어그램 (ER diagram)
- 개체 - 관계 모델을 이용해 현실 세계를 개념적으로 모델링한 결과물을 그림으로 그린 것
개체
- 현실 세계에서 조직을 운영하는 데 꼭 필요한 사람이나 사물과 같이, 구별되는 모든 것
- 저장할 가치가 있는 중요 데이터를 가지고 있는 사람, 사물, 개념, 사건 등
- 다른 개체와 구별되는 이름을 가지고 있고, 각 개체만의 고유한 특성이나 상태, 즉 속성을 하나 이상 가지고 있음
- 서점에 필요한 개체 : 고객(고객 ID, 이름, 전화번호 등), 책(ISBN, 제목, 저자 등)
- 학교에 필요한 개체 : 학과(학과코드, 학과명 등), 과목(과목코드, 과목명, 교수명 등)
- 파일 구조에서의 레코드와 대응됨
- ER 다이어그램에서 사각형으로 표현하고 사각형 안에 이름을 표기
개체 집합
- 개체 타입
- 개체를 고유의 이름과 속성들로 정의한 것
- 개체 인스턴스
- 개체를 구성하고 있는 속성이 실제 값을 가짐으로써 실체화된 개체
- 개체 어커런스라고도 한다.
- 개체 집합
- 특정 개체 타입에 대한 개체 인스턴스들을 모아놓은 것
속성
- 개체 혹은 관계가 가지고 있는 고유의 특성
- 의미있는 데이터의 가장 작은 논리적 단위
- 파일 구조에서의 필드와 대응됨
- ER 다이어그램에서 타원으로 표현하고 타원 안에 이름을 표기
관계
- 개체와 개체가 맺고 있는 의미있는 연관성
- 개체 집합들 사이의 대응 관계, 즉 사상(맵핑)을 의미
- 고객 개체와 책 개체 간의 구매 관계 : 고객은 책을 구매한다.
- ER 다이어그램에서 마름모로 표현
관계의 유형 : 관계에 참여하는 개체 타입의 수 기준
- 이항 관계 : 개체 타입 두 개가 맺는 관계
- 삼항 관계 : 개체 타입 세 개가 맺는 관계
- 순환 관계 : 개체 타입 하나가 자기 자신과 맺는 관계
관계의 유형 : 매핑 카디널리티 기준
- 매핑 카디널리티 : 관계를 맺는 두 개체 집합에서, 각 개체 인스턴스가 연관성을 맺고 있는 상대 개체 집합의 인스턴스 개수
- 일대일 관계
- 일대다 관계
- 다대다 관계
관계 데이터 모델
개념적 구조를 논리적 구조로 표현하는 논리적 데이터 모델,
하나의 개체에 대한 데이터를 하나의 릴레이션에 저장한다.
- 릴레이션 : 하나의 개체에 관한 데이터를 2차원 테이블의 구조로 저장한 것
- 속성(attribute) : 릴레이션의 열
- 튜플(tuple) : 릴레이션의 행
- 도메인 : 속성의 특성을 고려한 데이터 타입
- 속성 값을 입력 및 수정할 때, 적합성 판단의 기준이 됨
- 널(null) : 속성 값을 아직 모르거나 해당되는 값이 없음을 표현
- 차수(degree) : 하나의 릴레이션에서 어트리뷰트(속성)의 개수
- 카디널리티 : 하나의 릴레이션에서 튜플의 개수
릴레이션의 구성
- 릴레이션 스키마
- 릴레이션의 논리적 구조
- 릴레이션의 이름과 릴레이션에 포함된 모든 속성 이름으로 정의 된다
- 고객(고객아이디, 고객 이름, 나이, 등급, 직업, 적립금)
- 내포 라고도 함. 정적인 특징이 있다.
- 릴레이션 인스턴스
- 어느 한 시점에 릴레이션에 존재하는 튜플들의 집합
- 외연 이라고도 함. 동적인 특징이 있다.
데이터베이스의 구성
- 데이터베이스 스키마
- 데이터베이스의 전체 구조
- 데이터베이스를 구성하는 릴레이션 스키마의 모음이다.
- 데이터베이스 인스턴스
- 데이터베이스를 구성하는 릴레이션 인스턴스의 모음이다
릴레이션의 특성
- 튜플의 유일성
- 하나의 릴레이션에는 동일한 튜플이 존재할 수 없다.
- 튜플의 무순서
- 하나의 릴레이션에서 튜플 사이의 순서는 무의미하다.
- 속성의 무순서
- 하나의 릴레이션에서 속성 사이의 순서는 무의미하다.
- 속성의 원자성
- 속성 값으로는 원자 값만 사용할 수 있다.
키의 특성
- 유일성 : 한 릴레이션에서 모든 튜플은 서로 다른 키 값을 가져야 한다.
- 최소성 : 꼭 필요한 최소한의 속성들로만 키를 구성한다.
키의 종류
- 슈퍼키(유일성) : 유일성을 만족하는 속성들로만 키를 구성
- 후보키(최소성) : 유일성과 최소성을 만족하는 속성 또는 속성들의 집합
- 기본키 : 후보키 중에서 기본적으로 사용하기 위해 선택된 키
- 대체키 : 기본키로 선택되지 못한 후보키
- 외래키 : 다른 릴레이션의 기본키를 참조하는 속성 또는 속성들의 집합
무결성 제약조건
데이터베이스 상태는 일관성 보장을 만족시켜야 한다.
- 도메인 제약 조건
- 각 속성의 값은 반드시 도메인에 속한 하나의 값이어야 함
- 속성의 기본 값과 가능한 값들의 범위, 널 값의 허용 여부 등을 지정
- 개체 무결성 제약 조건
- 기본키를 구성하는 어떤 속성도 널 값을 가질 수 없음
- 참조 무결성 제약 조건
- 외래키의 값은 참조된 릴레이션의 기본키 값과 같아야 함