본문 바로가기

ORACLE11g/DATABASE 이론

[20장] 고급 데이터베이스

1. 분산 데이터베이스(Distributed Database)


§ 분산 데이터베이스 시스템의 구성 요소

・분산 처리기

자체 처리 능력, 지리적 분산된 컴퓨터 시스템

・분산 데이터베이스

지리적 분산된 DB

・통신 네트워크

분산된 처리기들을 이어주는 통신망


§ 분산 데이터베이스의 목표

위치 투명성(Location Transparency)

접근하려는 DB의 실제 위치를 알 필요가 없음.

중복 투명성(Replication Transparency)

동일한 데이터가 여러 곳에 있더라도 하나만 존재하는 것처럼 사용 가능.

병행 투명성(Concurrency Transparency)

다수의 트랜잭션이 동시에 실행되더라도 수행 결과는 서로 영향을 주지 않음.

장애 투명성(Failure Transparency)

여러 장애에도 불구하고 트랜잭션은 정확하게 수행된다.


§ 분산 데이터베이스의 장・단점

장점

단점

・지역 자치성이 높다.

・데이터의 공유성이 향상된다.

・분산 제어가 가능하다.

・시스템 성능이 향상된다.

・효율성 및 융통성이 높다.

・신뢰성 및 가용성이 높다.

・집중적 시스템 용량 확장이 용이하다.

・DBMS가 수행할 기능이 복잡하다.

・DB 설계가 어렵다.

・소프트웨어 개발 비용이 증가한다.

・처리 비용이 증가한다.

・잠재적 오류가 증가한다.



2. 멀티미디어 데이터베이스(Multimedia Database)


§ 멀티미디어 데이터베이스의 특성

・데이터가 일반적으로 대용량.

・미디어별로 별도의 검색 방법 필요.

・비정형 데이터이기 때문에 데이터 구조가 복잡하고 관계 구성이 어렵다.


§ 멀티미디어 데이터베이스 구축 방법

・파일 기반 기법

・관계형 데이터베이스 기법

・객체 지향 데이터베이스 기법

・객체 관계형 데이터베이스 기법



3. 주기억장치 데이터베이스(Main Memory Database)


§ 주기억장치 데이터베이스의 특성

・모든 연산이 주 기억 장치에서 수행되므로 디스크의 입・출력이 감소하여 연산이 빠름

・회복 작업의 구현이 어려움

・구입 비용이 많이 듬



4. 데이터 웨어하우스(Data Warehouse)


・정보의 효율적인 분석과 신속 정확한 의사결정을 위한 데이터베이스.

장점 

단점 

・높은 투자 수익률을 얻을 수 있다.

・타사에 비하여 경쟁우위를 획득할 수 있다.

・의사 결정자의 생산성을 향상시킬 수 있다. 

・기존 시스템과 명확한 역할 설정을 하지 못하면 업무의 혼란을 초래할 수 있다.

・추출 기준에 맞지 않는 데이터의 입력, 갱신, 삭제가 발생하면 불일치 문제가 발생할 수 있다.

・의사 결정을 위한 충분한 데이터가 확보되지 않으면 정확한 결과를 도출할 수 없다.

・과다한 자원을 사용하게 되고 유지 보수가 어렵다. 



5. 데이터 마트(Data Mart)


소규모 단일 주제의 데이터 웨어하우스.

・데이터 마트의 특징

분석 요건에 적합한 구조로 재구성한 데이터

분석에 필요한 이력 데이터만 포함하는 제한된 규모의 데이터

유연성과 접근성이 뛰어난 다차원 구조의 데이터



6. 데이터 마이닝(Data Mining)


・데이터 웨어하우스에서 사용자의 요구에 따라 유용하고 가능성 있는 정보를 발견하기 위한 기법


§ 데이터 마이닝의 기법

・연관(Association) : 연관 관계를 발견.

・연속(Sequence) : 이력 데이터를 분석하여 향후 발생 가능성을 예측.

・분류(Classification) : 차별적인 특성을 도출.

・클러스터링(Clustering) : 유사한 특성을 갖는 데이터를 집단화.

・특성화(Characterization) : 데이터를 분석하여 요약 과정을 통해 특성을 발견.

・패턴 분석(Pattern Analysis) : DB 내의 명시된 패턴을 찾는 방법.

경향 분석(Trend Analysis) : 시계열에 따라 변화하는 전개 과정을 분석하는 방법.



7. OLAP(Online Analytical Processing)


・다차원으로 이루어진 데이터로부터 통계적인 요약 정보를 분석하여 의사 결정에 활용하는 방식

・데이터 웨어하우스나 데이터 마트와 같은 시스템과 상호 연관되는 정보 시스템

데이터 웨어하우스의 데이터를 전략적인 정보로 변환시키는 역할

・OLAP 연산

ㅡ Roll-up : 상세 데이터에서 요약된 형태의 데이터로 접근하는 기능.

ㅡ Drill-down : 요약된 데이터에서 상세한 데이터로 접근하는 기능.

ㅡ Drill-through : 데이터 웨어하우스나 OLTP에 존재하는 상세 데이터에 접근하는 기능.

ㅡ Drill-across : 다른 데이터 큐브의 데이터에 접근하는 기능.

ㅡ Pivoting : 행, 열, 페이지 차원을 바꾸어 볼 수 있는 기능.

ㅡ Slicing : 다양한 각도에서 조회하고 자유롭게 비교하는 기능

ㅡ Dicing : Slicing을 더 세분화 하는 기능

・OLAP 종류

ROLAP(Relational-OLAP) : 관계형 DB와 관계형 쿼리를 사용하여 저장 및 분석

MOLAP(Multi-dimension OLAP) : 특수한 구조의 다차원 DB를 사용함.

검색 속도를 향상시키기 위해 큐브 캐시(Cube Cache)라고 하는 주기억 장치 속에 데이터 큐브를 보관함.

HOLAP(Hybrid OLAP) : ROLAP과 MOLAP의 특성을 모두 가짐.



8. OLTP(Online Transaction Processing)


네트워크 상의 여러 사용자가 실시간으로 데이터를 갱신하거나 검색하는 등의 트랜잭션 단위 작업을 처리하는 방식.

빠른 응답시간을 요구하며, 효율적인 조회와 수정을 위하여 정규화 되어 있음.

・OLTP와 OLAP 비교

 구분

OLTP

OLAP 

데이터의 구조

복잡(운영시스템 계산에 적합)

단순(사업 분석에 적합)

데이터의 갱신

순간적/동적 

주기적/정적 

응답 시간 

2, 3초 ~ 몇 초 이내 

수 초 ~ 수 분까지도 가능 

데이터의 범위 

과거 30일 ~ 90일 

과거 5년 ~ 10년 

데이터 성격 

정규/핵심 업무 데이터,

변경이 어려움 

비정규/읽기 전용 데이터,

변경이 용이함 

데이터의 크기 

수 Giga Byte 

수 Tera Byte 

데이터의 내용 

상세 데이터 

기록 보관된 요약/계산 데이터 

데이터의 특성 

트랜잭션 중심, 중복 배제 

주제(subject) 중심, 중복 수용 

데이터 엑세스 빈도 

높음 

보통 혹은 낮음 

데이터의 사용법 

고도로 구조화된 연속 처리 

고도로 비구조화된 분석 처리 

쿼리의 성격 

예언 가능, 주기적 

예측하기 어려움, 특수함 



9. ODBC(Open DataBase Connectivity)


・데이터베이스의 범용성을 높이기 위해 개발된 Microsoft가 만든 응용 프로그램의 표준 인터페이스.

・데이터베이스를 교체하더라도 응용프로그램을 그대로 사용할 수 있어 비용이 절감됨.

'ORACLE11g > DATABASE 이론' 카테고리의 다른 글

업무프로세스 정리  (0) 2016.10.07
[19장] 객체 지향 데이터베이스  (0) 2016.10.05
[18장] 튜닝 (Tuning)  (0) 2016.10.05
[17장] 보안 (Security)  (0) 2016.10.05
[16장] 병행 제어 (Concurrency Control)  (0) 2016.10.05