데이터베이스 구축(물리 데이터베이스 설계)

2025. 2. 16. 11:48자격증

반응형
1. 물리 요소 조사 분석 (1)스토리지 : 정보를 보존하는 저장장치 예) SSD저장장치 (다나스)
DAS (Direct Attached Storage) : 전용케이블로 직접 접속하는 방법 / 성능보장 / 뛰어난 안정성 / 저장장치 공유 문제
NAS (Network Attached Storage) : LAN을 통해 스토리지와 서버를 접속 / 파일서버 사용 / 병목현상 발생 가능
SAN (Storage Area Network) : SAN 스위치와 광섬유 채널을 통하여 연결 / DAS의 접속 한계성 극복 n개의 서버가 m개의 저장장치 접속 가능 / 이기종 서버환경을 지원하지 않고, 공유 가능한 파일 시스템과 데이터형식 제한.
(2)분산 데이터베이스의 구성 : 네트워크상에서 여러 컴퓨터에 물리적으로 분산되어 있지만, 하나의 데이터베이스처럼 인식하도록 논리적으로 통합된 데이터베이스
(전분할지지 : ①전역 스키마 ②분할 스키마 ③할당 스키마 ④지역 스키마 ⑤지역 DBMS
(3)분산 데이터베이스의 투명성 (위복병분장)
①위치 Location 투명성 : 여러 지역에 있어도 마치 한곳에 저장된 것 처럼 사용
②복제 Replication투명성 : 만약을 대비해서 여러 군데 분산 저장 한다. 복제가 되었는지 안되었는지 모르게 사용
③병행 Concurrency투명성 : 여러명이 사용해도 혼자 사용하는 것처럼 사용, 병행 사용 가능
④분할 Fragmentation투명성 : 분할된 자료를 한곳에서 모아져 이용 가능하다.
⑤장애 Failure투명성 : 여러군데 저장되어 있다. 장애가 생겨도 마치 장애가 안 난거 처럼 사용 가능. 2PC (Phase Commit) 활용
(4)데이터베이스 암호화 : 데이터베이스에 저장된 데이터를 읽기 어려운 값으로 변환하여 권한이 없는 제3자가 볼 수 없도록 저장
(5)데이터베이스 암호화 적용 방식
컬럼 암호화 : (애플하) 1. API;Application Programming Interface(Open API지도, 검색) 응용프로그램인터페이스 2. Plug-In 3. Hybrid
블록 암호화 : (티파) 1. TDE 방식 (DBMS에서 암호화 지원) 2. 파일 암호화 방식
(6)접근제어 Access Control 개념 : 1. 불법적인 데이터의 접근으로부터 데이터베이스를 보호하는 기법이다.
2. 네트워크 주소체계는 ①MAC주소 ②IP주소 ③Port주소:어떤 프로토콜을 이용해서 통신을 할 것인지에 대한 번호 (서비스 포트 : HTTP (80 Port)
3. 네트워크 장비에서 수행하는 IP에 대한 접근 제어로는 관리 인터페이스의 접근제어와 ACL; Access Control List 등이 있다.


(7)접근제어 정책 ( , , 알백 )
1. 신원기반Identity-based : ①신분에 근거하여 객체에 대한 접근을 제한하는 방법 DAC; Discretionary Access Control
2. 규칙기반Rule-based : ①객체에 대한 접근을 제한하는 방법 MAC; Mandatory Access Control
3. 역할기반Role-based : ①조직 내에서 맡은 역할에 기초하여 지원에 대한 접근 허용 여부 결정 RBAC; Role Based Access Contorl
(8)접근 제어 보안 모델
기밀성 모델 벨라파듈라 모델; Bell-LaPadula Model
무결성 모델 비바 모델; Biba Model
2. DB 물리 속성 설계 (1)파티셔닝(Partitioning) : 대용량의 테이블을 파티션이라는 작은 논리적인 단위로 나눔으로써 성능 저하 방지 관리 용이
) 은행의 거래 데이터를 일별,월별,년도별 따로 저장하여 다른 저가 디스크로 옮길 때 관리하기 쉽다.
(2)파티셔닝 유형 (레해리컴라 )
①레인지Range : 범위 내에 있는지 여부로 구분


②해시 Hash : 해시 함수의 값에 따라 파티션에 포함할지 여부 결정


③리스트 List : 값 목록에 파티션을 할당하고 분할 키 값을 그 목록에 비추어 파티션을 선택


④컴포지트 Composite : 레인지, 해시, 리스트 파티셔닝 중 2개 이상의 파티셔닝을 결합하는 파티션 기법


⑤라운드로빈 Round-Robin : 라운드로빈 분할로 회전하면서 새로운 행이 파티션에 할당하는 방식


(3)클러스터링 : 지정된 컬럼 값의 순서대로 데이터 행을 저장하는 방법 / 검색 효율은 높으나 입력,수정,삭제 시 부하가 증가.
(4)데이터베이스 백업 : (전차증트)①전체백업Full 차등백업Differential ③증분백업Incremental  ④트랜잭션Transaction 로그 백업)
                                                    
3. 물리 데이터베이스 모델링 (1)데이터베이스 무결성 개념 : 데이터베이스에 저장된 데이터 값과 그것이 표현하는 현실 세계의 실제 값이 일치하는 성질
(2)데이터베이스 무결성 규정
1. 무결성 규정 대상으로는 도메인, , 종속성 등이 있다.
2. 정식으로 허가받은 사용자에게 의한 갱신으로부터 데이터베이스를 보호하기 위한 규정
3. 릴레이션 무결성 규정은 릴레이션을 조작하는 과정에서 의미적 관계를 명세한 것이다.
4. 데이터가 만족해야 될 제약 조건, 규정을 참조할 때 사용하는 식별자 등의 요소가 포함될 수 있다.
(3)데이터베이스 무결성 종류 (개참속사키)
개체 무결성 : 기본 키에 속해 있는 애트리뷰트는 널 값이나 중복 값을 가질 수 없다.
-기본 키Primary Key (주민등록번호 PK) / 유니크인덱스 Unique Index (동일한 인덱스를 갖지 못한다)
-기본 키(PK)의 속성이 NULL을 허용할 수 없는 제약 조건.
②참조 무결성 : 릴레이션은 참조할 수 없는 외래 키 값을 가질 수 없다. 외래 키 (Foreign Key)
  [사원]마케팅 홍길동은 [부서] 마케팅에 참조되어 있다. 홍길동은 미디어팀으로 옮길수 없다.
③속성 무결성 : 체크(Check), : 릴레이션 내의 튜플들이 각 속성의 도메인에 지정값 만을 가져야 한다.
-성별 남M F, 두 개 외엔 에러, NULL/NOT NULL, 기본값(Default)
④사용자 무결성 : 사용자의 의미적 요구사항을 준수해야 한다. 트리거 Trigger
⑤키 무결성 : 키 속성의 모든 값들은 서로 같은 값이 없어야 한다.
-한 릴레이션에 같은 키 값을 가진 튜플들을 허용 할 수 없다, 유니크Unique:
(4)키의 특성 (유일성 : 식별자에 의해 엔터티 타입 내에 모든 엔터티들이 유일하게 구분 ②최소성 : 초소한의 속성으로 식별자 구성)
릴레이션에서 튜플을 유일하게 구별해주는 속성 또는 속성들의 조합을 후보 키라고 한다. 후보키는 (유일성) (최소성)을 만족해야한다
기본 키 Primary Key : 튜플들을 고유하게 식별, 주민번호, 사번, 학번,
② 대체 키 Alternate Key : 후보 키 중에서 기본 키로 선택되지 않은 키
③ 후보 키 Candidate Key : 튜플들을 구별, 기본키와 대체키를 합친 키
④ 슈퍼 키 Super Key : 모든 튜플에 대해 유일성은 만족하지만, 최소성은 만족 하지 못하는 키 (주민번호) + 직책 + 나이 + 전화번호
⑤ 외래 키 Foreign Key : 테이블 간의 참조 데이터 무결성을 위한 제약 조건 (참조)            유일성 만족 | 최소성 만족하지 못함


(5)반정규화(De-Normalization) : 정규화된 Entity, Attribute, Relationship에 대해 성능향상과 개발 운영의 단순화를 위해 중복, 통합,분리 등을 수행하는 데이터 모델링 기법 (=비정규화, =역정규화)
(6)반 정규화 기법 : 1:1관계, 1:M관계를 통합하여 조인 횟수를 줄여 성능 향상 / 슈퍼타입, 서브타입 테이블 통합을 통해 성능 향상
1. 테이블 병합 : -병합,분할,중복 컬-중 관-
2. 테이블 분할:  테이블을 수직 또는 수평으로 분할하는 것으로 파티셔닝이라고 함
수평 분할 : 테이블 분할에 레코드 기준으로 활용 (튜플의 개수가 많아서 분할)
테이블            ②수직 분할 : 컬럼의 개수가 증가 (컬럼의 개수가 많아서 분할)
3. 중복 테이블 추가 : 대량의 데이터들에 대한 집계함수를 사용하여 실시간 통계정보를 계산하는 경우 별도의 통계테이블
계 테이블 추가 : 집계 데이터를 위한 테이블을 생성
행 테이블 추가 : 이력 관리 등의 목적
정 부분만을 포함하는 테이블 추가 : 데이터가 많은 테이블의 특정 부부만을 사용
컬럼     4. 컬럼 중복화 : 조인 성능 향상을 위해 컬럼 중복 허용
관계     5. 중복 관계 추가 : 여러 경로를 거쳐 조인이 가능하지만 이때 성능 저하를 예방하기 위해 추가적 관계를 맺는 방법
(7)물리 데이터 모델 품질 요소 (정완준 최일활 ①정확성 ②완전성 ③준거성:준수했는지 ④최신성 ⑤일관성 ⑥활용성)
(8)CRUD 분석 개념 : 데이터베이스에 영향을 주는 생성, 읽기, 갱신, 삭제 연산으로 프로세스와 테이블 간에 매트릭스를 만들어 트랜잭션을 분석하는 기법
è모든 엔터티에 “C”, “R”, “CRUD”존재,
(9)SQL성능 튜닝 기법 (옵힌부인 : ①옵티마이저 조정 ②힌트 사용 ③부분 범위 처리 사용 ④인덱스 활용

 

3-5.데이터 전환 1. 데이터 전환 기술 (1)데이터전환기술 (전대범고 : ①구축전량수립 ②대상파악 ③범위 확정 ④고려사항 도출)
(2)ETL; Extraction추출 Transformation변환 Loading적재
원천 시스템에서 데이터를 추출(Extraction)하여 변환(Transformation) 작업을 거쳐 목적 시스템으로 적재(Loading)하는 프로세스 이다.
(3)파일 처리 기술의 유형
순차파일 Sequential File : 입력되는 데이터들을 논리적인 순서에 따라 물리적인 연속 공간에 순차적으로 기록하는 방식
색인순차파일 Indexed Sequential File : 포인터 인덱스를 통행 순차적으로 저장되어 있는 곳을 찾아 간다. (순차 처리와 랜덤 처리)
직접파일 Direct File=랜덤파일=DAM : 레코드는 해시 함수에 의해 계산된 물리적 주소를 통해 접근 
반응형