본문 바로가기

computer science/database

(3)
[database] OLTP → OLAP 우리가 흔히 사용했던 OLTP(Online Transaction Processing) 데이터베이스는 트랜잭션 처리를 위해 설계됐기 때문에(클라이언트의 요청이 있을때 해당하는 로우에 해당하는 정보를 빠르게 주기 위함), 로우 지향 저장소였다 하지만 대용량의 데이터를 질의하고 분석하는 OLAP(Online Analytics Processing)인 데이터 웨어하우스에서는 로우 지향으로 저장하면 페타바이트 단위의 데이터를 효율적으로 저장하고 질의하기 어려워진다 실제로 우리가 사용하는 분석용 쿼리를 보면, 보통 한번에 5개 이하 컬럼에 접근한다(SELECT *은 필요하지 않다). 따라서 효율적으로 저장하고 질의하기 위해, 많은 OLAP 데이터베이스는 모든 값을 각 컬럼별로 저장하고, 질의에 해당하는 컬럼만을 읽고..
[데이터베이스] 데이터베이스 개요 1. 필요성좋은 정보를 얻기 위해서는좋은 우유를 얻으려면 좋은 원유를 확보해야 하는 것처럼, 의미 있는 데이터를 많이 수집해야하며수집한 데이터를 효율적으로 저장했다가 필요할 때 언제든 사용할 수 있어야함이를 관리해주는게 데이터베이스  2. 본질데이터를 입력하고, 출력하는 것이 데이터베이스모든 데이터베이스를 살펴볼 때, 어떻게 입력하고 출력하는지를 따져봐야함입력 - Create, Update, Delete출력 - Read  3. 파일은 어떻게 데이터베이스화 되어갔나?파일의 목록이 1억개라고 상상해보자데이터를 확인하려면, 왼쪽(- 파일 시스템)에서는 파일을 일일이 열어 확인해야 하지만 오른쪽(- 구조화된 스프레드 시트)에서는 간단한 검색으로 확인할 수 있음스프레드 시트는 데이터베이스가 아니지만, 데이터베이스..
[데이터베이스] 데이터와 정보 1. 데이터와 정보데이터는 원유고, 정보는 가공한 우유데이터 - 현실 세계에서 단순히 관찰하거나 측정해 수집한 사실이나 값정보 - 데이터를 의사 결정에 유용하게 활용할 수 있도록 처리해 체계적으로 조직한 결과물 2. 데이터 분류형태에 따른 데이터 분류정형 데이터구조화된 데이터, 즉 미리 정해진 구조에 따라 저장된 데이터엑셀의 스프레드시트, 관계 데이터베이스의 테이블반정형 데이터구조에 따라 저장된 데이터지만, 정형 데이터와 달리 데이터 내용 안에 구조에 대한 설명이 함께 존재함HTML, XML, JSON, 웹 로그, 센서 데이터 등비정형 데이터정해진 구조가 없이 저장된 데이터소셜 데이터의 텍스트, 영상, 이미지, 음성, 워드, PDF 등특성에 따른 데이터 분류범주형 데이터(종류)명목형 데이터 - 서열이 없..