1장 데이터의 이해
1 데이터와 정보
1.1 데이터의 정의
‘주어진 것’이라는 의미로 사용되었다.
단순한 객체로서의 가치뿐만 아니라 다른 객체와의 상호관계 속에서 가치를 갖는 것
1.2 데이터의 특성
1.2.1 존재적 특성 : 객관적사실
1.2.2 당위적 특성 : 추론/예측/전망/추정을 위한 근거
1.3 데이터의 유형
1.3.1 정성적데이터
언어, 문자 등. 저장/검색/분석에 많은 비용이 소모됨
비정형 데이터, 주관적 내용, 분석 어려움
1.3.2 정량적 데이터
수치, 도형, 기호 등 비용소모가 적음
정형 데이터, 객관적 내용, 통계분석이 용이
1.4 암묵지와 형식지의 상호작용에 중요한 역할
공통화/내면화/표출화/연결화
1.5 DIKW 피라미드
2 데이터베이스 정의와 특징
2.1 정의
2.1.1 1차 개념 – 정형데이터 관리
체계적이거나 조직적으로 정리되고 개별적으로 접근할 수 있는 것
소재를 체계적으로 배열 또는 구성한 편집물. 소재에 접근/검색할수 있도록 한 것
2.1.2 2차 개념 – 비정형데이터 포함(빅데이터 출현)
동시에 복수의 적용 업무를 지원할 수 있도록 복수 이용자의 요구에 대응 가능
소프트웨어로는 DBMS를 의미
2.2 특징
2.2.1 데이터베이스의 일반적인 특징
통합된 데이터(Integrated) : 데이터가 중복되어 있지 않음
저장된 데이터(Stored) : 컴퓨터가 접근할 수 있는 저장 매체에 저장되는 것
공용 데이터(Shared) : 여러 사용자가 다른 목적으로 데이터를 공동으로 이용함
변화되는 데이터(Changeable) : DB에 저장된 내용은 현 시점의 상태. 데이터의 삽입/삭제/갱신으로 항상 변화 하면서도 현재의 정확한 데이터를 유지해야함
2.2.2 데이터베이스의 다양한 측면에서의 특징
정보의 축적 및 전달 측면
- 기계가독성 : 컴퓨터 등 정보처리기기가 읽고 쓸 수 있음
- 검색가독성 : 정보를 검색할 수 있음
- 원격조작성 : 원거리에서도 온라인으로 이용
정보 이용 측면 : 요구에 따라 다양한 정보를 신속하게 획득
정보 관리 측면 : 일정한 질서와 구조에 따라 방대한 정보를 체계적으로 축적, 추가, 갱신
정보기술 발전 측면 : 정보처리, 전송등을 위한 네트워크 기술의 발전을 견인
경제, 산업 측면 : 다양한 정보를 신속하게 제공하는 인프라로 사회활동의 효율성 제고
3 데이터베이스의 활용
3.1 기업내부 데이터 베이스
3.1.1 1980년대
OLTP(On-Line Transaction Processing) : 호스트 컴퓨터가 DB를 액세스하고 바로 처리 결과를 돌려보내는 형태. (데이터 갱신)
OLAP(On-Line Analytical Processing) : 다차원적인 데이터에 접근하여 의사결정에 활용할 수 있는 정보를 얻을 수 있게 해주는 기술(데이터 조회)
3.1.2 2000년대
CRM : 고객과의 지속적인 관계를 유지, 평생고객화를 통해 고객의 가치를 극대화
SCM : 생산, 유통 등 모든 공급망 단계를 최적화해 제품을 원하는 시간과 장소에 제공
3.2 분야별 데이터베이스
3.2.1 제조
ERP : 인사/재무/생산 등 관리 시스템을 통합 시스템으로 재구축, 생산성 극대화
BI : 기업이 보유하고 있는 데이터를 정리하고 분석해 의사결정에 활용하는 프로세스
CRM : 고객 중심 자원을 극대화하고 고객 특성에 맞게 마케팅 진행
3.2.2 금융
EAI(Enterprise Application Integration) : 상호 연관된 App를 연동하여 정보를 중앙 집중적으로 통합, 관리, 사용하도록 함
EDW(Enterprise Data Warehouse) : DW를 전사적으로 확장한 것. 기업 리소스를 유기적 통합, 관리 체계정비, 데이터 중복 방지 등 시스템 재설계
3.2.3 유통
KMS : 지식관리시스템
RFID : 주파수를 이용해 ID를 식별하는 시스템
'데이터 분석 준전문가' 카테고리의 다른 글
[데이터분석준전문가] 3장 가치창조를 위한 데이터 사이언스와 전략 인사이트 (0) | 2021.05.09 |
---|---|
[데이터분석준전문가] 2장 데이터의 가치와 미래 (0) | 2021.05.09 |