데이터 분석 준전문가

[데이터분석준전문가] 1장 데이터의 이해

shoney9254 2021. 5. 9. 14:28
반응형

1장 데이터의 이해

1 데이터와 정보
  1.1 데이터의 정의
      ‘주어진 것’이라는 의미로 사용되었다.
      단순한 객체로서의 가치뿐만 아니라 다른 객체와의 상호관계 속에서 가치를 갖는 것


  1.2 데이터의 특성
      1.2.1 존재적 특성 : 객관적사실
      1.2.2 당위적 특성 : 추론/예측/전망/추정을 위한 근거
 

  1.3 데이터의 유형
      1.3.1 정성적데이터
        언어, 문자 등. 저장/검색/분석에 많은 비용이 소모됨
        비정형 데이터, 주관적 내용, 분석 어려움


      1.3.2 정량적 데이터
         수치, 도형, 기호 등 비용소모가 적음
         정형 데이터, 객관적 내용, 통계분석이 용이
   

   1.4 암묵지와 형식지의 상호작용에 중요한 역할
         공통화/내면화/표출화/연결화


   1.5 DIKW 피라미드
  


2 데이터베이스 정의와 특징
   2.1 정의
      2.1.1 1차 개념 – 정형데이터 관리
         체계적이거나 조직적으로 정리되고 개별적으로 접근할 수 있는 것
         소재를 체계적으로 배열 또는 구성한 편집물. 소재에 접근/검색할수 있도록 한 것
      2.1.2 2차 개념 – 비정형데이터 포함(빅데이터 출현)
         동시에 복수의 적용 업무를 지원할 수 있도록 복수 이용자의 요구에 대응 가능
         소프트웨어로는 DBMS를 의미
   2.2 특징
         2.2.1 데이터베이스의 일반적인 특징
            통합된 데이터(Integrated) : 데이터가 중복되어 있지 않음
            저장된 데이터(Stored) : 컴퓨터가 접근할 수 있는 저장 매체에 저장되는 것
            공용 데이터(Shared) : 여러 사용자가 다른 목적으로 데이터를 공동으로 이용함
            변화되는 데이터(Changeable) : DB에 저장된 내용은 현 시점의 상태. 데이터의 삽입/삭제/갱신으로 항상 변화  하면서도 현재의 정확한 데이터를 유지해야함
         2.2.2 데이터베이스의 다양한 측면에서의 특징
            정보의 축적 및 전달 측면
            - 기계가독성 : 컴퓨터 등 정보처리기기가 읽고 쓸 수 있음
            - 검색가독성 : 정보를 검색할 수 있음
            - 원격조작성 : 원거리에서도 온라인으로 이용
            정보 이용 측면 : 요구에 따라 다양한 정보를 신속하게 획득
            정보 관리 측면 : 일정한 질서와 구조에 따라 방대한 정보를 체계적으로 축적, 추가, 갱신
            정보기술 발전 측면 : 정보처리, 전송등을 위한 네트워크 기술의 발전을 견인
            경제, 산업 측면 : 다양한 정보를 신속하게 제공하는 인프라로 사회활동의 효율성 제고

3 데이터베이스의 활용
   3.1 기업내부 데이터 베이스
      3.1.1 1980년대
         OLTP(On-Line Transaction Processing) : 호스트 컴퓨터가 DB를 액세스하고 바로 처리 결과를 돌려보내는 형태. (데이터 갱신)
         OLAP(On-Line Analytical Processing) : 다차원적인 데이터에 접근하여 의사결정에 활용할 수 있는 정보를 얻을 수 있게 해주는 기술(데이터 조회)


      3.1.2 2000년대
         CRM : 고객과의 지속적인 관계를 유지, 평생고객화를 통해 고객의 가치를 극대화
         SCM : 생산, 유통 등 모든 공급망 단계를 최적화해 제품을 원하는 시간과 장소에 제공
   3.2 분야별 데이터베이스
      3.2.1 제조
         ERP : 인사/재무/생산 등 관리 시스템을 통합 시스템으로 재구축, 생산성 극대화
         BI : 기업이 보유하고 있는 데이터를 정리하고 분석해 의사결정에 활용하는 프로세스
         CRM : 고객 중심 자원을 극대화하고 고객 특성에 맞게 마케팅 진행
      3.2.2 금융
         EAI(Enterprise Application Integration) : 상호 연관된 App를 연동하여 정보를 중앙 집중적으로 통합, 관리, 사용하도록 함
         EDW(Enterprise Data Warehouse) : DW를 전사적으로 확장한 것. 기업 리소스를 유기적 통합, 관리 체계정비, 데이터 중복 방지 등 시스템 재설계
      3.2.3 유통
         KMS : 지식관리시스템
         RFID : 주파수를 이용해 ID를 식별하는 시스템

반응형