필기시험은 교재 한 번 훑어 보고 기출복원문제를 여러번 보면 된다.
목차
- 데이터와 정보
- 데이터 구분
- 정량적 데이터
- 정성적 데이터
- 데이터 유형
- 정형 데이터
- 반정형 데이터
- 비정형 데이터
- 데이터 기능
- 지식창조 메커니즘
- 공통화(Socialization)
- 표출화(Externalization)
- 연결화(Combination)
- 내면화(Internalization)
- DIKW 피라미드
- 데이터(D)
- 정보(I)
- 지식(K)
- 지혜(W)
- 핵심요약
1. 데이터와 정보
단순한 객체로도 가치가 있으며 다른 객체와의 상호관계 속에서 더 큰 가치를 갖는다.
2. 데이터 구분
(정량적 데이터 / 정성적 데이터)
데이터는 크게 정량적 데이터와 정성적 데이터로 나눌 수 있습니다. 정량적 데이터는 주로 숫자로 이루어진 데이터로, 객관적 내용을 담고 있습니다. 예를 들어, '2024년', '100km/h' 등이 있습니다. 반면, 정성적 데이터는 문자와 같은 텍스트로 구성되며, 주관적 의미를 지니고 있습니다. 예를 들어, '철수는 시험에 합격하였다'와 같은 표현이 있습니다.
반면, 정성적 데이터는 문자와 같은 텍스트로 구성되며, 주관적 의미를 지니고 있습니다. 예를 들어, '철수는 시험에 합격하였다'와 같은 표현이 있습니다.
3. 데이터의 유형
(정형데이터,반정형 데이터 / 비정형 데이터)
데이터는 정형 데이터, 반정형 데이터, 비정형 데이터로 분류됩니다.
- 정형 데이터는 정해진 형식과 구조에 맞게 저장되며, 관계형 데이터베이스의 테이블에 주로 저장됩니다.
- 반정형 데이터는 형식과 구조가 비교적 유연하며, JSON, XML, RDF, HTML 등이 이에 해당합니다.
- 비정형 데이터는 구조가 정해지지 않은 데이터로, 동영상, 이미지, 음성, 문서, 이메일 등이 포함됩니다.
4. 데이터의 기능
과학적 발견은 개인의 암묵적 지식에 기초하는 경우가 많다.
이를 활용하기 위해서 데이터 기반으로 한 암묵지와 형식지의 상호작용이 중요하다.
1. 암묵지: 어떠한 시행착오나 다양하고 오랜 경험을 통해 개인에게 체계화되어 있으며 외부에 표출되지 않은 무형의 지식으로 그 전달과 공유가 어렵다.
2. 형식지: 형상된 유형의 지식으로 그 전달과 공유가 쉽다.
암묵지- 학습과 경험 통해 개인에게 체화되어 있으나 겉으로 드러지 않은 지식
형식지- 명시적으로 알수 있는 형태 형식을 갖추어 표현되고 공유가 가능한 지식
*암묵지와 형식지
- 암묵지: 시행착오와 경험을 통해 개인에게 체화된 지식으로, 전달과 공유가 어렵습니다.
- 형식지: 명확히 표현되고 공유할 수 있는 지식입니다. 예를 들어, 매뉴얼이나 문서로 작성된 지식이 있습니다.
5. 지식창조 메커니즘
노나카 이쿠지로의 지식창조 메커니즘은 암묵지와 형식지 간 상호작용을 통해 지식을 창조하는 4단계 과정입니다.
- 공통화(socialization): 서로 경험과 인식을 공유하여 암묵지를 발전시킴
- 표출화(externalization): 암묵지를 형식지로 구체화
- 연결화(combination): 형식지를 재분류하고 체계화
- 내면화(internalization): 형식지를 개인의 지식으로 내재화
6. DIKW 피라미드 (데이터와 정보, 지식, 지혜의 관계)
데이터, 정보, 지식, 지혜는 인간의 사회활동 속에서 가치 창출을 위한 프로세스로 연결됩니다.
- 데이터: 현실에서 관찰하거나 측정한 사실이나 값. - D
- 정보: 데이터를 가공하여 도출된 의미. - I
- 지식: 정보를 구조화하여 개인적인 경험을 결합한 결과물. - K
- 지혜: 축적된 지식을 통해 근본적인 원리를 이해하고, 창의적 아이디어를 도출한 산물. - W
7. 핵심 요약:
데이터의 유형을 유연성을 기준으로 나열한다면 비정형 데이터가 가장 유연하고 정형 데이터는 유연성이 부족하다.
데이터는 단순한 객체로도 가치가 있으며 다른 객체와의 상호관계 속에서는 더 큰 가치를 갖는다.
정량적 데이터는 정형 데이터와 반정형 데이터이고, 정성적 데이터에는 비정형 데이터가 있다.
정량적 데이터는 주로 객관적으로 내용을 나타내고 정성적 데이터는 주관적인 내용을 내포하고 있다.
정형데이터는 정해진 형식과 구조에 맞게 저장하여야 하지만 반정형 데이터는 데이터 형식과 구조가 비교적 유연하고 비정형 데이터는 구조를 갖지 않는 경우가 대부분이다.
해당 내용은 강의 내용을 밸췌하여 요약한 것입니다.
Part.1 빅데이터 분석 기획 - 1.빅데이터의 이해 (1.빅데이터 개요 및 활용)
담당강사 : 신경진
출처 - 아이티고