비정형데이터분석6 [비정형 데이터] 중심화 경향 값 Introduction 비정형데이터분석 과목을 수강하며 공부한 내용을 정리하는 포스팅입니다. 해당글은 순천향대학교 빅데이터공학과 우지영 교수님이 진행하시는 "비정형데이터분석" 강의를 기반으로 작성되었습니다. 비정형 데이터를 분석할때 원본 데이터로는 어떠한 특징을 파악하기 어려운 경향이 있습니다. 따라서 우리는 원본 데이터에서 대표하는 값들을 활용하여 분석하는 것이 필요합니다. 일반적으로 우리는 통계치들을 활용해서 대표값들을 추출할 수 있습니다. 데이터의 종류에 대한 도메인 지식이 포함된다면 통계치 의외에도 다른 의미있는 값들을 추출할 수 있습니다. 지금은 도메인 지식이 없다고 가정을 하고 일반적으로 많이 사용하는 통계치들에 대해 알아보도록 하겠습니다. 크게 중심화 경향, 퍼짐 정도, 분포형태와 대칭정도로.. 2021. 3. 21. [비정형 데이터 분석] 비정형 데이터란? Introduction 비정형데이터분석 과목을 수강하며 공부한 내용을 정리하는 포스팅입니다. 해당글은 순천향대학교 빅데이터공학과 우지영 교수님이 진행하시는 "비정형데이터분석" 강의를 기반으로 작성되었습니다. 비정형 데이터 1. 비정형 데이터란? 비정형 데이터란 미리 정의된 데이터 모델이 없거나 미리 정의된 방식으로 정리되지 않은 정보라고 위키백과에서 정의하고 있습니다. 그렇다면 비정형 데이터 분석의 최종 목표는 무엇일까요?? 바로 정리되어 있지 않은 자료에서 정돈된 데이터인 즉, Tidy data를 만드는 것입니다. 2. 비정형 데이터 분석 예시 비정형 데이터의 예시로는 어떤한 것들이 있을까요?? 흔히, 텍스트, 음성, 영상등이 있습니다. (1) 텍스트 데이터 분석 텍스트를 조금 더 설명하자면 텍스트는 .. 2021. 3. 3. 이전 1 2 다음