본문 바로가기

비정형데이터분석6

[비정형 데이터 분석] 변화 분석 Introduction 비정형데이터분석 과목을 수강하며 공부한 내용을 정리하는 포스팅입니다. 해당글은 순천향대학교 빅데이터공학과 우지영 교수님이 진행하시는 "비정형데이터분석" 강의를 기반으로 작성되었습니다. 파형 데이터에서의 변화 분석 : 파형 데이터에서 급격한 변화를 감지하고 이를 특징화 하는 방법입니다. 변화 분석의 종류는 다음 3가지가 있습니다. 평균의 변화 분산의 변화 평균과 분산의 변화 R에서는 changepoints 패키지를 사용해서 변화 분석을 할 수 있습니다. 실습을 해보면서 배운 내용을 다시 정리 해보는 시간을 가지도록 하겠습니다. install.packages("changepoint") library(changepoint) 1. 평균의 변화 set.seed(123) sim_mean 2021. 4. 7.
[비정형 데이터 분석] Peak로 특징 찾기 Introduction 비정형데이터분석 과목을 수강하며 공부한 내용을 정리하는 포스팅입니다. 해당글은 순천향대학교 빅데이터공학과 우지영 교수님이 진행하시는 "비정형데이터분석" 강의를 기반으로 작성되었습니다. 피크(Peak) 분석 다른 값들과 다르게 높게 발생하는 피크를 찾아 파형을 특징 짓는 분석을 말합니다. 그렇기 때문에 우리는 파형 데이터에서 가장 높은 피크를 추출해야 합니다. 그렇다면 피크로 우리는 어떠한 이점을 얻을 수 있을까요?? 첫번째로 피크 간의 거리 측정을 통해 신호의 주기성을 파악할 수 있습니다. 피크가 있던 구간마다 거리를 측정하면 발생하는 주기를 알 수 있는것입니다. 예를 들어서 환자의 심박수 데이터가 있다면 환자가 어떠한 주기로 심장이 빨리 뛰는지 등을 분석해볼 수 있겠습니다. 두번.. 2021. 3. 24.
[비정형 데이터 분석] 분포형태와 대칭정도(distribution, symmetry) Introduction 비정형데이터분석 과목을 수강하며 공부한 내용을 정리하는 포스팅입니다. 해당글은 순천향대학교 빅데이터공학과 우지영 교수님이 진행하시는 "비정형데이터분석" 강의를 기반으로 작성되었습니다. 지난 포스팅에 이어서 오늘은 분포형태와 대칭정도(distribution)에 대해서 알아보도록 하겠습니다. 분포형태와 대칭정도(distribution) (1) 왜도(Skewness) 실수 값 확률 변수의 확률 분포 비대칭성을 나타내는 지표 정규분포 또는 t분포처럼 대칭인 분포들은 왜도가 0이게 됩니다. 대칭이 아니면 왜도의 값은 어떻게 달라질까요? 왜도에는 다음과 같이 Postive Skew, Negativw Skew 두가지 종류가 있습니다. 보통 오른쪽으로 꼬리가 긴, 왼쪽으로 꼬리가 긴이라고 많이 .. 2021. 3. 23.
[비정형 데이터 분석] 퍼짐 정도(dispersion) Introduction 비정형데이터분석 과목을 수강하며 공부한 내용을 정리하는 포스팅입니다. 해당글은 순천향대학교 빅데이터공학과 우지영 교수님이 진행하시는 "비정형데이터분석" 강의를 기반으로 작성되었습니다. 지난 포스팅에 이어서 오늘은 퍼짐 정도(dispersion)에 대해서 알아보도록 하겠습니다. 퍼짐 정로란 무엇일까요?? 단어에서도 느껴지듯이 자료가 얼마나 퍼져있는지 얼마나 모여있고, 얼마나 흩어져 있는지 등을 의미합니다. 이 퍼짐 정도를 나타내주는 대표적인 통계치들에 대해 알아보도록 하겠습니다. 퍼짐 정도(dispersion) (1) 분산 분산은 평균에 대한 편차 제곱의 평균을 구한 값 먼저 편차는 평균과의 차이를 의미합니다. 그렇기 때문에 편차의 합은 0이 됩니다. 그렇기 때문에 분산을 구하기 위.. 2021. 3. 23.