본문 바로가기

전체 글153

[비정형 데이터 분석] 변화 분석 Introduction 비정형데이터분석 과목을 수강하며 공부한 내용을 정리하는 포스팅입니다. 해당글은 순천향대학교 빅데이터공학과 우지영 교수님이 진행하시는 "비정형데이터분석" 강의를 기반으로 작성되었습니다. 파형 데이터에서의 변화 분석 : 파형 데이터에서 급격한 변화를 감지하고 이를 특징화 하는 방법입니다. 변화 분석의 종류는 다음 3가지가 있습니다. 평균의 변화 분산의 변화 평균과 분산의 변화 R에서는 changepoints 패키지를 사용해서 변화 분석을 할 수 있습니다. 실습을 해보면서 배운 내용을 다시 정리 해보는 시간을 가지도록 하겠습니다. install.packages("changepoint") library(changepoint) 1. 평균의 변화 set.seed(123) sim_mean 2021. 4. 7.
[프로그래머스 SQL] 보호소에서 중성화한 동물 ANIMAL_INS ANIMAL_ID VARCHAR(N) FALSE ANIMAL_TYPE VARCHAR(N) FALSE DATETIME DATETIME FALSE INTAKE_CONDITION VARCHAR(N) FALSE NAME VARCHAR(N) TRUE SEX_UPON_INTAKE VARCHAR(N) FALSE ANIMAL_OUTS ANIMAL_ID VARCHAR(N) FALSE ANIMAL_TYPE VARCHAR(N) FALSE DATETIME DATETIME FALSE NAME VARCHAR(N) TRUE SEX_UPON_OUTCOME VARCHAR(N) FALSE 문제) 보호소에서 중성화 수술을 거친 동물 정보를 알아보려 합니다. 보호소에 들어올 당시에는 중성화 되지 않았지만, 보호소를 나갈.. 2021. 4. 7.
중심 경향(central tendency) 중심 경향(central tendency) 측정 값들이 어떤 값을 중심으로 모여 있는 양상을 보임 중심 경향은 어떻게 판단을 할 수 있을까?? 히스토그램을 그려보면 쉽게 알 수 있다. 위 그래프를 보면 최빈값은 1.10~1.12정도 라고 알 수 있다. 중심 경향 중에서 가장 대표적인 것은 산술평균이다. 즉 관측값을 모두 더해 데이터 수로 나눈값이다. 위의 데이터의 산술 평균값을 구하면 1.103464이 나온다. (R에서는 mean 함수로 구할 수 있음) 하지만 산술평균이 중심 경향에 어울리지 않는 경우가 있다. 바로 극단적으로 크거나 작은 값을 가지는 경우 평균은 이상치의 영향을 많이 받기 때문에 문제가 될 수 있다. 이때 대체할 수 있는 값이 바로 중앙값이다. 즉 데이터의 가운데 위치한 값이다. 위 데.. 2021. 3. 30.
[비정형 데이터 분석] Peak로 특징 찾기 Introduction 비정형데이터분석 과목을 수강하며 공부한 내용을 정리하는 포스팅입니다. 해당글은 순천향대학교 빅데이터공학과 우지영 교수님이 진행하시는 "비정형데이터분석" 강의를 기반으로 작성되었습니다. 피크(Peak) 분석 다른 값들과 다르게 높게 발생하는 피크를 찾아 파형을 특징 짓는 분석을 말합니다. 그렇기 때문에 우리는 파형 데이터에서 가장 높은 피크를 추출해야 합니다. 그렇다면 피크로 우리는 어떠한 이점을 얻을 수 있을까요?? 첫번째로 피크 간의 거리 측정을 통해 신호의 주기성을 파악할 수 있습니다. 피크가 있던 구간마다 거리를 측정하면 발생하는 주기를 알 수 있는것입니다. 예를 들어서 환자의 심박수 데이터가 있다면 환자가 어떠한 주기로 심장이 빨리 뛰는지 등을 분석해볼 수 있겠습니다. 두번.. 2021. 3. 24.
[HackerRank] Type of Triangle Write a query identifying the type of each record in the TRIANGLES table using its three side lengths. Output one of the following statements for each record in the table: Equilateral: It's a triangle with sides of equal length. Isosceles: It's a triangle with sides of equal length. Scalene: It's a triangle with sides of differing lengths. Not A Triangle: The given values of A, B, and C don't fo.. 2021. 3. 24.
[Oracle VS Mysql] 중앙값(median) 구하기 해커랭크에서 SQL 관련 문제를 풀면서 알게된 부분을 정리합니다. 다음 문제는 LAT_N 의 중앙값을 구한 후 반올림을 하는 문제이다. 나는 당연히 Median을 사용해서 풀었는데 자꾸 틀렸다고 해서 찾아보니 Mysql에서는 Median 함수가 적용이 안된다고 한다. 언어를 Oracle로 설정하고 풀어보니 한번에 풀어졌다. 그래도 나중에 어떠한 언어를 사용할지 모르기 때문에 Mysql로도 문제를 풀어봤다. 먼저, Oracle로 풀어보자. [Oracle] 중앙값 구하기 SELECT ROUND(MEDIAN(LAT_N,4) FROM STATION; 오라클에서는 다음과 같이 간단하게 함수를 사용해서 구할 수 있다. 하지만 Mysql은 아니었다. ㅠㅠㅠ 참고를 해보니 다양하게 푸는 방법들이 있었고, 복잡도도 다양.. 2021. 3. 23.