본문 바로가기

전체 글153

클럽하우스 사용자 중 팔로워는 누가 많을까? 클럽하우스와 관련한 데이터 시각화를 진행해 보았습니다. 그 전에 먼저 클럽하우스에 대해 알아보도록 하겠습니다. 클럽하우스란? 클럽 하우스는 하나의 주제를 가지고 방을 만들면 관심 분야에 속하는 사람들이 모여 소통하는 어플리케이션입니다. 그렇다면 이 어플리케이션이 이슈할 수 있었던 이유는 무엇일까요? 바로 인플루언서입니다. 클럽 하우스는 CEO, 연예인 등 유명한 사람들과 소통을 할 수 있다는 점에서 이슈가 되고 있습니다. 평소 만나기 어려운 사람들과 대화를 하고 그들의 의견을 들을 수 있다는 점에서 많은 인기를 얻을 수 있었습니다. 다음 그래프는 클럽하우스를 가입한 사람들 수를 누적합계로 나타낸 그래프입니다. 2021년 2월쯤 엄청난 인기를 가지게 되면서 누적 사용자가 급격하게 증가함을 볼 수 있습니다... 2021. 5. 11.
[R] with 함수 with() with( ) 함수는 데이터 프레임 또는 리스트 변수를 변수 이름만으로 접근할 수 있게 해주는 함수입니다. 사용 방법 with(data, expr, ...) 사용방법은 다음과 같습니다. data에 원하는 데이터를 넣어주고, expr에는 적용할 함수를 넣어주면 됩니다. 예제 with(iris, { print(mean(Sepal.Length)) print(mean(Sepal.Width)) }) 장점 with 함수를 잘 활용하면 코드줄의 수를 줄일 수 있겠습니다. 2021. 4. 19.
[R] rfcv(Cross-validation in randomForest) randomForest 패키지에서 10-fold Cross-validation으로 학습을 하려고 했다.처음에는 다음과 같이 createFolds함수를 사용해서 train과 validation을 나누어서 분석을 진행하였다.## 모델 학습(randomForest 사용) # 교차 검증을 10번 진행 set.seed(54321) k_fold 2021. 4. 14.
[R] gregexpr, regmatches(패턴 추출) 텍스트 처리에서 유용하게 사용되는 패턴 추출에 관한 함수들에 대해 알아보도록 하겠습니다. 먼저 우리가 풀어야 할 문제에 대해 알아보도록 하겠습니다. > fls[1] [1] "dws_1/sub_1.csv" fls[1]에는 다음과 같은 문자가 들어있습니다. 여기서 앞에 숫자1은 실험의 횟수를 의미하고, 뒤에 숫자1은 유저의 고유한 번호를 의미합니다. 해당 문자열에서 숫자를 추출하여 따로 저장하는 것이 목표입니다. gregexpr : 함수의 지정되어 있는 표현을 텍스트 전체에서 찾아줍니다. gregexpr 사용법은 다음과 같습니다. gregexpr("패턴", 해당 문자열) 앞의 목표에서 우리는 먼저, 숫자를 출력하는 것이 목표입니다. 그렇기 위해서 정규표현식을 사용해서 숫자 패턴을 정의하도록 하겠습니다. 먼저.. 2021. 4. 12.
[R] assign(객체 생성), get(변수 불러오기) R에서의 assign함수와 get함수에 대해 알아보도록 하겠습니다. assign 함수는 객체, 즉 변수를 생성할때 사용하는 함수입니다. 어떠한 경우 assign함수를 유용하게 사용할 수 있을까요?? 다음과 같은 경로에 폴더가 여러개 존재하고, 이 폴더안에는 또 여러개의 데이터들이 존재한다고 합니다. 모든 데이터를 하나씩 불러오기에는 정말 무리가 있어 보이죠?? 이러한 경우 우리는 assingn함수를 활용할 수 있습니다. 한번 해보도록 합시다. # 경로 설정 setwd("/Users/seominji/Desktop/Unstruct_DA/A_DeviceMotion_data") d 2021. 4. 12.
[프로그래머스 SQL] 입양 시각 구하기(2) 문제 설명 ANIMAL_OUTS 테이블은 동물 보호소에서 입양 보낸 동물의 정보를 담은 테이블입니다. ANIMAL_OUTS 테이블 구조는 다음과 같으며, ANIMAL_ID, ANIMAL_TYPE, DATETIME, NAME, SEX_UPON_OUTCOME는 각각 동물의 아이디, 생물 종, 입양일, 이름, 성별 및 중성화 여부를 나타냅니다. ANIMAL_ID VARCHAR(N) FALSE ANIMAL_TYPE VARCHAR(N) FALSE DATETIME DATETIME FALSE NAME VARCHAR(N) TRUE SEX_UPON_OUTCOME VARCHAR(N) FALSE 보호소에서는 몇 시에 입양이 가장 활발하게 일어나는지 알아보려 합니다. 0시부터 23시까지, 각 시간대별로 입양이 몇 건이나 발생.. 2021. 4. 9.