본문 바로가기

R8

[R] gregexpr, regmatches(패턴 추출) 텍스트 처리에서 유용하게 사용되는 패턴 추출에 관한 함수들에 대해 알아보도록 하겠습니다. 먼저 우리가 풀어야 할 문제에 대해 알아보도록 하겠습니다. > fls[1] [1] "dws_1/sub_1.csv" fls[1]에는 다음과 같은 문자가 들어있습니다. 여기서 앞에 숫자1은 실험의 횟수를 의미하고, 뒤에 숫자1은 유저의 고유한 번호를 의미합니다. 해당 문자열에서 숫자를 추출하여 따로 저장하는 것이 목표입니다. gregexpr : 함수의 지정되어 있는 표현을 텍스트 전체에서 찾아줍니다. gregexpr 사용법은 다음과 같습니다. gregexpr("패턴", 해당 문자열) 앞의 목표에서 우리는 먼저, 숫자를 출력하는 것이 목표입니다. 그렇기 위해서 정규표현식을 사용해서 숫자 패턴을 정의하도록 하겠습니다. 먼저.. 2021. 4. 12.
[R] assign(객체 생성), get(변수 불러오기) R에서의 assign함수와 get함수에 대해 알아보도록 하겠습니다. assign 함수는 객체, 즉 변수를 생성할때 사용하는 함수입니다. 어떠한 경우 assign함수를 유용하게 사용할 수 있을까요?? 다음과 같은 경로에 폴더가 여러개 존재하고, 이 폴더안에는 또 여러개의 데이터들이 존재한다고 합니다. 모든 데이터를 하나씩 불러오기에는 정말 무리가 있어 보이죠?? 이러한 경우 우리는 assingn함수를 활용할 수 있습니다. 한번 해보도록 합시다. # 경로 설정 setwd("/Users/seominji/Desktop/Unstruct_DA/A_DeviceMotion_data") d 2021. 4. 12.
[R] stringr 패키지 함수 데이터를 가공하면서 문자열 데이터를 다룰때가 있습니다. 오늘은 문자열 데이터를 가공하기 위해서 자주 사용되는 stringr 패키지에서 제공하는 함수를 정리해보도록 하겠습니다. (1) str_length() 문자의 길이를 확인하는 함수입니다. str_length('안녕하세요 빅공이에요') [1] 11 (2) str_sub() 원하는 부분을 추출하는 함수입니다. 다음과같이 원하는 문자가 위치한 부분을 start와 end로 인자를 넣어줍니다. str_sub('안녕하세요 빅공이에요',start=7,end=8) [1] "빅공" (3) str_c() 문자열을 합칠때 사용하는 함수입니다. str_c('안녕하세요 빅공이에요','!') [1] "안녕하세요 빅공이에요!" (4) str_count() 원하는 문자열이 매칭되.. 2021. 3. 8.
[R] paste() 와 file.path() 비교 paste() 함수와 file.path() 함수를 비교해 보도록 하겠습니다. 흔히 두개는 어떠한 두개의 인자를 받았을때 이어 붙여주는 역할을 하는 함수들로 알려져 있습니다. 실제로 한번 간단하게 코딩을해 확인해보도록 하겠습니다. paste("a","b") file.path("a","b") [1] "a b" [1] "a/b" 다음과 같이 결과가 나옵니다. 두가지 모두 두개의 인자를 이어 주는 역할을 하지만 그 이어주는 값 즉, separator의 차이가 존재합니다. paste는 separator 기본값을 설정하지 않으면 " " 으로 처리하게 됩니다. 반면에, file.path는 separator 기본값이 "/"으로 처리하게 됩니다. 만약 paste함수로 separator 값을 /로 사용하고 싶다면 다음과 .. 2021. 3. 6.