본문 바로가기

전체 글153

[R] stringr 패키지 함수 데이터를 가공하면서 문자열 데이터를 다룰때가 있습니다. 오늘은 문자열 데이터를 가공하기 위해서 자주 사용되는 stringr 패키지에서 제공하는 함수를 정리해보도록 하겠습니다. (1) str_length() 문자의 길이를 확인하는 함수입니다. str_length('안녕하세요 빅공이에요') [1] 11 (2) str_sub() 원하는 부분을 추출하는 함수입니다. 다음과같이 원하는 문자가 위치한 부분을 start와 end로 인자를 넣어줍니다. str_sub('안녕하세요 빅공이에요',start=7,end=8) [1] "빅공" (3) str_c() 문자열을 합칠때 사용하는 함수입니다. str_c('안녕하세요 빅공이에요','!') [1] "안녕하세요 빅공이에요!" (4) str_count() 원하는 문자열이 매칭되.. 2021. 3. 8.
[R] paste() 와 file.path() 비교 paste() 함수와 file.path() 함수를 비교해 보도록 하겠습니다. 흔히 두개는 어떠한 두개의 인자를 받았을때 이어 붙여주는 역할을 하는 함수들로 알려져 있습니다. 실제로 한번 간단하게 코딩을해 확인해보도록 하겠습니다. paste("a","b") file.path("a","b") [1] "a b" [1] "a/b" 다음과 같이 결과가 나옵니다. 두가지 모두 두개의 인자를 이어 주는 역할을 하지만 그 이어주는 값 즉, separator의 차이가 존재합니다. paste는 separator 기본값을 설정하지 않으면 " " 으로 처리하게 됩니다. 반면에, file.path는 separator 기본값이 "/"으로 처리하게 됩니다. 만약 paste함수로 separator 값을 /로 사용하고 싶다면 다음과 .. 2021. 3. 6.
시각화 https://jehyunlee.github.io/2020/08/10/Python-DS-25-custom_colormap_code/Matplotlib Colormap Customization (2)matplotlib에서 custom colormap을 만들고 적용하는 방법입니다. 3부로 나누어 1부에 해당하는 본 글에서는 시각적 디자인을, 2~3부에서는 코드 위주로 정리합니다. Creating Colormaps in Matplotlib Matplotlib Customjehyunlee.github.io 자세히 안봤지만 뭔가 좋아보여 2021. 3. 5.
[비정형 데이터 분석] 비정형 데이터란? Introduction 비정형데이터분석 과목을 수강하며 공부한 내용을 정리하는 포스팅입니다. 해당글은 순천향대학교 빅데이터공학과 우지영 교수님이 진행하시는 "비정형데이터분석" 강의를 기반으로 작성되었습니다. 비정형 데이터 1. 비정형 데이터란? 비정형 데이터란 미리 정의된 데이터 모델이 없거나 미리 정의된 방식으로 정리되지 않은 정보라고 위키백과에서 정의하고 있습니다. 그렇다면 비정형 데이터 분석의 최종 목표는 무엇일까요?? 바로 정리되어 있지 않은 자료에서 정돈된 데이터인 즉, Tidy data를 만드는 것입니다. 2. 비정형 데이터 분석 예시 비정형 데이터의 예시로는 어떤한 것들이 있을까요?? 흔히, 텍스트, 음성, 영상등이 있습니다. (1) 텍스트 데이터 분석 텍스트를 조금 더 설명하자면 텍스트는 .. 2021. 3. 3.
머신러닝 춤 가끔씩 교수님이 재밌는 짤들을 올려주시는데 답장하고 싶은데 아무도 안함...ㅠㅠㅠㅠ 2021. 3. 2.
온라인 쇼핑몰 데이터 분석 프로젝트 ################### 쓰자 쓰자 쓰자 제발 내일써야지 내일=한달 이었다. 각 컬럼이 의미하는 바는 다음과 같습니다.💁 데이터 설명InvoiceNo:상품 주문 번호StockCode:상품 아이디Description:상품에 관한 설명Quantity:상품 주문 수량InvoiceDate:상품 주문 날짜UnitPrice:상품 1개의 가격CustomerID:고객 아이디Country:고객이 거주하는 지역🙋 분석 주제 2021. 2. 9.