본문 바로가기

Data Analysis7

클럽하우스 사용자 중 팔로워는 누가 많을까? 클럽하우스와 관련한 데이터 시각화를 진행해 보았습니다. 그 전에 먼저 클럽하우스에 대해 알아보도록 하겠습니다. 클럽하우스란? 클럽 하우스는 하나의 주제를 가지고 방을 만들면 관심 분야에 속하는 사람들이 모여 소통하는 어플리케이션입니다. 그렇다면 이 어플리케이션이 이슈할 수 있었던 이유는 무엇일까요? 바로 인플루언서입니다. 클럽 하우스는 CEO, 연예인 등 유명한 사람들과 소통을 할 수 있다는 점에서 이슈가 되고 있습니다. 평소 만나기 어려운 사람들과 대화를 하고 그들의 의견을 들을 수 있다는 점에서 많은 인기를 얻을 수 있었습니다. 다음 그래프는 클럽하우스를 가입한 사람들 수를 누적합계로 나타낸 그래프입니다. 2021년 2월쯤 엄청난 인기를 가지게 되면서 누적 사용자가 급격하게 증가함을 볼 수 있습니다... 2021. 5. 11.
구글 코랩과 캐글 연동하기 코랩에서 캐글 데이터를 분석할때 캐글에서 데이터를 다운받은 후 코랩 경로로 저장시켜 분석을 진행하였다. 이 과정이 조금 귀찮다?는 생각이 들어서 코랩과 캐글 연동에 관해 찾아보니 역시 연동을 하는 방법이 있었다. 까먹지 않기 위해 정리해보도록 하자. 1. 캐글 계정에서 API 다운 받기 먼저 캐글 사이트에 로그인을 한 후 Accoount 메뉴를 선택합니다. Create New API Token 을 클릭하여 토큰 파일을 다운받습니다. 해당 파일은 json 파일 입니다. 2. Token 파일 업로드 !pip install kaggle from google.colab import files files.upload() 다음 코드를 코랩화면에서 입력합니다. 실행을 하면 다음과 같은 화면이 뜨는데 파일 선택을 누르.. 2021. 3. 22.
웹사이트 간단히 구현하기 youtube.com/watch?v=JLVB8ZUPojw&feature=share Streamlit이라는 패키지를 사용해서 간단하게 웹페이지를 만들어준다고 한다. 신기하다!! 아직 실습을 안해봤는데 해봐야징 아직은 불안정하지만 기대가 많이 된다고 하네욤 2021. 3. 21.
Tidy Data(깔끔한 데이터) 비정형데이터 과목을 수강하면서 교수님께서 Tidy Data를 언급하셨다. 데이터 분석을 하기 위해서는 Tidy Data 즉, 깔끔한 데이터가 필요하다. 이러한 깔끔한 데이터 형태를 만들기 위해서는 우리는 데이터 전처리, 변환등의 과정을 거치게 되는데 실제로 이 단계에서 정말 많은 시간이 소요된다. 그만큼 중요하다는 의미도 있다. Tidy Data가 깔끔한? 정리된? 데이터라고는 알고있었지만, 좀 더 정확한 의미와 정의를 알아보고 싶어 찾아보았다. 찾아보면서 Tidy Data와 관련한 논문이 있어 그 논문을 리뷰하는 형태로 Tidy Data에 대해 정리하고자 한다. 리뷰해볼 논문은 Hadley Wickham의 논문이다. 먼저, 논문에서는 말하고 있는 Tidy Data에 대해 한줄로 정의를 하자면 다음과 같.. 2021. 3. 18.