본문 바로가기

분류 전체보기153

구글 코랩과 캐글 연동하기 코랩에서 캐글 데이터를 분석할때 캐글에서 데이터를 다운받은 후 코랩 경로로 저장시켜 분석을 진행하였다. 이 과정이 조금 귀찮다?는 생각이 들어서 코랩과 캐글 연동에 관해 찾아보니 역시 연동을 하는 방법이 있었다. 까먹지 않기 위해 정리해보도록 하자. 1. 캐글 계정에서 API 다운 받기 먼저 캐글 사이트에 로그인을 한 후 Accoount 메뉴를 선택합니다. Create New API Token 을 클릭하여 토큰 파일을 다운받습니다. 해당 파일은 json 파일 입니다. 2. Token 파일 업로드 !pip install kaggle from google.colab import files files.upload() 다음 코드를 코랩화면에서 입력합니다. 실행을 하면 다음과 같은 화면이 뜨는데 파일 선택을 누르.. 2021. 3. 22.
웹사이트 간단히 구현하기 youtube.com/watch?v=JLVB8ZUPojw&feature=share Streamlit이라는 패키지를 사용해서 간단하게 웹페이지를 만들어준다고 한다. 신기하다!! 아직 실습을 안해봤는데 해봐야징 아직은 불안정하지만 기대가 많이 된다고 하네욤 2021. 3. 21.
추천시스템 글 hoondongkim.blogspot.com/2019/03/recommendation-trend.html 추천(Recommendation) 시스템 - 알고리즘 Trend 정리 BigData / AI 기술과 각종 정보를 공유하는 김훈동의 블로그 입니다. hoondongkim.blogspot.com 좋아보임 읽어야지 2021. 3. 21.
[비정형 데이터] 중심화 경향 값 Introduction 비정형데이터분석 과목을 수강하며 공부한 내용을 정리하는 포스팅입니다. 해당글은 순천향대학교 빅데이터공학과 우지영 교수님이 진행하시는 "비정형데이터분석" 강의를 기반으로 작성되었습니다. 비정형 데이터를 분석할때 원본 데이터로는 어떠한 특징을 파악하기 어려운 경향이 있습니다. 따라서 우리는 원본 데이터에서 대표하는 값들을 활용하여 분석하는 것이 필요합니다. 일반적으로 우리는 통계치들을 활용해서 대표값들을 추출할 수 있습니다. 데이터의 종류에 대한 도메인 지식이 포함된다면 통계치 의외에도 다른 의미있는 값들을 추출할 수 있습니다. 지금은 도메인 지식이 없다고 가정을 하고 일반적으로 많이 사용하는 통계치들에 대해 알아보도록 하겠습니다. 크게 중심화 경향, 퍼짐 정도, 분포형태와 대칭정도로.. 2021. 3. 21.