본문 바로가기

분류 전체보기153

HTML 구조 HTML 구조 👉 HTML이란? HTML(HyperText Markup Language)은 웹을 이루는 가장 기초적인 구성 요소입니다. HTML은 웹 콘텐츠의 의미와 구조를 정의할 때 사용합니다. 우리는 F12를 누르면 다음과 같은 창을 볼 수 있습니다. 이것이 바로 HTML구조입니다. HTML을 보면 우리는 웹사이트가 어떠한 형태로 구성되어 있는지 파악할 수 있고, 이를 활용하여 원하는 데이터의 구조와 위치를 파악하여 데이터를 수집하게 됩니다. 👉 HTML 태그 HTML에 담겨있는 구성 요소들은 마크의 역할을 하는 '태그'로 감싸져 있습니다. 가장 기본적으로 HTML은 아래와 같이 작성합니다. 내용 내용 시작과 끝이 하나의 쌍으로 구성되어 있으며 그 사이에 내용들이 포함되어 있습니다. 여기서 시작과 끝.. 2021. 1. 17.
크롤링 종류(정적 VS 동적) 크롤링이란? 크롤링(crawling) 또는 스크레이핑(scraping) 은 웹 페이지를 가져와서 데이터를 추출해 내는 방법을 말합니다. 이렇게 크롤링하는 소프트웨어를 크롤러(crawler) 라고 합니다. 크롤링의 중요성 그렇다면 크롤링은 왜? 중요할까? 예를 들어서 인기 있는 화장품에 관한 정보를 수집하고 싶다고 가정을 해보자. 우리는 데이터를 수집하기 위해서 복사 붙여넣기를 반복하는 작업을 해야한다. 이러한 작업을 자동으로 해결할 수 있다면?? 일을 훨씬 더 빠르게 처리할 수 있다. 크롤링 활용사례 세상에는 많은 양, 다양항 데이터가 존재한다. 그렇기 때문에 크롤링도 다양한 분야에서 활용할 수 있다. 어떠한 기업에서는 크롤링 담당 분서가 따로 존재한다고 한다. 예를들면 마케팅과 관련하여 개선점을 파악하.. 2021. 1. 17.
2020 Kaggle Survey (kaggle survey_Now and After) 📝 캐글에서는 2017년부터 설문조사를 시작하였습니다. 2020년에도 설문조사를 실시했으며 이 데이터를 분석하여 인사이트를 찾아보고자 분석을 진행하였습니다. 질문에 따라 카테고리를 분류하여 분석 결과를 공유하고자 합니다. 캐글 설문지에서는 캐글러들에게 똑같은 질문 내용을 가지고 지금 현재와 향후 2년에 대한 생각을 묻는 질문들이 있습니다. 이 두가지의 질문을 비교하면서 생각의 변화가 있는지에 대해 분석을 해보도록 하겠습니다. ✏️ Now and After Q26 cloud computing platforms 클라우드 컴퓨팅에 관한 질문입니다. 현재는 AWS, GCP에 익숙해져 있는 사람들이 많고 다음으로 사용하지 않는 사람들이 많이 있습니다. 하지만 2년후에는 Microsotf Azure에 익숙해지길 원.. 2021. 1. 14.
2020 Kaggle Survey (kaggle survey_Company) 📝 캐글에서는 2017년부터 설문조사를 시작하였습니다. 2020년에도 설문조사를 실시했으며 이 데이터를 분석하여 인사이트를 찾아보고자 분석을 진행하였습니다. 질문에 따라 카테고리를 분류하여 분석 결과를 공유하고자 합니다. 이번 시간에 공유할 주제는 캐글러들의 회사 특징에 관한 내용입니다. ✏️Company of the Kaggler Q20 What is the size of the company where you are employed? 캐글 사용자들이 고용되고 있는 회사 규모에 관한 질문입니다. 50명 미만의 사원들이 있는 회사를 다니고 있는 사람들이 많았습니다. Q21 Approximately how many individuals are responsible for data science worklo.. 2021. 1. 13.