Statistics10 모분산은 n, 표본분산은 n-1 2021. 10. 21. Hypothesis Testing Is there a difference between the voting preferences of 40-years olds and those of 80-year-olds -> two Do hambugers have more calories than hot dogs, on average-> right Does there tend to be more than 12 fuid ounces of soda per can-> right Do cats tend to live longer than dogs ->right Is there evidence to conclude that belgian workers tend to make less income than ltalian workers ->left Should w.. 2021. 10. 20. 선형 회귀 정리 1 2021. 10. 2. Leverage vs Influence 선형회귀에서의 이상치, Leverage, Influence에 대해서 정리해보자... 먼저 이상치는 다른 데이터들보다 멀리 떨어져 있는 값으로 극단값이라고 부른다. 이상치를 제거했을때 우리가 추정한 회귀선이 크게 변하게 된다면?? 이 값은 영향력이 있는 점이라고 할 수 있다. 다시 말하자면 Influence가 high 하다라고 말할 수 있다. 두 그래프를 비교해보자. 두개의 회귀선은 이상치를 포함 o, 포함 x를 의미한다. 왼쪽그래프는 이상치가 있고 없고에 따라서 회귀선의 차이가 약간 있다. 반면에 오른쪽 그래프는 이상치에 따라서 회귀선이 많이 변함을 볼 수 있다. 따라서 두개의 이상치중에서 왼쪽 이상치는 Some Influence를 가지고 오른쪽 이상치는 High Influence를 가진다고 할 수 있다.. 2021. 9. 12. 이전 1 2 3 다음