오차
니시우치 히로무, 「빅데이터를 지배하는 통계의 힘」- 제4장. '임의화'라는 최강의 무기 활용하기
2014. 4. 29.제4장. '임의화'라는 최강의 무기 활용하기 '관찰'이란 대상을 자세히 보고 측정해 그로부터 어떤 진실을 밝히는 행위이다. '실험'은 다양하게 조건을 바꾼 상태에서 대상을 보고 측정해 그로부터 진실을 밝히는 행위이다.- 앙리 푸엥카레 1. '오차'에 접근하는 세가지 방식 100번 할 때 100번 다 꼭 그렇지만은 않은 현상을 과학적으로 다루고자 할 때 가능한 방법이 세 가지가 있다. 1) 실제 데이터를 전혀 취급하지 않고 단지 가설이나 이런 사례가 있었다는 말만으로 이론모델을 세우는 방식2) '100번 해서 100번 그렇게 된다'는 상황을 설명하기 위해 결과 그렇게 나타난 사례만 보고하는 방식3) 임의화를 활용해 인과관계를 확률적으로 표현하는 방식임의화하면 비교하려는 두 그룹의 모든 조건이 거의 ..
니시우치 히로무, 「빅데이터를 지배하는 통계의 힘」- 3장. 오차와 인과관계가 통계학의 핵심이다.
2014. 4. 29.3장. 오차와 인과관계가 통계학의 핵심이다. 1. 구체적인 행동으로 이끌어내려면 다음 '세가지 질문'에 답할 수 있어야 한다. [질문1] 어떤 요인을 변화시켜야 이익이 향상될까?[질문2] 그런 변화를 일으키는 행동이 실제로 가능한가?[질문3] 그에 따르는 비용이 이익을 상회할까? 이 세가지 질문에 답할 수 있을 때 비로소 '실행해서 이익을 향상시키자'라는 계획을 할 수 있다. 2. 통계학을 더 정밀하게 만든 '카이제곱검정'과 'p-' 값의 등장 '실제는 아닌데도 오차나 우연에 의해 데이터와 같은 차이(정확히는 그 이상의 극단적인 차이를 포함)가 생길 확률'을 통계학 전문용어로p- 값이라고 한다. p- 값이 작을 때(5% 이하) 과학자들은 '이 결과는 우연히 얻어졌다고 생각하기 어렵다' 또는 '유의하다'라..