본문 바로가기
복원추출과 비복원추출에 대한 이야기 (상식)

복원추출과 비복원 추출을 따질 때 아마도 다르게 알고 있을 공산이 큰데, 그것이 무엇이냐면, 복원 추출은 추출 후에 복원하고, 비복원 추출은 추출 후에 복원을 하지 않는다는 막연한 느낌적인 느낌만 가지고 있기 때문에 무엇을 언제 복원하고 복원하지 않는지에 대한 정확한 이해가 없을 가능성이 큽니다.

확실하게 이야기 하자면, 복원 추출이든, 비복원 추출이든 표본을 만들고 나면 복원 시킵니다.
그러면, 무엇이 복원/ 비복원인가 하면,

복원 추출 : n개의 표본을 만들기 위해서 하나 뽑을 때마다 다시 모집단에 복원해 둡니다.

비복원 추출 : n개의 표본을 만들기 위해서 하나 뽑을 때 복원하지 않고 n개를 차례로 뽑습니다. 다 뽑은 후에는 다시 모집단에 복원을 합니다.

이런 식입니다. 아마도 우리가 생각하는 복원 추출은 비복원 추출일 가능성이 크다고 생각합니다. 어떤가요. 그림으로 보면 조금 더 빨리 이해할테니까, 


이런 식 입니다. 이렇게 함으로써, 복원 추출의 경우에는 각 표본이 독립성을 유지할 수 있고, 비복원 추출은 각 표본은 이전에 뽑힌 표본에 영향을 받게 됩니다.

이점은 그냥 상식 정도로 알고 있으면 아는 척 하기 좋은 상식이고, A/B 테스트를 이해할 때도 조금 도움이 될 거라 생각합니다. 

친절한 데이터 사이언스 강좌 글 전체 목차 (정주행 링크) -



댓글





친절한 데이터 사이언스 강좌 글 전체 목차 (정주행 링크) -