A/B 테스팅과 '여러 팔 강도' 문제 1. A/B 테스팅 최근 인터넷을 이용한 상거래가 활발해지면서 'A/B 테스팅'이라는 아이디어가 인기를 얻게 되었다. A/B 테스팅은 메뉴, 문구, 광고 등을 고객마다 A안과 B안으로 다르게 보여주고 가장 반응이 좋은 안을 선택하는 방법이다. 꼭 2가지 안만이 아니라 다양한 안을 보여주는 경우도 포함한다. A/B 테스팅은 과학계에서 사용하는 무작위 대조군 시험(randomized controlled trial: RCT)과 동일한 것이다. 예를 들어 의학에서 약의 효과를 검증할 때는 환자들을 무작위로 나누고 일부 환자들에게는 진짜 약을 주고, 다른 환자들에게는 가짜 약을 준다. 기초 통계학에서 배우는 t-검정, 카이제곱 검정 등은 이런 문..
BIGDATA/통계기초
확률기본용어 실험 (Experience)어떤 결과를 발생시키는 행위표본공간 (Sample Space)어떤 실험에서 얻을 수 있는 모든 결과의 집합사건 (Event , 사상 )어떤 실험에서 가능한 한개 이상의 결과. 표본공간의 부분 집합확률 ( Probability )0~1 사이의 숫자, 어떤 사건이 일어날 가능성확률와 오즈 오즈(Odds, 승산) 은 어떤 일이 일어날 가능성을 뜻한다. 예 ) 오즈가 3대1 => 3:1 => 1/4 즉, 오즈가 A대B A:B => A / A + B 어딴 사건의 확률이 X ( 0
데이터의 통계적 기술 중심성향의 측도 데이터의 대적인 값을 나타내는 수치. ex) 산술평균, 가중평균, 중앙값, 최빈값 등이 있다. 산포의 측도 데이터가 퍼져있는 정도를 나타내는 수치. ex) 범위, 분위수, 평균절대편차(MAD), 분산과 표준편차 등이 있다. 모집단의 특성 => 모수, 파라미터 표본의 특성 => 통계량 산술평균 데이터의 합을 데이터의 수로 나누는 것. ∑ Xi ÷ N - 모집단의 평균 : µ (뮤) , 표본의 평균 : X bar ( X 바 ) 가중평균 어떤 값이 다른 값보다 중요할때 각 수치에 따른 가중치를 다르게 두어 평균을 구하는 방법. X w = ∑(wi * Xi) / ∑wi * wi : 가중치 중앙값 값과 상관없이 데이터 개수가 같아지게 되는 값 ( 양분 하는 곳에 있는 데이터 ..