전체 글

becoming the data engineer
· BIGDATA/R
예제로 개념 잡기 DF
· BIGDATA/R
기술통계( 알까기2을 참조하였습니다. ) a 표준편차 / 표본의 평균 변동계수가 높을 수록 많이 퍼져있는 것.공분산 Cov(x,y) : 다변량의 분산, 즉, 하나 이상의 변수의 분산을 공분산이라 한다. 두 변수의 상관관계를 나타내는 수학식이 있는데 이러한 상관계수가 -1 ~ 1까지의 값을 가진다. 0에 가까울수로 관계가 없고 -1 혹은 1에 가까울수록 두변수의 관계가 긴밀하다 할 수 있다. 표본상관 : r 감마 모집단상관계수 : p(로우) mean(a) #평균median(a) #중앙값range(a) #범위quantile(a) #사분위boxplot(a) # boxplot을 보여주는 함수var(a) #분산sd(a) #표준편차scale(a) #표준화sd(a)/mean(a) #변동계수cor(a,b) #상관계수c..
· STUDY/수학
Chapter 3. 대학수학 [ 수학 기초 ] [해당내용은 방송통신대학교 수업자료를 참조하였습니다.]
· STUDY/수학
Chapter 2. 방정식[해당내용은 방송통신대학교 수업자료를 참조하였습니다.] 이차방정식 함수의 정의 지수함수 로그 로그함수
· STUDY/수학
Chapter 1. 수의 체계[해당내용은 방송통신대학교 수업자료를 참조하였습니다.] 자연수 음수 유리수 무리수
확률기본용어 실험 (Experience)어떤 결과를 발생시키는 행위표본공간 (Sample Space)어떤 실험에서 얻을 수 있는 모든 결과의 집합사건 (Event , 사상 )어떤 실험에서 가능한 한개 이상의 결과. 표본공간의 부분 집합확률 ( Probability )0~1 사이의 숫자, 어떤 사건이 일어날 가능성확률와 오즈 오즈(Odds, 승산) 은 어떤 일이 일어날 가능성을 뜻한다. 예 ) 오즈가 3대1 => 3:1 => 1/4 즉, 오즈가 A대B A:B => A / A + B 어딴 사건의 확률이 X ( 0
· BIGDATA/R
Chapter 3. 모비율에 대한 추론 ############ 모비율에 대한 검정 ############# 한집단의 비율 # 국립 안전심의회(NSC)는 크리스마스와 연초 기간에# 교통사고로 500명이 사망하고 25,000명이 부상을 입는다고# 추정 하였다. NSC는 사고의 50%가 음주 운전으로 발생한다고# 주장 하였다.# 120건의 교통사고를 표본으로 조사한 결과 67건이# 음주운전으로 일어난 사고였다.# • 이 자료를 바탕으로 음주운전으로 일어난 사고의 비율에# 대한 95% 신뢰구간을 구하시오.# • 유의수준 𝛼 = .05에서 NSC의 주장을 검정하시오. # 50% 비율이 정확히 맞는지 모르겠다. rm(list=ls())prop.test(67,120) # probability 0.5 # p-value..
· BIGDATA/R
Chapter 2. 평균에 대한 추론 # 평균에 대한 추론# 추정 : 표본을 통해 모집단 특성을 추측# 가설검정 : 모집단 실제 값이 얼마나 되는가 하는 주장과 관련해서# 표본이 가지고 있는 정보를 이용해서 가설이 올바른지 판점. # 모집단 평균의 구간 추정# 신뢰구간 rm(list=ls()) library(reshape)tips 암이 걸리지 않았는데 걸렸다고 판정.# 제 2종 : 거짓인 가설을 기각 안함. => 암이 걸렸는데 안걸렸다고 판정. # 문제에 따라서 a를 조정할 필요가 있다. # 유의수준(𝛼) 조정t.test(OneSample,mu=8.1,conf.level = 0.99) # 15세 이상 관람가 영화의 평균 관객수를 95% 신뢰구간을 통해 추정# 15세 이상 관람가 영화의 평균을 1,500,..
· BIGDATA/R
Chapter 1. 경영통계 데이터 요약 및 정리 # First Chapter install.packages("reshape")library("reshape") #한 레스토랑의 웨이터가 몇 달간 받은 팁을 기록.tips 범주형으로 보고싶다? 여기서 size는 온 사람들의 수.#factor를 사용.tips$size 도수분표표로 만들어준다. # 원래는 가장 먼저 나오는 순서대로 factor생성(label) tips$day
J_Today
2DH