다중회귀분석 예제 r
y posteado en Sin categoría

마지막으로 숫자 변수의 분포를 살펴볼 가치가 있습니다. 분포가 크게 다른 경우 켄달 또는 스피어맨 상관 관계를 사용하는 것이 더 적합할 수 있습니다. 또한 독립 변수가 종속 변수와 분포가 다른 경우 독립 변수를 변환해야 할 수 있습니다. 이 예제에서는 Longnose, Acreage, Maxdepth, NO3 및 SO4가 비교적 로그-보통 분포인 반면 DO2 및 Temp는 분포에서 비교적 정상입니다. 이 경우 이러한 변수를 모두 비슷한 분포(여기에 표시되지 않음)가 되도록 변환하는 것이 좋습니다. 따라서 두 개의 독립/입력 변수를 기반으로 가상 경제의 stock_index_price(종속 변수)를 예측하는 것이 목표인 간단한 예제부터 시작하겠습니다. 예측 변수가 두 모델에 공동으로 기여하는지 여부를 결정할 때 이러한 공분산을 고려해야 합니다. 예를 들어 PR 및 DIAP의 효과는 경계선을 보입니다. 그들은 TOT에 대 한 중요 한 표시 하지만 AMI에 대 한 덜 그렇게. 그러나 두 개의 별도 회귀에서 결과를 눈으로 볼 충분하지 않습니다! 우리는 공식적으로 그들의 포함에 대 한 테스트 해야. 그리고 이 테스트에는 두 모델의 계수 간의 공분산이 포함됩니다.

비교된 모델 중 하나는 다른 모델 내에 중첩되어야 합니다. 즉, 한 모델은 추가 용어를 제외하고 다른 모델과 동일해야 합니다. 예를 들어 아래 모델 집합에서 model.7과 model.4를 비교하는 것이 적절합니다. 또는 각 모델.8, model.9 및 model.10과 model.7을 비교합니다. 또한 출력에는 두 개의 사각형 과 제품 행렬의 합계가 포함되며, 하나는 가설에 대한 것이고 다른 하나는 오류에 대한 것입니다. 이러한 행렬은 네 가지 테스트 통계를 계산하는 데 사용됩니다. 이러한 행렬은 lh.out 개체에 SSPH(가설) 및 SSPE(오류)로 저장됩니다. 이를 사용하여 테스트 통계를 수동으로 계산할 수 있습니다.

예를 들어 SSPH = H 및 SSPE = E를 허용합니다. Wilks 테스트 통계에 대한 공식은 유튜브 및 Facebook 예측 변수인 조정된 R2 = 0.89를 예로 들며, 이는 “매출 측정치의 89%가 유튜브 및 Facebook 광고 예산에 의해 예측될 수 있음을 의미합니다. 이 예제에서는 F-통계의 p-값이 ###————————————————————– ### 다중 상관 관계 및 회귀, 스트림 설문조사 예제 ###pp임을 알 수 있습니다.

Compartir este contenido...
Tweet about this on TwitterShare on FacebookShare on Google+Email this to someone
Los Comentarios están cerrados.