Preview only show first 10 pages with watermark. For full document please download

Estadistica.docx

Ejercicio 17 (Libro Gutiérrez, De la Vara) Considere un modelo de regresión lineal múltiple con cuatro variables: ?? = ?0 + ?1 ?1? + ?2 ?2? + ⋯ ?4? + ?? ; ? = 1,2 … , ? y suponga que para estimar los parámetros se utilizaron un total de 12 observaciones, es decir, ? = 12. Conteste las siguientes preguntas: a) Explique en forma esquemática el procedimiento matemático para estimar los parámetros que minimizan los errores por mínimos cuadrados. Teniendo en cuenta el esquema matemátic

   EMBED


Share

Transcript

  Ejercicio 17 (Libro Gutiérrez, De la Vara) Considere un modelo de regresión lineal múltiple con cuatro variables:     +    +    +⋯   +  ; 1,2…,  y suponga que para estimar los parámetros se utilizaron un total de 12 observaciones, es decir, 12 . Conteste las siguientes preguntas: a)   Explique en forma esquemática el procedimiento matemático para estimar los parámetros que minimizan los errores por mínimos cuadrados. Teniendo en cuenta el esquema matemático general para este modelo, se tiene:     +    +    +⋯     +  ;     + ∑   = +  , 1,2….12; 4 Los datos se pueden estructurar en la siguiente tabla: Para hallar los estimadores de mínimos cuadrados para   , se deben minimizar los errores, por tanto se despejan, se elevan al cuadrado y se suman. Esto significa que la función queda de la siguiente manera: S∑ =  ∑(    ∑   = ) =   b)   Denote el modelo en forma matricial: + , exprese con precisión todas las matrices involucradas en el modelo. [    ⋮  ]    [    ⋯      ⋯  ⋮⋮⋮⋯⋮      ⋯   ]   [    ⋮  ]   [    ⋮  ]              …                   …                   …       ⋮   ⋮   ⋮   ⋮                 …        c)   Proporcione la expresión matricial para los estimadores de mínimos cuadrados. El estimador de mínimos cuadrados de   es (′) −  ′  El estimador de mínimos cuadrados de       ý′′   d)   Especifique la hipótesis de significancia del modelo y lo que significa aceptar o rechazar esta hipótesis. Para este modelo se tiene:   :          0     :   0  donde  1…4     :   ≠0  para al menos una    El rechazo de la Hipótesis Nula (   )  implica que por lo menos una de las variables independientes o regresoras   ,   , …,   contribuye significativamente a este modelo. Si la hipótesis se acepta quiere decir que los coeficientes de estas variables son igual a cero y ningún término o variable en el modelo tiene una contribución significativa al explicar la variables respuesta. e)   Dé la expresión del estadístico de prueba   , para la hipótesis anterior, así como una explicación racional de porqué funciona como estadístico de prueba, es decir, vea cuando este estadístico tiene valores grandes o pequeños, y lo que significa en términos de calidad de ajuste. El estadístico de prueba está dado por la siguiente ecuación:     ⁄  (1)⁄             4 (  )        ó              La hipótesis nula se rechaza si   > (∝,,−−) , o si el valor (>  )<∝,  lo que significa que entre más pequeño sea este estadístico, tiende a ser menor que el valor de rechazo o significancia del problema. Esto conlleva a que entre mayor sea    tiende a ser grande el estadístico    lo que significa que las constantes del modelo son grandes y por ende hay una significancia de las variables. En otras palabras si    tiene un valor grande, es mejor la capacidad de predicción o de calidad de ajuste, si es menor, se tiene una baja capacidad de predictibilidad. f)   Formule las hipótesis sobre los parámetros individuales del modelo y comente qué significa Las hipótesis para probar la significación de los coeficientes de regresión individual   , como su mismo nombre lo indica, se calculan de manera independiente para cada uno de ellos. Estas hipótesis corresponden a:   :   0  donde  1…4     :   ≠0  Si   :   0  se rechaza, esto indica que la variable    puede eliminarse del modelo porque no es significante en él. g)   Proporcione la expresión para el estadístico de prueba para el caso Se tiene en cuenta el estadístico de prueba T-Student con n2 grados de libertad. Este estadístico se calcula como el cociente entre el estimados y su error estándar.     √ ̂     El valor de este estadístico es utilizado para contrastar la hipótesis de que el coeficiente es igual a cero (H 0 : β = 0 frente a H a : β ≠ 0). La hipótesis nula se rechaza si |  |> ∝⁄,−− , lo que significa que entre el valor de este estadístico sea más grande, tiende a ser mayor que el valor crítico obtenido en tablas de distribución T-Student, entonces se encuentra en el área de aceptación.  h)   ¿Cuáles son los riesgos de hacer predicciones fuera de la región de los datos srcinales? Fuera de la región, los aspectos físicos o sociales que están atrás de todo modelo de regresión pueden empezar a actuar de otra forma, muy fuera de la región de los datos srcinales empiezan a actuar otros fenómenos no considerados en el modelo srcinal. Este riesgo es más grande en el análisis de regresión múltiple, ya que se trabaja con regiones multidimensionales. Ejercicio 18 (Libro Gutiérrez, De la Vara) En una empresa dedicada a anodizar artículos de aluminio (baterías de cocina), el anodizado se logra con una solución hecha a base de ácidos (sulfúrico, cítrico, bórico) y dicromato de aluminio. En este proceso se controla el PH de la solución, la temperatura, la corriente y el tiempo de permanencia. Debido al poco grosor del anodizado, han aumentado las quejas por la escasa resistencia y durabilidad del producto. Para resolver este problema se decide estudiar, mediante un experimento, la relación del PH y la temperatura con el grosor anodizado. Los datos se muestran en la siguiente tabla: PH Temperatura Espesor 1.2 -8 9 1.8 -8 14 1.2 8 10 1.8 8 19 1.2 -8 8 1.8 -8 12 1.2 8 11 1.8 8 20 1.5 0 14 1.5 0 13 a) ¿Cuáles son las variables independientes y cuál es la variable dependiente? Argumente. R/a.  Las variables independientes son la temperatura y el PH de la solución, debido a que son las que ocasionan la variabilidad en el espesor del anodizado y por lo general están controladas en el proceso: 1  X  : PH 2  X  : Temperatura  Y: Espesor