6.1 Datasets
6.1.1 Salarios
Un investigador ha recopilado los siguientes datos sobre los salarios y las características características de empleo de 49 empleados de una determinada empresa.
- WAGE = Tasa salarial por mes (dólares reales) ( variable dependiente )
- EDUC = Años de educación más allá del 8º grado en el momento de la contratación
- EXPER = Número de años en la empresa
- AGE = Edad del empleado en años
6.1.2 Alumnas de Estadística
Los datos proceden de 214 alumnas de las clases de estadística de una universidad. Las variables observadas son:
- Height = estatura autodeclarada por la estudiante, ( variable dependiente )
- momheight = estimación de la altura de la madre por parte de la estudiante, y
- dadheight = estimación de la altura del padre por parte de la estudiante.
Todas las alturas están en pulgadas.
6.1.3 Hospitalizados
Los datos proceden de 113 hospitales de Estados Unidos. El objetivo es evaluar los factores relacionados con la probabilidad de que los pacientes de un hospital adquieran una infección mientras están hospitalizados.
Las variables disponibles son:
- InfctRsk = riesgo de infección, ( variable dependiente )
- Stay = duración media de la estancia del paciente,
- Age = edad media del paciente,
- Xray = medida de cuántas radiografías se realizan en el hospital
6.1.4 Presión Arterial
Los datos correponden a 39 peruanos que se han trasladado de zonas rurales de gran altitud a zonas urbanas de menor altitud. Se dispone de variables posiblemente relacionadas con la presión arterial:
- Age: edad
- Years: años en la zona urbana
- Weight: peso (kg)
- Height: altura (mm)
- Chin: pliegue cutáneo de la barbilla
- Forearm : pliegue cutáneo del antebrazo
- Calf: pliegue cutáneo de la pantorrilla
- Pulse: frecuencia de pulso en reposo
- Systol: presión arterial sistólica ( variable dependiente )
Una variable que se puede construir es: fracción de vida en zona urbana
6.1.5 Dulzor en pastelería
Se ha realizado un experimento diseñado para evaluar cómo el contenido de humedad y el dulzor de un producto de pastelería afectan a la valoración del producto por parte de un catador.
Se estudian ocho combinaciones posibles de cuatro niveles de humedad y dos niveles de dulzor. Se preparan dos pasteles y se califican para cada una de las ocho combinaciones, por lo que el tamaño total de la muestra es n = 16. La variable \(y\) es la valoración del pastel. Las dos variables \(x\) son la humedad y el dulzor. Los valores (y el tamaño de las muestras) de las variables \(x\) se diseñaron de forma que éstas no estuvieran correlacionadas.
6.1.6 Muertes accidentales mensuales en los EEUU
Número de muertes accidentales ocurridas mensualmente en Estados Unidos durante 1973-1978.
6.1.7 Producción mensual de leche
Producción mensual de leche de vaca en Estados Unidos (de enero de 1962 a diciembre de 1975).
6.1.8 Pasajeros aéreos internacionales
Pasajeros aéreos internacionales (en miles), de enero de 1949 a diciembre de 1960.
6.1.9 Accidentes mortales en carretera
Muertes mensuales en accidentes de carretera en Nueva Zelanda (de enero de 1997 a diciembre de 2004).
6.1.10 Visitantes extranjeros
El número mensual de visitantes extranjeros en Nueva Zelanda. Enero de 1977 a Diciembre de 1995.
6.1.11 Ventas mensuales de vino
Ventas mensuales de vino tinto por parte de los viticultores australianos, de enero de 1980 a octubre de 1991 (en kilolitros).
6.1.12 Precio anual del trigo
Precio anual del trigo en Europa Occidental de 1500 a 1869
6.1.13 Rendimiento mensual de valores
Rendimiento porcentual mensual de los valores públicos británicos durante 21 años.
6.1.14 Temperaturas mensuales
- Temperaturas de Berlín, 1775-1950, mensuales, grados °C.