6.1 Datasets

6.1.1 Salarios

Un investigador ha recopilado los siguientes datos sobre los salarios y las características características de empleo de 49 empleados de una determinada empresa.

  • WAGE = Tasa salarial por mes (dólares reales) ( variable dependiente )
  • EDUC = Años de educación más allá del 8º grado en el momento de la contratación
  • EXPER = Número de años en la empresa
  • AGE = Edad del empleado en años

6.1.2 Alumnas de Estadística

Los datos proceden de 214 alumnas de las clases de estadística de una universidad. Las variables observadas son:

  • Height = estatura autodeclarada por la estudiante, ( variable dependiente )
  • momheight = estimación de la altura de la madre por parte de la estudiante, y
  • dadheight = estimación de la altura del padre por parte de la estudiante.

Todas las alturas están en pulgadas.

6.1.3 Hospitalizados

Los datos proceden de 113 hospitales de Estados Unidos. El objetivo es evaluar los factores relacionados con la probabilidad de que los pacientes de un hospital adquieran una infección mientras están hospitalizados.

Las variables disponibles son:

  • InfctRsk = riesgo de infección, ( variable dependiente )
  • Stay = duración media de la estancia del paciente,
  • Age = edad media del paciente,
  • Xray = medida de cuántas radiografías se realizan en el hospital

6.1.4 Presión Arterial

Los datos correponden a 39 peruanos que se han trasladado de zonas rurales de gran altitud a zonas urbanas de menor altitud. Se dispone de variables posiblemente relacionadas con la presión arterial:

  • Age: edad
  • Years: años en la zona urbana
  • Weight: peso (kg)
  • Height: altura (mm)
  • Chin: pliegue cutáneo de la barbilla
  • Forearm : pliegue cutáneo del antebrazo
  • Calf: pliegue cutáneo de la pantorrilla
  • Pulse: frecuencia de pulso en reposo
  • Systol: presión arterial sistólica ( variable dependiente )

Una variable que se puede construir es: fracción de vida en zona urbana

6.1.5 Dulzor en pastelería

Se ha realizado un experimento diseñado para evaluar cómo el contenido de humedad y el dulzor de un producto de pastelería afectan a la valoración del producto por parte de un catador.

Se estudian ocho combinaciones posibles de cuatro niveles de humedad y dos niveles de dulzor. Se preparan dos pasteles y se califican para cada una de las ocho combinaciones, por lo que el tamaño total de la muestra es n = 16. La variable y es la valoración del pastel. Las dos variables x son la humedad y el dulzor. Los valores (y el tamaño de las muestras) de las variables x se diseñaron de forma que éstas no estuvieran correlacionadas.

6.1.6 Muertes accidentales mensuales en los EEUU

  • Número de muertes accidentales ocurridas mensualmente en Estados Unidos durante 1973-1978.

  • Descargar datos.

6.1.7 Producción mensual de leche

  • Producción mensual de leche de vaca en Estados Unidos (de enero de 1962 a diciembre de 1975).

  • Descargar datos.

6.1.8 Pasajeros aéreos internacionales

  • Pasajeros aéreos internacionales (en miles), de enero de 1949 a diciembre de 1960.

  • Descargar datos.

6.1.9 Accidentes mortales en carretera

  • Muertes mensuales en accidentes de carretera en Nueva Zelanda (de enero de 1997 a diciembre de 2004).

  • Descargar datos

6.1.10 Visitantes extranjeros

  • El número mensual de visitantes extranjeros en Nueva Zelanda. Enero de 1977 a Diciembre de 1995.

  • Descargar datos

6.1.11 Ventas mensuales de vino

  • Ventas mensuales de vino tinto por parte de los viticultores australianos, de enero de 1980 a octubre de 1991 (en kilolitros).

  • Descargar datos

6.1.12 Precio anual del trigo

  • Precio anual del trigo en Europa Occidental de 1500 a 1869

  • Descargar datos

6.1.13 Rendimiento mensual de valores

  • Rendimiento porcentual mensual de los valores públicos británicos durante 21 años.

  • Descargar datos

6.1.14 Temperaturas mensuales

  • Temperaturas de Berlín, 1775-1950, mensuales, grados °C.