ESTADÍSTICA

INTRODUCCIÓN
La Estadística es la rama de las matemáticas que organiza, analiza e interpreta la información obtenida de la recolección de datos relacionados con una población. Estos datos pueden ser cuantitativos (numéricos) o cualitativos (características)
La Estadística Descriptiva estudia exclusivamente la recolección y descripción de datos numéricos, mientras que la Estadística Inferencial interpreta, deduce y prevee las tendencias del comportamiento de una población.

POBLACIÓN Y MUESTRA
En la práctica con frecuencia estamos interesados en obtener conclusiones válidas sobre un grupo grande de individuos u objetos. En lugar de examinar el grupo completo, llamado población, examinamos solamente una pequeña parte de la población, la cual llamamos muestra.
La población puede ser finita o infinita, siendo su número el tamaño de la población. De manera similar, el número de la muestra se denota por tamaño de la muestra o tamaño muestral, y generalmente es finito.

MUESTREO CON O SIN REMPLAZO
Tomar muestras en donde cada miembro de la población puede escogerse más de una vez se llama muestreo con remplazo. Mientras que tomar muestras en donde cada miembro no puede escogerse más de una vez se llama muestreo sin remplazo.

MUESTRAS ALEATORIAS
La confiabilidad de las conclusiones obtenidas concernientes a una población depende de si la muestra se tomó adecuadamente, para que represente a la población suficientemente bien. Uno de los problemas importantes de la inferencia estadística es precisamente cómo obtener una muestra.
Una manera de hacer esto es asegurar que cada miembro de la población tenga la misma probabilidad de estar en la muestra, lo cual se denomina muestra aleatoria, cuyos elementos se seleccionan de la población entera con base en el azar. Esta selección es semejante a la extracción aleatoria de números en un sorteo. Sin embargo, en el muestreo estadístico suele emplearse una tabla de números aleatorios o un programa de cómputo generador de números aleatorios para identificar los elementos numerados de la población que serán seleccionados para la muestra.

VARIABLES DISCRETAS Y CONTINUAS
Una variable discreta puede tomar valores enteros exclusivamente, mientras que la variable continua puede tomar valores fraccionarios a lo largo de un intervalo especificado.

PARÁMETRO DE LA POBLACIÓN Y ESTADÍSTICO MUESTRAL
Se considera que una población es conocida cuando sabemos la distribución de probabilidad de una variable aleatoria relacionada con la población. Las medidas asociadas a esa variable se denominan con frecuencia parámetros poblacionales, ejemplos de ellos son la media aritmética, la varianza, etc.
Podemos tomar muestras aleatorias de la población y luego usarlas con el fin de obtener valores que ayuden a estimar y probar hipótesis sobre los parámetros de la población.
Cualquier medida que se obtenga a partir de una muestra tomada con el propósito de calcular un parámetro de la población se llama estadístico muestral o simplemente estadístico. En general a cada parámetro poblacional le corresponde un estadístico que se calcula a partir de la muestra y se denotan con letras griegas los primeros y con latinas los segundos.

TIPOS DE COLECCIONES DE DATOS
La primera decisión que es necesario tomar ante una colección de datos es el tipo de distribución de frecuencias a elegir. Esto depende fundamentalmente del número de datos que componen la colección así como de su frecuencia o diversidad, pudiendo clasificarse en tres tipos: aislados, repetidos o agrupados.

ESTADÍSTICOS
Hay diversas formas de proporcionar una información general de los datos. Una es mediante elementos visuales (gráficas), otra es utilizar ciertas descripciones numéricas de los datos: Para nuestro estudio estos estadísticos se clasifican en tres tipos principales: gráficas, medidas de centralización o posición y medidas de dispersión. Los estadísticos que vamos a estudiar son:
Gráficas
Histograma, polígono de frecuencias, ojiva, histograma porcentual, polígono de frecuencias porcentuales, ojiva porcentual y gráfica circular.
Medidas de centralización
Media aritmética, mediana, moda, media geométrica, media armónica, Cuartiles, deciles y percentiles.
Medidas de dispersión
Rango, desviación media, desviación estándar y varianza.

DISTRIBUCIONES DE FRECUENCIAS
Una distribución de frecuencias es una tabla en la cual se agrupan en clases valores posibles de una variable y donde se registra el número de valores observados correspondientes a cada clase. Se reconocen principalmente dos tipos de distribuciones de frecuencias: la de datos repetidos u ordenados y la de datos agrupados en clases.

INTERVALOS DE CLASE
En cada una de las clases de una distribución de frecuencias, los límites nominales de clase inferior y superior indican los valores incluidos en cada clase. Los límites reales de clase son los puntos específicos que sirven para separar clases adyacentes en una escala de medición de variables continuas. Los límites reales de clase pueden determinarse identificando los puntos intermedios entre los límites nominales superior e inferior, respectivamente, de clases adyacentes. El intervalo de clase (con límites reales), determina el rango de valores incluido dentro de una clase.


Medidas de centralización, posición o tendencia central.

Media aritmética. Dada una colección de datos, la media aritmética se define como el promedio de los datos, es decir la suma de los datos entre el número de datos.

Mediana. Se define como el dato central o el promedio de datos centrales en una colección ordenada en orden de magnitud.

Moda. Se define como el dato que más se repite. En una colección puede no haber moda, tener sólo una o bien varias modas.




TÉCNICAS DE CONTEO

INTRODUCCIÓN
En este capítulo se analizarán algunas técnicas para determinar el número de resultados posibles de un experimento o evento particular, o el número de elementos de un conjunto determinado, sin enumerarlo directamente. Un conteo como éste se denomina algunas veces análisis co0mbinatorio.

PRINCIPIOS BÁSICOS DE CONTEO
Hay dos principios básicos de conteo que se utilizarán a lo largo de este capítulo, uno comprende la adición y otro la multiplicación.
Principio de adición. Supongamos que un evento E puede ocurrir en m formas y un segundo evento F puede ocurrir en n formas, y supongamos que ambos eventos no pueden ocurrir en forma simultánea (disjuntos o mutuamente excluyentes). Entonces E o F pueden ocurrir en m + n formas.
Principio de multiplicación. Supongamos que un evento E puede ocurrir en m formas e independientemente de este evento, un evento F puede ocurrir en n formas. Entonces las combinaciones de los eventos E y F pueden ocurrir en mn formas.
Claramente estos principios pueden ampliarse a tres o más eventos.

PERMUTACIONES SIMPLES
Cualquier ordenamiento de un conjunto de n objetos en un orden dado se denomina una permutación de los objetos (tomados todos a la vez) (nPn). Cualquier ordenamiento de r ≤ n de estos objetos en un orden determinado se denomina una permutación de n objetos tomados de r a la vez (nPr).
Teorema: nPr = n!/(n – r)!
Siendo x! (se lee x factorial) un elemento que se define como el producto de todos los enteros positivos menores o iguales a x.
Nota: En particular se define 0! = 1! = 1
Corolario: nPn = n!

PERMUTACIONES CON REPETICIÓN.
Frecuentemente se desea conocer el número de permutaciones de un multiconjunto, es decir, un conjunto de objetos algunos de los cuales no son diferenciables.
Teorema: nPp,q, r… = n!
p! q! r! …

PERMUTACIONES CIRCULARES
Cuando los elementos que se ordenan se colocan en círculo, se dice que las permutaciones son circulares.
Teorema: nPcn = nPn = (n – 1)!
n

nPcr = nPr
r

COMBINACIONES
Supongamos que tenemos una colección de n objetos. Una combinación de estos n objetos, tomados r a la vez, es cualquier colección de r objetos en donde el orden no cuenta.
Teorema: nCr = n!
r! (n – r)!

DIAGRAMA DEL ÁRBOL
Un diagrama del árbol es un mecanismo utilizado para enumerar todos los resultados posibles de una secuencia de experimentos o eventos donde cada evento puede ocurrir en un número finito de formas.

DIAGRAMAS DE VENN
Las técnicas ya conocidas en la representación de conjuntos son también excelentes auxiliares para determinar el número de formas en que cierto evento puede ocurrir. Las operaciones con conjuntos como la unión, intersección, complemento, complemento relativo, etc., serán de gran importancia en este capítulo y en la determinación de probabilidades de eventos compuestos.



Temario