martes, 4 de agosto de 2009

ESTADISTICA

1.1 ESTADISTICA MODERNA
El estudio de estadística es acerca de información: cómo se obtiene, cómo se analiza y cómo se interpreta.
El desarrollo de la estadística se fundamenta científicamente a partir de los años 30´s, a raíz de los problemas planteados en la sociedad industrial, por el desarrollo de otras ramas de las matemáticas y de otros campos como la biología, medicina, informática, etcétera.
La estadística se ha convertido en un método efectivo para describir con exactitud los valores de los datos económicos, políticos, sociales, psicológicos, biológicos y físicos; además sirve como herramienta para relacionar y analizar dichos datos. El trabajo del experto estadístico consiste en reunir y tabular los datos en el proceso de interpretación de esa información.
Muchos conjuntos de datos se pueden aproximar, con gran exactitud utilizando determinadas distribuciones probabilísticas, los resultados de éstas pueden utilizar para analizar datos estadísticos.
La probabilidad también es útil para comprender la fiabilidad y confiabilidad de las inferencias estadísticas y para predecir el tipo y la cantidad de datos necesarios en unos estudios estadísticos determinados.
Su tarea fundamental es el análisis de datos con el objetivo de representar la realidad y transformarla, predecir su futuro o simplemente conocerlo.
La estadística responde a:
Las necesidades bélicas y fiscales de los gobernantes.
La actividad planificadora de la sociedad como instrumento para identificar injusticias sociales y para producir información en el llamado estado de bienestar.
Nuevas demandas sociales para realizar investigaciones sobre temas sociales.
Necesidades del desarrollo científico y tecnológico de la sociedad.
Las técnicas de investigación de mercados que permiten saber si un producto cualquiera será bien acogido en el mercado antes de su salida a este o bien medir la audiencia en televisión, radio, etc.
El control de calidad
Estudios estadísticos aplicados a la pesca y a la agricultura
En medicina e investigación farmacológica
Se puede tener una mejor comprensión de fenómenos
1.2 DEFINICION DE ESTADISTICA
Estadística proviene de la palabra italiana “statista” que significa expresión.
La estadística es el manejo de datos para su análisis posterior en la toma de decisiones y el control de calidad.
Se utiliza en la mayoría de los departamentos de una empresa ya que en todos ellos se obtienen datos.
1.3 TIPOS DE INFORMACION Y GRAFICAS
1.3.1 POBLACION Y MUESTRA
POBLACION: conjunto de elementos que poseen determinadas características que los definen perfectamente. Puedes ser finita o infinita.
CENSO: es cuando se obtienen todos los datos, ya que toma en cuenta a toda la población, su estudio se tarda mucho más tiempo que la muestra, es más costoso y si las pruebas son destructivas nos quedamos sin nada.
MUESTRA: es un conjunto de medidas u observaciones tomadas a partir de una población dada.
MUESTRA ALEATORIA: los datos se toman al azar, los datos de la población tienen la misma posibilidad de ser seleccionados.
Se puede utilizar:
Tabla de dígitos aleatorios
Directorio telefónico
Computadora
Calculadora
Insaculación
Número de la lotería
1.3.2 PARAMETRO Y ESTADIGRAFO
Cuando se trabaja con poblaciones los resultados se llamarán “parámetros” que son letras griegas.
Cuando se trabaja con muestras las medidas tendrán el nombre de “estadísticos” o estadígrafos, que son letras latinas.
1.3.3 VARIABLES (DATOS ESTADISTICOS)
Datos estadísticos: los datos en matemáticas se llaman variables, deben de cumplir con dos características:
Que sean comparables entre sí
Que tengan alguna relación
Clasificación de variables:
Cualitativas o nominales
Cuantitativas o escalares
-Variable discreta
-Variable continúa
1.3.4 EXPERIMENTO
Es cualquier proceso planeado que lugar a observaciones o recolección de datos.
La unidad experimental es sobre lo que se hace el experimento y lo que se mide es la variable de respuesta.
1.3.5 La estadística para su estudio se divide en dos grandes ramas
Estadística descriptiva
Estadística inferencial
2. MEDIDAS DE TENDENCIA CENTRAL
2.1 MEDIAS número calculado mediante ciertas operaciones a partir de los elementos de un conjunto de números, x1, x2,…,xn, y que sirve para representar a éste. Hay distintos tipos de medias: media aritmética, media geométrica y media armónica.La media aritmética es el resultado de sumar todos los elementos del conjunto y dividir por el número de ellosLa media geométrica es el resultado de multiplicar todos los elementos y extraer la raíz n-ésima del producto
La media armónica es el inverso de la media aritmética de los inversos de los
números que intervienen
2.2 MODA Y MEDIANA
Moda:nEs valor que aparece con más frecuencia en un conjunto dado de números. Es una de las medidas de centralización. En el conjunto {3,4,5,6,6,7,7,7,10,13} la moda es 7. Si son dos los números que se repiten con la misma frecuencia, el conjunto tiene dos modas. Otros conjuntos no tienen moda.
Mediana: Es una de las medidas de centralización. Colocando todos los valores en orden creciente, la mediana es aquél que ocupa la posición central.
2.3 VARIANZA Y DESVIACIÓN ESTÁNDAR
*La desviación estándar (σ) mide cuánto se separan los datos.
*La varianza (que es el cuadrado de la desviación estándar: σ2) se define así:
Es la media de las diferencias con la media elevadas al cuadrado.
2.4 ÍNDICE DE ASIMETRÍA Y CURTOSIS
Medidas de simetría o asimetría.
Miden la mayor o menor simetría de la distribución. Existen dos medidas de este tipo:
Medidas de curtosis.
Miden la mayor o menor concentración de datos alrededor de la media. Se suele medir con el coeficiente de curtosis:
Si este coeficiente es nulo, la distribución se dice normal (similar a la distribución normal de Gauss) y recibe el nombre de mesocúrtica.
Si el coeficiente es positivo, la distribución se llama leptocúrtica, más puntiaguda que la anterior. Hay una mayor concentración de los datos en torno a la media.
Si el coeficiente es negativo, la distribución se llama platicúrtica y hay una menor concentración de datos en torno a la media. sería más achatada que la primera.
3. DISTRIBUCIONES DE PROBABILIDAD
3.1Distribución binomial
la distribución binomial es una distribución de probabilidad discreta que mide el número de éxitos en una secuencia de n ensayos independientes de Bernoulli, con una probabilidad fija p de ocurrencia del éxito entre los ensayos.
Un experimento de Bernoulli se caracteriza por ser dicotómico, esto es, sólo son posibles dos resultados. A uno de estos se denomina éxito y tiene una probabilidad de ocurrencia p y al otro, fracaso, con una probabilidad q = 1 - p. En la distribución binomial el anterior experimento se repite n veces, de forma independiente, y se trata de calcular la probabilidad de un determinado número de éxitos. Para n = 1, la binomial se convierte, de hecho, en una distribución de Bernoulli.
3.2 Distribución hipergeométrica
La Distribución hipergeométrica es una distribución de probabilidad discreta con tres parámetros discretos N, d y n. Esta distribución se refiere a un espacio muestral donde hay elementos de 2 tipos posibles. Indica la probabilidad de obtener un número de objetos x de uno de los tipos, al extraer (sin reemplazo) una muestra de tamaño n, de un total de N objetos, de los cuales d son del tipo requerido.
3.3 Distribución de Poisson
Es una distribución de probabilidad discreta. Expresa la probabilidad de un número k de eventos ocurriendo en un tiempo fijo si estos eventos ocurren con una tasa media conocida, y son independientes del tiempo desde el último evento. La distribución de Poisson, se aplica a varios fenómenos discretos de la naturaleza (esto es, aquellos fenómenos que ocurren 0, 1, 2, 3, ... veces durante un periodo definido de tiempo o en un área determinada) cuando la probabilidad de ocurrencia del fenómeno es constante en el tiempo o el espacio.
3.4 Distribución normal
Se llama distribución normal, distribución de Gauss o distribución gaussiana, a una de las distribuciones de probabilidad de variable continua que con más frecuencia aparece en fenómenos reales.
La gráfica de su función de densidad tiene una forma acampanada y es simétrica respecto de un determinado parámetro. Esta curva se conoce como campana de Gauss.
La importancia de esta distribución radica en que permite modelizar numerosos fenómenos naturales, sociales y psicológicos. Mientras que los mecanismos que subyacen a gran parte de este tipo de fenómenos son desconocidos, por la ingente cantidad de variables incontrolables que en ellos intervienen, el uso del modelo normal puede justificarse asumiendo que cada observación se obtiene como la suma de unas pocas causas independientes.
4. DISTRIBUCIONES MUESTRALES Y EL TEOREMA CENTRAL DEL LIMITE
4.1 Distribuciones relacionadas con la distribución normal: Ji. Cuadrada, t y F. Ji cuadrada
La distribución χ² (de Pearson), donde χ² se pronuncia como ji-cuadrado,[1] es una distribución de probabilidad continua con un parámetro k que representa los grados de libertad de la variable aleatoria
La distribución ji-cuadrado tiene muchas aplicaciones en inferencia estadística, por ejemplo en la denominada prueba χ² utilizada como prueba de independencia y como prueba de bondad de ajuste y en la estimación de varianzas. También está involucrada en el problema de estimar la media de una población normalmente distribuida y en el problema de estimar la pendiente de una recta de regresión lineal, a través de su papel en la distribución t de Student, y participa en todos los problemas de análisis de varianza, por su papel en la distribución F de Snedecor, que es la distribución del cociente de dos variables aleatorias de distribución ji-cuadrado e independientes
T de student
La distribución t (de Student) es una distribución de probabilidad que surge del problema de estimar la media de una población normalmente distribuida cuando el tamaño de la muestra es pequeño. Ésta es la base de la popular prueba t de Student para la determinación de las diferencias entre dos medias muestrales y para la construcción del intervalo de confianza para la diferencia entre las medias de dos poblaciones.
La distribución t surge, en la mayoría de los estudios estadísticos prácticos, cuando la desviación típica de una población se desconoce y debe ser estimada a partir de los datos de una muestra.
Distribución F
La distribución F de probabilidad se usa como estadística prueba en varias situaciones. Se emplea para probar si dos muestras provienen de poblaciones que poseen varianzas iguales. Esta prueba es útil para determinar si una población normal tiene una mayor variación que la otra y también se aplica cuando se trata de comparar simultáneamente varias medias poblacionales. La comparación simultánea de varias medias poblacionales se conoce como análisis de varianza (ANOVA). En ambas situaciones, las poblaciones deben ser normales y los datos tener al menos la escala de intervalos.
La distribución F se define como la razón entre dos distribuciones ji cuadrada independientes, dividida cada una de ellas entre sus respectivos grados de libertad.
4.2 Teorema central del límite
El Teorema Central de Límite no es un único teorema, sino que consiste en un conjunto de resultados acerca del comportamiento de la distribución de la suma (o promedio) de variables aleatorias. Con Teorema Central del Límite nos referiremos a todo teorema en el que se arma, bajo ciertas hipótesis, que la distribución de la suma de un número muy grande de variables aleatorias se aproxima a una distribución normal.
4.3 Distribución de muestreo para la media muestral
un estadístico (muestral) es una medida cuantitativa, derivada de un conjunto de datos de una muestra, con el objetivo de estimar o contrastar características de una población o modelo
estadístico.
Más formalmente un estadístico es una función medible T que, dada una muestra estadística de valores (X1,X2,...,Xn), les asigna un número, T(X1,X2,...,Xn), que sirve para estimar determinado parámetro de la distribución de la que procede la muestra. Así, por ejemplo, la media de los valores de una muestra (media muestral) sirve para estimar la media de la población de la que se ha extraído la misma; la varianza muestral podría usarse para estimar la varianza poblacional, etc
4.4 Distribución de la proporción muestral La distribución de todos los valores posibles que puede asumir un estadístico muestral, calculados a partir de muestras del mismo tamaño y extraído en forma aleatoria de la misma población, se llama distribución muestral de ese estadístico.
La distribución por muestreo de un estadístico muestral es la distribución de probabilidad del mismo, calculado en cada una de las muestras posibles extraídas aleatoriamente de la población.
CONCEPTOS DE ESTADISTICA
DATO U OBSERVACION: resultado de realizar un experimento
POBLACION: grupo formado por el total de datos que se pueden obtener al efectuar una secuencia exhaustiva de experimentos.
MUESTRA: parte de la población
INTERVALO DE CLASE: agrupamiento de datos
RANGO: diferencia entre el mayor valor y menor valor de datos.
LIM REALES: son lim de aproximación de una medida, al menos se le llama lim real inferior, y al mayor lim real superior.
La primera etapa para el agrupamiento de los datos consiste en:
Calcular el rango
Determinar el número de intervalos
Calcular amplitud de intervalos
Fijar lim de clase
FRECUENCIA: número de veces que ocurre un evento, a la frecuencia de cada intervalo se le llama frecuencia de clase.
FRECUENCIA RELATIVA: resultado de dividir la frecuencia de cada intervalo entre el número total de datos.
La tabla donde se representan los diversos tipos de frecuencias se denomina TABLA DE DISTRIBUCION DE FRECUENCIAS.
La representación gráfica de una TDF se denomina HISTOGRAMA, el cual es una gráfica en un plano cartesiano en donde el eje de las abscisas (x) nos representa la variable aleatoria bajo estudio y el eje de las ordenadas (y) nos representa la frecuencia normalizada.
FRECUENCIA NORMALIZADA: se emplea cuando hay intervalos de distintos anchos. Es la frecuencia de clase divida entre el ancho de clase o amplitud de intervalo correspondiente.
MARCA DE CLASE: punto medio de cada intervalo
La unión de las marcas de clase se les denomina polígono de frecuencia.
GRAFICA OJIVA: se realiza en base a la frecuencia acumulada y los LR de Clase

No hay comentarios:

Publicar un comentario