viernes, 12 de mayo de 2017

Sesiones de grupo grande: Tema 9

Tema 9: Estadística inferencial: muestreo y estimación

1.  INFERENCIA ESTADÍSTICA

Cuando planteamos un estudio en el ámbito sanitario para establecer relaciones entre variables, nuestro interés no suele estar exclusivamente en los pacientes concretos a los que hemos tenido acceso, sino más bien en todos los pacientes similares a estos. (Inferir)
Al inferir nunca tienes el dato seguro de toda la población sobre la que deduces los resultados de un estudio realizado anteriormente sobre la población que nos interesa, al inferir siempre hay error aleatorio.
Aquí tenéis un video de apoyo con la explicación de la definición de inferencia estadística, haciendo incapié en la definición de población y muestra.



2.   PROCESO DE LA INFERENCIA ESTADÍSTICA

Tenemos una población de estudio, y lo que queremos obtener es el parámetro. Mediante una selección aleatoria obtenemos una muestra,  y la medida de la variable que obtenemos de la muestra, se denomina estimador.


     3.   ERROR ESTÁNDAR

  • Es la medida que intenta captar la variabilidad de los valores del estimador, es decir mide el grado de variabilidad en los valores del estimador en las distintas muestras de un terminado tamaño que pudiésemos tomar de una población.
  • Cuanto más pequeño es el error del estimador, más nos podemos fiar del valor de una muestra concreta.
  • Error estándar para una media:

  • Error estándar para una proporción (frecuencia relativa):

  • De ambas fórmulas se deduce que, mientras mayor sea el tamaño de una muestra, menor será el error estándar.

         4.  TEOREMA CENTRAL DEL LÍMITE


Para estimadores que pueden ser expresados como suma de valores muestrales, la distribución de sus valores sigue una distribución normal con media de la población y desviación típica igual al error estándar del estimador de que se trate.


Si sigue una distribución normal, sigue los principios básicos de ésta:
-           1S  →  68,26% de las observaciones (muestras).
-           2S    95,45% de las observaciones.
-           1,95S  95% de las observaciones
-           3S    99,73% de las observaciones.
-           2,58S   99% de las observaciones.

S      Si queréis saber más del teorema central del límite, aquí os dejo este pequeño vídeo: 



    5.   INTERVALOS DE CONFIANZA
  • Son un medio de conocer el parámetro en una población midiendo el error que tiene que ver con el azar (error aleatorio).
  • Se trata de un par de números tales que, con un nivel de confianza determinados, podamos asegurar que el valor del parámetro es mayor o menor que ambos números.
  • Se calcula considerando que el estimador muestral sigue una distribución normal, como establece la teoría central del límite.
Ejemplo de cómo se calcula:

6.   PROCEDIMIENTO MUESTRAL

  • Un muestreo es un método tal que al escoger un grupo pequeño de una población podamos tener un grado de probabilidad de que ese pequeño grupo posea las características de la población que estamos estudiando.


7.  TIPOS DE MUESTREO

  • Probabilístico. Todos los sujetos de la población tienen una probabilidad distinta de cero en la selección de la muestra y conocida. Existe una probabilidad conocida de seleccionar a los sujetos. Por ejemplo, si vamos a seleccionar 5 sujetos de la clase, y somos un total de 50, tendré un 10 % de probabilidad de ser elegida. Sin embargo si lo hacemos a cualquier persona que pase por la calle, no sabemos a quién vamos a encontrarnos para incluir en la selección.

1.       Aleatorio simple. P=1/nà por azar (que azar no es ponerme en una esquina y el que pase por aquí)
2.       Aleatorio sistemático.à estas tres son variaciones del muestreo aleatorio simple.
3.       Estratificado.
4.       Conglomerados.



  • No probabilístico o de conveniencia del investigador. Puede haber personas en la población que no tengan probabilidad o que se desconozca, de ser seleccionado en la muestra. No existe probabilidad conocida, es una selección arbitraria. (“Muestreo de lo que tengo a mano”)
1.  Accidental. Son aquellos en los que los sujetos de la población no tienen una probabilidad conocida o distinta de 0. De las tres es la más eficiente.

2.   Por cuotas. Me pongo a pasar un cuestionario en una esquina pero el 50% a mujeres y 50% a hombres, despreciando a la mujer 51 que pasa por la esquina.  (NO hay aleatoriedad)
3. Por conveniencia o intencional. En el que el investigador decide según sus objetivos, los elementos que integraran la muestra, considerando las unidades "típicas" de la población que se quiere conocer.

8.  TAMAÑO DE LA MUESTRA

Va a depender de:
  •       Erro estándar.
  •       De la mínima diferencia entre los grupos de comparación que se considera importante en los valore de la variable a estudiar. Más grande debe ser la muestra para que más pequeño sea el error.
  •       De la variabilidad de la variable a estudiar (varianza en la población).
  •       El tamaño de la población de estudio.
Calculo del tamaño de una muestra para estimar la media de una población:

  •       Si tras esta operación se cumple el resultado: N > n(n-1), el cálculo del tamaño muestral termina aquí.
  •       Si no se cumple, obtendremos el tamaño de la muestra con esta fórmula:



No hay comentarios:

Publicar un comentario

Breast Cancer Pink Ribbon