sábado, 3 de junio de 2017

REFLEXIÓN FINAL

Y como todo, esto llega a su fin.


Queda hablar de la asignatura en sí. Con esta he aprendido que la investigación también tiene sitio en nuestro campo. Gracias a ella he descubierto un mundo que ni me había planteado que iba a descubrir en esta carrera.


También decir que no le vi el uso a los test de hipótesis hasta que realizamos el trabajo de investigación. En él utilizamos el test de hipótesis CHI CUADRADO para contestar nuestras 5 hipótesis nulas.


Sinceramente, al principio, no le vi mucho sentido pero cuando empiezas a ahondar en ella y a aprender sobre todo lo que te permite hacer esta herramienta (porque sí, la estadística es una técnica de ayuda estupenda para la investigación) empiezas a reconocer su importancia. No me arrepiento de haberla dado, me ha gustado aunque algunas sesiones fueran algo tediosas y con ella, por extensión, he aprendido a usar BLOGGER (algo que me ha sido super interesante y nuevo para mí) y EPI INFO (programa que ni sabía que existía).

Así que, haciendo un recuento de todo lo de la asignatura puedo decir que he aprendido bastante y que ha superado mis expectativas. Aunque todavía me queda mucho por estudiar y poco tiempo para ello. Pero que no cunda el pánico mejor.


Así que con esta última entrada "despido" el blog o al menos la parte que tiene que ver con esta asignatura. 
Gracias a todos los que lo habéis visitado y espero que os haya ayudado con ejercicios o dudas. ¡Hasta pronto!







SEMINARIO 5

Bueno, en nuestra sesión final de grupo pequeño expusimos nuestros trabajos de investigación tras mucho trabajo. Nuestro trabajo iba sobre el narguile (más conocido como narguile o shisha) y la percepción que tiene la población sobre ella.


Elegimos este tema ya que es un tema muy actual. Es algo que hemos normalizado actualmente en la sociedad, ya que existen muchos mitos falsos sobre ella. Como, por ejemplo, que no contiene alquitrán o que es menos perjudicial que los cigarrillos tradicionales.
Tras hacernos con la información necesaria sobre esta alternativa al tabaco normal, realizamos un cuestionario de 28 apartados el cual pasamos por dos colegios y pasamos a "Formulario" una herramienta de Google para hacer cuestionarios online.

Tras esto recogimos los datos para responder a nuestros objetivos. Una de las gráficas que podemos destacar de los resultados de nuestra investigación es esta:
En esta podemos ver las personas que han consumido narguile frente a las que no. Observamos la aplastante diferencia entre la respuesta afirmativa y la negativa. Gracias a esta gráfica podemos ver la actualidad y la importancia de este tema.

Nosotros fuimos los segundos en salir a exponer, de mi grupo salieron Melisa David du Muttel y Carlos Benítez.

Antes de nosotros salió un grupo el cual expuso un trabajo sobre los hábitos alimenticios y sedentarismo en niños entre 3 y 8 años. Y después de nosotros fue el último que habló de los mitos del amor romántico en adolescentes.

Y así terminamos nuestro trabajo de investigación.





EJERCICIOS


Aquí os dejo un par de ejercicios resueltos y explicados que nos ha facilitado nuestro profesor de estadística: Jose Antonio Ponde Blandón.
Espero que os sirvan de ayuda.





Sesiones de grupo grande: Tema 10

Tema 10: Hipótesis Estadística. Test de Hipótesis.


1. CONTRASTE DE HIPÓTESIS
Para controlar los errores aleatorios contamos con una segunda herramienta en el proceso de inferencia estadística: los test o contrastes de hipótesis.

Con los intervalos nos hacemos una idea de un parámetro de una población dado un par de números entre los que confiamos que esté el valor desconocido.

Con los contrastes (test) de hipótesis la estrategia es la siguiente:
-          Establecemos a priori una hipótesis cerca del valor del parámetro.
-          Realizamos la recogida de datos.
-          Analizamos la coherencia de entre la hipótesis previa y los datos obtenidos.

Son herramientas estadísticas para responder a preguntas de investigación: permite cuantificar la compatibilidad entre una hipótesis previamente establecida y los resultados obtenidos.


Tipo de análisis estadísticos según el tipo de variables implicadas en el estudio:

2.   ERRORES DE HIPÓTESIS
El test de hipótesis mide la probabilidad de error que cometo si rechazo la hipótesis nula.
Con una misma muestra podemos aceptar o rechazar la hipótesis nula.
  • El error α es la probabilidad de equivocarnos al rechazar la hipótesis nula.
  • El error α más pequeño al que podemos rechazar H0 es el error p. (p es sinónimo de α minimizada)

Habitualmente rechazamos H0 para un nivel α máximo del 5% (p< 0.05).
Por encima del 5% de error, aceptamos la hipótesis nula.
Es lo que llamamos “significación estadística”.


3.  TIPOS DE ERRORES EN TEST DE HIPÓTESIS
El más importante normalmente es el tipo alfa, ya que es el que se comete cuando el test nos dice que rechacemos la hipótesis nula y no deberíamos haberla rechazado.


4. TEST DE HIPÓTESIS DE CHI - CUADRADO


5. T DE STUDENT



6. REGRESIÓN LINEAL



7. TEST DE ANOVA

Para este test nuestro profesor usó una presentación en inglés. Este test a nosotros no nos entra en el examen como ejercicios.




miércoles, 31 de mayo de 2017

viernes, 12 de mayo de 2017

SEMINARIO 4

En este seminario lo que hicimos fue repasar conceptos de las clases de grupo grande tales como:
¢ Recodificación de variables
¢ Cálculos de medidas de tendencia central y dispersión variables cuantitativas
¢ Cálculos de distribuciones de frecuencia y de intervalos de confianza
¢ Cálculos y elaboración de gráficas de sectores, diagramas de barras e histogramas

¢Contraste de hipótesis mediante test.

Al estar estos explicados en entradas anteriores no los volveré a estudiar. Después vimos dos tipos de problemas: Chi cuadrado y T de Student.

CHI CUADRADO


 T DE STUDENT





 Después vimos cada uno de los test en el programa EPI INFO.

NOTA: Todas estas imágenes son del power point de nuestro profesor.

¡Feliz Día de la Enfermería!


Un poquito de historia: 
En enero de 1974, se tomó la decisión de celebrar ese día el 12 de mayo al ser este el aniversario del nacimiento de Florence Nightingale, considerada la creadora de la enfermería moderna. 
Cada año, el ICN (Consejo Internacional de Enfermería) prepara y distribuye el kit del Día Internacional de las Enfermeras. El kit contiene material de información pública y educacional, para su uso por enfermeros de cualquier lugar.





Sesiones de grupo grande: Tema 9

Tema 9: Estadística inferencial: muestreo y estimación

1.  INFERENCIA ESTADÍSTICA

Cuando planteamos un estudio en el ámbito sanitario para establecer relaciones entre variables, nuestro interés no suele estar exclusivamente en los pacientes concretos a los que hemos tenido acceso, sino más bien en todos los pacientes similares a estos. (Inferir)
Al inferir nunca tienes el dato seguro de toda la población sobre la que deduces los resultados de un estudio realizado anteriormente sobre la población que nos interesa, al inferir siempre hay error aleatorio.
Aquí tenéis un video de apoyo con la explicación de la definición de inferencia estadística, haciendo incapié en la definición de población y muestra.



2.   PROCESO DE LA INFERENCIA ESTADÍSTICA

Tenemos una población de estudio, y lo que queremos obtener es el parámetro. Mediante una selección aleatoria obtenemos una muestra,  y la medida de la variable que obtenemos de la muestra, se denomina estimador.


     3.   ERROR ESTÁNDAR

  • Es la medida que intenta captar la variabilidad de los valores del estimador, es decir mide el grado de variabilidad en los valores del estimador en las distintas muestras de un terminado tamaño que pudiésemos tomar de una población.
  • Cuanto más pequeño es el error del estimador, más nos podemos fiar del valor de una muestra concreta.
  • Error estándar para una media:

  • Error estándar para una proporción (frecuencia relativa):

  • De ambas fórmulas se deduce que, mientras mayor sea el tamaño de una muestra, menor será el error estándar.

         4.  TEOREMA CENTRAL DEL LÍMITE


Para estimadores que pueden ser expresados como suma de valores muestrales, la distribución de sus valores sigue una distribución normal con media de la población y desviación típica igual al error estándar del estimador de que se trate.


Si sigue una distribución normal, sigue los principios básicos de ésta:
-           1S  →  68,26% de las observaciones (muestras).
-           2S    95,45% de las observaciones.
-           1,95S  95% de las observaciones
-           3S    99,73% de las observaciones.
-           2,58S   99% de las observaciones.

S      Si queréis saber más del teorema central del límite, aquí os dejo este pequeño vídeo: 



    5.   INTERVALOS DE CONFIANZA
  • Son un medio de conocer el parámetro en una población midiendo el error que tiene que ver con el azar (error aleatorio).
  • Se trata de un par de números tales que, con un nivel de confianza determinados, podamos asegurar que el valor del parámetro es mayor o menor que ambos números.
  • Se calcula considerando que el estimador muestral sigue una distribución normal, como establece la teoría central del límite.
Ejemplo de cómo se calcula:

6.   PROCEDIMIENTO MUESTRAL

  • Un muestreo es un método tal que al escoger un grupo pequeño de una población podamos tener un grado de probabilidad de que ese pequeño grupo posea las características de la población que estamos estudiando.


7.  TIPOS DE MUESTREO

  • Probabilístico. Todos los sujetos de la población tienen una probabilidad distinta de cero en la selección de la muestra y conocida. Existe una probabilidad conocida de seleccionar a los sujetos. Por ejemplo, si vamos a seleccionar 5 sujetos de la clase, y somos un total de 50, tendré un 10 % de probabilidad de ser elegida. Sin embargo si lo hacemos a cualquier persona que pase por la calle, no sabemos a quién vamos a encontrarnos para incluir en la selección.

1.       Aleatorio simple. P=1/nà por azar (que azar no es ponerme en una esquina y el que pase por aquí)
2.       Aleatorio sistemático.à estas tres son variaciones del muestreo aleatorio simple.
3.       Estratificado.
4.       Conglomerados.



  • No probabilístico o de conveniencia del investigador. Puede haber personas en la población que no tengan probabilidad o que se desconozca, de ser seleccionado en la muestra. No existe probabilidad conocida, es una selección arbitraria. (“Muestreo de lo que tengo a mano”)
1.  Accidental. Son aquellos en los que los sujetos de la población no tienen una probabilidad conocida o distinta de 0. De las tres es la más eficiente.

2.   Por cuotas. Me pongo a pasar un cuestionario en una esquina pero el 50% a mujeres y 50% a hombres, despreciando a la mujer 51 que pasa por la esquina.  (NO hay aleatoriedad)
3. Por conveniencia o intencional. En el que el investigador decide según sus objetivos, los elementos que integraran la muestra, considerando las unidades "típicas" de la población que se quiere conocer.

8.  TAMAÑO DE LA MUESTRA

Va a depender de:
  •       Erro estándar.
  •       De la mínima diferencia entre los grupos de comparación que se considera importante en los valore de la variable a estudiar. Más grande debe ser la muestra para que más pequeño sea el error.
  •       De la variabilidad de la variable a estudiar (varianza en la población).
  •       El tamaño de la población de estudio.
Calculo del tamaño de una muestra para estimar la media de una población:

  •       Si tras esta operación se cumple el resultado: N > n(n-1), el cálculo del tamaño muestral termina aquí.
  •       Si no se cumple, obtendremos el tamaño de la muestra con esta fórmula:



martes, 25 de abril de 2017

Sesiones de grupo grande: Tema 8

TEMA 8: MEDIDAS DE TENDENCIA CENTRAL,POSICIÓN Y DISPERSIÓN

Además de las tablas y los gráficos podemos resumir una serie de observaciones mediante "estadísticos": "función de los datos observados". Solo se aplican a variables cuantitativas continuas (edad, peso, tiempo...).

Hay varios grandes tipos de medidas estadísticas:


MEDIDAS DE TENDENCIA CENTRAL
  •        MEDIA: (media aritmética o simplemente media). Es el promedio aritmético de las observaciones, es decir, el cociente entre la suma de todos los datos y el numero de ellos.
  •        MEDIANA (Me):es el valor que separa por la mitad las observaciones ordenadas de menor a mayor, de tal forma que el 50% de estas son menores que la mediana  y el otro 50% son mayores. Si el número de datos es impar la mediana será el valor central, si es par tomaremos como mediana la media aritmética de los dos valores centrales.


  •        MODA (M0): es el valor de la variable que más veces se repite, es decir, aquella cuya frecuencia absoluta es mayor. No tiene porque ser única.




MEDIDAS DE POSICIÓN O CUARTILES

-          Percentiles:
o   Dividen la muestra ordenada en 100 partes.
o   El valor del P50 corresponde al valor de la mediana.
Ejemplo: el percentil de orden 15 deja por debajo al 15% de las observaciones, y por encima queda el 85%.


-          Deciles:
o   Dividen la muestra ordenada en 10 partes.
o   El decil “i” (Di), es aquél valor que, ordenadas las observaciones en forma creciente, el i/10% de ellas son menores que él y el (100-i)/10% restante son mayores.
o   El valor del D5 corresponde al valor de la mediana y, por tanto, al del P50.


-          Cuartil:
o   Dividen la muestra ordenada en 4 partes.



MEDIDAS DE DISPERSIÓN

Las medidas de dispersión nos dicen hasta que punto estas medidas de tendencia central son representativas como síntesis de la información. Las medidas de dispersión cuantifican la separación, la dispersión, la variabilidad de los valores de la distribución respecto al valor central.
  •        Varianza ( s2 ): es el promedio del cuadrado de las distancias entre cada observación y la media aritmética del conjunto de observaciones.
  •        Desviación típica (S): La varianza viene dada por las mismas unidades que la variable pero al cuadrado, para evitar este problema podemos usar como medida de dispersión la desviación típica que se define como la raíz cuadrada positiva de la varianza
  •        Recorrido o rango muestral (Re). Es la diferencia entre el valor de las observaciones mayor y el menor.  

Re = xmax - xmin

  •        Desviación media: media artimética de las distancias de cada observación con respecto a la media de la muestra.

·         Recorrido intercuartílico: Diferencia entre el tercer y el primer cuartil = lQ3-Q1l

·         Coeficiente de variación: Es una medida de dispersión relativa (adimensional) ya que todas las demás se expresan en la unidad de medida de la variable. Nos sirve para comparar la heterogeneidad de dos series numéricas con independencia de las unidades de medidas. Se expresa sin unidades. 



DISTRIBUCIONES NORMALES


ASIMETRÍA Y CURTOSIS

 - Coeficiente de asimetría de una variable: grado de asimetría de la distribución de sus datos en torno a su media, cuanto más asimétrica sea, valores más diferentes encontraremos. Es adimensional.

ASIMETRÍA

Los resultados pueden ser los siguientes:
-          g1=0 (distribución simétrica; existe la misma concentración de valores a la derecha y a la izquierda de la media).

-          g1>0 (distribución asimétrica positiva; existe mayor concentración de valores  a la derecha de la media que a su izquierda).

-          g1<0 (distribución asimétrica negativa; existe mayor concentración de valores a la izquierda de la media que a su derecha).


CURTOSIS O APUNTAMIENTO DE LA CURVA

Este sirve para medir el grado de concentración de los valores que toma en torno a su media. 
    Se definen 3 tipos de distribuciones según su grado de curtosis:
  •       Distribución mesocúrtica: presenta un grado de concentración medio alrededor de los valores centrales de la variable (el mismo que presenta una distribución normal). 
  •       Distribución leptocúrtica: presenta un elevado grado de concentración alrededor de los valores centrales de la variable. 

  •       Distribución platicúrtica: presenta un reducido grado de concentración alrededor de los valores centrales de la variable.




TIPIFICACIÓN DE LOS VALORES Y SU RELACIÓN CON LA CAMPANA DE GAUSS


La tipificación nos permite conocer si el valor corresponde o no a esa distribución con frecuencia.

Trabajamos con una variable continua que:
 - Sigue una distribución normal.
 - Tiene más de 100 unidades.

Ejemplo:



Para la tipificación necesitamos una tabla con los valores ya determinados. Yo os la facilito:








Breast Cancer Pink Ribbon