La Ciencia de Datos: Una herramienta para la investigación en salud

La Ciencia de Datos: Una herramienta para la investigación en salud



José Fernando Tovar Valle

Coordinador área científica

Hace dos semanas tuvimos como invitado a Carlos Alberto Haro, nuestro primer invitado internacional de México, con quien hablamos sobre Ciencia de Datos. Carlos actualmente es host de un podcast de Spotify llamado Cuestión de Datos (https://n9.cl/zx08w) el cual es descrito como: 

¿Qué hay detrás de la ciencia de datos? Exploremos el mundo del 'Data Science': Estadística, software, modelos, aplicaciones, noticias..., discutamos todo lo que los datos tienen para decirnos y compartirnos en Cuestión de Datos”.

Quisimos hablar sobre ciencia de datos con nuestro invitado al ver el auge de esta área del conocimiento en muchas disciplinas. De ahí el interés que tuvimos con la Fundación Federico de plantear un #facebooklive donde discutiéramos alrededor de este tema. 

Definir la Ciencia de Datos y sus aplicaciones

La Ciencia de Datos, referida como Data Science en inglés, es definida en un artículo de John M. Chambers como:

La Ciencia de Datos consiste en técnicas y sus aplicaciones para derivar y comunicar científicamente inferencias válidas y predicciones basadas en datos relevantes”.  

Esta definición nos la presentó nuestro invitado basado en ese trabajo de Chambers (https://n9.cl/iio4z). La ciencia de datos es vista también como un campo multidisciplinario que busca extraer información para favorecer el entendimiento de un conjunto de datos. La ciencia de datos implica el trabajo de otras áreas del conocimiento que se integran como son: la estadística, el machine learning, minería de datos y la informática.

Un inconveniente frecuente con respecto a la ciencia de datos es el uso incorrecto del término o la información abstracta que muchas personas mencionan sobre esta sin aclarar los matices en su aplicación. Precisamente David Asboth, otro autor que nos presentó nuestro invitado al live, preparó una presentación sobre: “Lo que no te enseñan sobre Ciencia de Datos” (https://n9.cl/mvq2u).

Herramientas para su aprendizaje

En nuestro conversatorio sobre Ciencia de Datos con Carlos Haro fueron varios los recursos pedagógicos que se recomendaron que vamos a mencionar a continuación:

  1. Aunque existen múltiples plataformas para el aprendizaje virtual a través de cursos pagos no siempre estos brindan un aporte sustancial al curioso y gran parte de los recursos siguen siendo gratuitos en la web. De ahí que la primera recomendación sea agotar aquello que nos es dado en la web sin costo. A partir de allí el curioso puede identificar necesidades o carencias que pueden ser complementadas en otras plataformas.

  2. Recurrir al aprendizaje de lenguajes de programación: Dos recursos que nos brinda la web es el uso de R y Python. Ambos gratuitos y con posibilidades de autoaprendizaje a través de textos académicos de fácil acceso y desarrollados por editoriales de gran trayectoria como O´Reilly. Para R (https://r4ds.had.co.nz/) y Python (https://n9.cl/0lm1k) compartimos los links con nuestros seguidores.

Otra recomendación consiste en seguir a expertos en ciencia de datos que pueden brindarnos, Carlos Haro nos brindó algunas cuentas de Twitter:

Esperamos que estos consejos brindados por nuestro invitado sean de mucha utilidad para toda nuestra comunidad de seguidores.

Participe y comente esta publicación