Dime que te ocurre y deja que te ayude

Publicado por @Sandra el Dec. 20, 2019, 10:13 a.m.
**¿Alguna vez has estado enfermo y sin tiempo para acudir al médico?** Si tu respuesta es un sí, este artículo puede ser de tu interés: Susana tiene 28 años y se encuentra mal, pero está bastante ajetreada y no tiene tiempo para poder acercarse a su médico de cabecera. ¿Te es familiar esta situación? ¿Qué harías en su lugar? ¿Antepondrías tu salud o tus ocupaciones? ¿Te automedicarías? ---------- Según un estudio elaborado por **Sanitas** y por la Sociedad Española para el Estudio de la Ansiedad y el Estrés (SEAS), el **61 %** de los encuestados **afirma haber dejado de acudir al médico “al menos en alguna ocasión” debido a la falta de tiempo**, mientras que, en general, el 23,1 % cita la carencia de tiempo entre las dificultades para ir al médico y un 22,3 % argumenta que no acude a la consulta a causa del horario del médico. El trabajo se ha realizado a partir de 1.401 entrevistasrealizadas a través de Internet entre el 29 febrero y el 7 de marzo. Ante estos datos, el director ejecutivo regional de Sanitas en Cataluña, José Luis Buil, ha asegurado en rueda de prensa que **"esta falta de tiempo o de disponibilidad horaria, que imposibilita asistir a las visitas médicas, implica que las patologías se diagnostiquen más tarde y que, por lo tanto, el tratamiento para éstas se inicie más tarde"**. https://sanitasdatasalud.es/wp-content/uploads/2017/06/Impacto-del-tiempo-en-la-salud-2016.pdf ---------- Te presentamos al Doctor Cervantes: Desde AISaturdays Madrid este último mes, hemos realizado un proyecto que mediante algoritmos de AI sea capaz de realizar un diagnóstico automático. Lo estructuraremos en varias partes: 1. Extracción de los datos. 2. Limpieza e ingeniería del dataset. 3. Entrenamiento y ajustes del modelo. Aplicación del modelo. **Extracción de los datos:** Hemos conseguido los datos de **Clínica de la Asunción**, grupo YATPINDE TATSO BRAHMANDE. Dentro de la información ambulatorio por cada paciente ingresado en el hospital encontramos. Las **descripciones de los síntomas** de paciente y **diagnóstico final** del doctor. **Limpieza e ingeniería de los datos:** Partiendo desde los datos en bruto hemos hecho la **limpieza básica**, como quitar los registros duplicados (casos repetidos) y los registros cuyo diagnostico está ausente (representado por NA). **Etiquetación de los datos. ** Como el numero de los valores únicos de los diagnósticos es muy alto tenemos que agruparlos según el estándar oficial. Al extraer el código de diagnóstico lo cruzamos con el fichero de mapeo entre diagnósticos y categorías (nombre completo de diagnóstico. Así tendríamos los datos organizados en dos columnas: - La descripción de los síntomas. - El diagnóstico clínico correspondiente. Una vez tenemos las etiquetas (diagnósticos) preparados empezamos con el **tratamiento de las variables predictoras** que en nuestro caso viene del texto libre de la columna **‘MOTIVO_TRANS’** que representa la descripción de los síntomas del paciente al llegar al hospital. Para aquello primero tenemos que hacer el preprocesamiento de los comentarios/textos aplicando **tokenización y limpieza con NLTK.** Vectorizamos los comentarios con **CountVectorizer** de la librería Scikit Learn. **Entrenamiento y ajustes del modelo:** Realizamos una **optimización bayesiana**, que consiste en hacer una exploración de los datos. Realizamos una **asignación de parámetros aleatorios** que intentan distribuirse por el espacio de una manera equivalente, con el fin de **tener una idea de cómo funciona el espaci**o. Consideramos que es un **modelo de caja negra,** es decir, que a priori no podemos aplicar directamente derivadas parciales en este modelo sobre el error para llegar a un óptimo. Por lo que hay un **modelo** de optimización bayesiana **que asume que no es absolutamente nada.** **Aplicación del modelo:** Aplicamos el modelo para maximizar la mejora del F1. Hasta conseguir un **75% de accuracy/F1.** **Nuestra web:** Esta web — diseñada desde flask — actúa de tal manera que al **anotar los síntomas** que padeces **realiza una respuesta basada,** por el momento, en **la clasificación CIE-9.** Por lo tanto, en una breve descripción, podríamos referirnos a este proyecto como… …*Doctor Cervantes: una plataforma digital en la que tan solo anotando tussíntomas es capaz de realizar un diagnóstico.* )