<div dir="ltr">Buenos días a todos,<div><br></div><div>Este email es para informaros sobre los nuevos archivos que han sido subidos al clúster en relación a los datos de UKBiobank, en concreto a la carpeta /mnt/cephfs/home/bio/shared/database/UKBiobank/Covariates/.</div><div><br></div><div>En esta carpeta, podréis encontrar los siguientes archivos:<br><br>(1) <b>Tabla máster con variables demográficas</b> de nuestro interés, para todos los sujetos, en las 4 visitas y todas las instancias disponibles. Esta tabla tiene el nombre de: <u>demographics_all_filtered_250109.tsv.gz. </u></div><div>En ella, podéis encontrar una fila por cada sujeto incluido en la aplicación 8256, es decir, un total de 502 131 sujetos únicos (¡OJO! En esta tabla ya han sido excluidos los sujetos que han solicitado dejar de formar parte de la base de datos de UKB). En cada columna se recoge cada variable demográfica según su código, diferenciando el número de la visita con la letra i (son 4 visitas en total, pero se contabilizan desde 0 hasta 3) y la instancia (misma medida realizada varias veces en una misma visita), denominada con la letra a. </div><div><br></div><div>(2) <b>Jupyter notebook para extracción de tablas del RAP</b>. Este script tiene el nombre de: <u>extract_covar_ukbb_250109.ipynb. </u></div><div>Este cuaderno consiste en un script (originalmente creado por Julia y posteriormente editado por Josseline) que hemos editado Lalo y yo para que tan solo realice la tarea de extracción de variables de interés a partir un archivo *.txt en el que se introducen a mano los código del Showcase de UKB que nos interesen. Este cuaderno está preparado para no necesitar ser editado y no realiza ningún filtrado posterior de los datos. </div><div><br></div><div>(3) <b>Listado de códigos</b> de las variables de interés (mencionado anteriormente). Este listado tiene el nombre de: <u>code_fields.txt. </u></div><div>En este listado se incluyen los códigos de las variables que a día de hoy nos interesan, pero podría modificarse en el futuro cuando existan otras variables de interés y necesite ejecutarse el notebook en el RAP de nuevo. </div><div><br></div><div>(4) Archivo de excel con la <b>descripción de los códigos</b> de las variables de interés. Este archivo tiene el nombre de: <u>lista_variables_UKB_v3.xlsx. </u></div><div>En este archivo se recogen los distintos códigos (obtenidos a partir del Showcase de UKBiobank) que a día de hoy interesan a nivel grupal. Este es un archivo de consulta para conocer rápidamente qué significan las columnas de la Tabla máster. </div><div><br></div><div>(5) Un <b><u>README.txt</u> </b>donde se recoge de forma resumida lo comentado en las líneas anteriores. </div><div><br></div><div>Espero haberme explicado de la mejor manera posible, cualquier consulta no dudéis en comentarnos. </div><div><br></div><div>Un abrazo,</div><div>Ángela</div><div><br></div><div><br></div><div><br></div><div><br></div></div>