[BSICoS_AI_Gen] Tabla máster de variables demográficas - UKBiobank

Ángela Hernández Mendoza angela.hernandezm en unizar.es
Jue Ene 9 14:48:07 CET 2025


Buenos días a todos,

Este email es para informaros sobre los nuevos archivos que han sido
subidos al clúster en relación a los datos de UKBiobank, en concreto a la
carpeta /mnt/cephfs/home/bio/shared/database/UKBiobank/Covariates/.

En esta carpeta, podréis encontrar los siguientes archivos:

(1) *Tabla máster con variables demográficas* de nuestro interés, para
todos los sujetos, en las 4 visitas y todas las instancias disponibles.
Esta tabla tiene el nombre de: *demographics_all_filtered_250109.tsv.gz. *
En ella, podéis encontrar una fila por cada sujeto incluido en la
aplicación 8256, es decir, un total de 502 131 sujetos únicos (¡OJO! En
esta tabla ya han sido excluidos los sujetos que han solicitado dejar de
formar parte de la base de datos de UKB). En cada columna se recoge cada
variable demográfica según su código, diferenciando el número de la visita
con la letra i (son 4 visitas en total, pero se contabilizan desde 0 hasta
3) y la instancia (misma medida realizada varias veces en una misma
visita), denominada con la letra a.

(2) *Jupyter notebook para extracción de tablas del RAP*. Este script tiene
el nombre de: *extract_covar_ukbb_250109.ipynb. *
Este cuaderno consiste en un script (originalmente creado por Julia y
posteriormente editado por Josseline) que hemos editado Lalo y yo para que
tan solo realice la tarea de extracción de variables de interés a partir un
archivo *.txt en el que se introducen a mano los código del Showcase de UKB
que nos interesen. Este cuaderno está preparado para no necesitar ser
editado y no realiza ningún filtrado posterior de los datos.

(3) *Listado de códigos* de las variables de interés (mencionado
anteriormente). Este listado tiene el nombre de: *code_fields.txt. *
En este listado se incluyen los códigos de las variables que a día de hoy
nos interesan, pero podría modificarse en el futuro cuando existan otras
variables de interés y necesite ejecutarse el notebook en el RAP de nuevo.

(4) Archivo de excel con la *descripción de los códigos* de las variables
de interés. Este archivo tiene el nombre de: *lista_variables_UKB_v3.xlsx. *
En este archivo se recogen los distintos códigos (obtenidos a partir del
Showcase de UKBiobank) que a día de hoy interesan a nivel grupal. Este es
un archivo de consulta para conocer rápidamente qué significan las columnas
de la Tabla máster.

(5) Un *README.txt *donde se recoge de forma resumida lo comentado en las
líneas anteriores.

Espero haberme explicado de la mejor manera posible, cualquier consulta no
dudéis en comentarnos.

Un abrazo,
Ángela
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <http://listas.unizar.es/pipermail/jaje/attachments/20250109/478f91a5/attachment.html>


Más información sobre la lista de distribución Jaje