[Opengnsys-users] Errores con ctorrent al acabar la descarga

Pep Ciuraneta Sanchez josep.ciuraneta en upc.edu
Lun Jul 12 12:18:02 CEST 2021


Hola Miguel,

Gracias por indicarme la opcion -f del ctorrent. Lo acabo de añadir en
todos los scripts. :)

No entiendo lo que comentas sobre el asistente de deploy de imagenes. Yo lo
he estado usando en las pruebas y funciona perfecto. Quiza no estamos
hablando de lo mismo.

Sobre los errores del ctorrent por entrar en modo EndGame no nos ha pasado
en multiples pruebas de descarga. Unicamente se me han producido algun
error, minimo, al inicio de la descarga, que supongo debe ser el otro que
comentas, con parche existente.

Gracias de nuevo y si quieres que probemos algo solo tienes que decirlo.

Saludos,
Pep.

-- 
O O O Universitat Politecnica de Catalunya
O O O BarcelonaTECH
O O O ------------------------------------
U P C Facultat de Matematiques i Estadistica
      Pau Gargallo, 14 - 08028 Barcelona

      Pep Ciuraneta Sanchez
      Serveis TIC
      josep.ciuraneta en upc.edu
      Tel. 934015853

AVIS DE CONFIDENCIALITAT:
Aquest missatge pot contenir informacio confidencial o legalment
protegida i esta exclusivament adrecat a la persona o entitat
destinataria. Si no sou el destinatari final o persona encarregada de
recollir-lo, no esteu autoritzat a llegir-lo, retenir-lo,
modificar-lo, distribuir-lo, copiar-lo ni a revelar el seu contingut.
Si heu rebut aquest missatge per error, us preguem que informeu al
remitent i elimineu del vostre sistema el missatge i el material annex
que pugui contenir. Gracies per la vostra col.laboracio.

Abans d'imprimir aquest correu, penseu si es necessari.



Missatge de Miguel Sánchez Sánchez <msanchez en fi.upm.es> del dia dl., 12 de
jul. 2021 a les 10:26:

> Hola Pep. Sí, la verdad es que los problemas de segmentation fault nos
> empezaron a surgir ya en la versión 1.0.6 y entonces optamos por la
> solución que tú comentas. Por cierto, la función ogTorrentStart lanza
> ctorrent con la opción -f. Creía que era para evitar el chequeo inicial de
> la imagen.
> La verdad es que optimiza el uso de la red al máximo, pero tiene la pega
> de no poder utilizar el asistente de deploy de imágenes.
> Aunque el despliegue de semilleros que utilizamos en su día era sencillo,
> utilizando algunos ogLIve como la imagen ya en la caché:
> IMG=<fichero de imagen>
> IMGDIR=$(ogGetParentPath CACHE /$IMG)
> ogCopyFile REPO $IMG.torrent $IMGDIR
> ogTorrentStart CACHE $IMG.torrent seeder:<tiempo en segundos>
>
> En cuanto a los problemas de segmentation fault y abortos de ctorrent,
> después de ponerlo en debug, he podido ver que en ambos casos están
> relacionados con la entrada en el modo EndGame de BitTorrent. Ese modo se
> utiliza sobre todo al finalizar las descargas, preguntando a todos los
> peers por las partes que le faltan a un cliente, y cancelando las
> respuestas a peticiones repetidas. Lamentablemente, ctorrent no gestiona
> bien esas cancelaciones y termina cometiendo errores como la creación de
> arrays de longitud negativa.
> Para el problema del segmentation fault, que se da al poco de comenzar las
> sesiones de descarga, creo que tienen un sencillo parche en
> https://sourceforge.net/p/dtorrent/patches/6/ que lo solventa.
> Pero solucionar el bug del error final std::bad_array_new_length creo que
> me supera, por lo que he optado por el camino de en medio, evitando que
> ctorrent entre en modo endgame. Tiene el inconveniente de que la
> localización de las partes finales de una descarga tardan algo más.
> Lo curioso de este último error es que sólo se da, como comentaba, si los
> clientes llegan parejos al final en las partes descargadas. Este sólo es el
> caso cuando la velocidad para servir disco del semillero es menor que la
> velocidad de la red, de tal manera que los clientes terminan convergiendo
> entre ellos aunque arranquen después de un tiempo aleatorio
>
> Tras regenerar el paquete deb de ctorrent luego sólo hay que instalarlo en
> el sistema de ficheros squashfs de ogclient.sqfs, para que luego lo cargue
> el ogLive.
>
> Bueno, al final creo me ha salido también otro ladrillo.
> Saludos.
>
> Pep Ciuraneta Sanchez escribió el 9/7/21 a las 18:21:
>
> Hola Miguel,
>
> Te explico, nosotros empezamos haciendo pruebas con 1.2.0 para ver si
> solucionabamos unos problemas con el torrent (no aprovechamiento del ancho
> de banda, falta de fiabilidad con muchos errores segmentation fault en
> clientes) y al ver que con 1.2.0 nos pasaba lo mismo hemos cambiado el
> programa que se encarga de hacer el seed. Seguimos con 1.1.0 de momento.
> Esto lo hemos hecho tras hacer pruebas esta misma semana.
>
> En lugar de usar el bittornado hemos optado por lanzar un ctorrent por
> cada fichero torrent. Esto tiene su inconveniente, pero desde entonces el
> ancho de banda se aprovecha algo mejor y los errores se han minimizado
> muchísimo. De momento lo vamos a dejar así. En concreto lo lanzamos así
> para cada fichero (simplificado)
>
> # cd /opt/opengnsys/images
> # ctorrent -e -1 -d nombre_fichero_img.torrent
>
> Yo creo que esto es extrapolable a la versión 1.2.0. El hecho de usar
> ctorrent en lugar de bittornado funciona bastante mejor, pero tiene la pega
> que cada vez que se inicia se comprueba el fichero a compartir y eso puede
> ser costoso en tiempo y depende de la velocidad acceso de disco.
>
> Hemos aprovechado este final de curso para hacer multiples pruebas y el
> poder aprovechar la red a 1Gbps da bastante alegria.
>
> Consejos para subir la velocidad en descarga por torrent:
>
> 1.- si es posible, tener los ficheros imagen en disco SSD
> 2.- tener algun seeder extra. No hace falta que sea un REPO, simplemente
> una máquina de backup donde tener los ficheros imagen y los torrent.
> 3.- si los equipos destino tienen disco SSD comprobar que las particiones
> esten alineadas. Esto es muy importante.
> 4.- Realizar un procedimiento para hacer que las aulas o equipos que
> tengan la imagen puedan hacer de seeders. Basicamente es lanzar un ctorrent
> y esperar al chequeo de cada imagen, pero esto ayuda mucho a subir la
> velocidad de descarga. Esto equivale a multiplicar el consejo 2 por el
> numero de máquinas en las que se ejecute el procedimiento. Por ejemplo, se
> puede descargar primero en el aula donde sea más rapido el despliegue y
> luego añadir sus equipos como seeders para acelerar al resto.
> 5.- Tener REPOS repartidos por diferentes tramos de la red. Esto depende
> de la infraestructura de cada uno.
>
> Miguel, Perdona el ladrillo, al final me ha salido algo largo. En resumen,
> prueba de cambiar el bittornado por un script que te lance los ctorrent (en
> el mismo rc.local) y a ver que tal.
>
> Saludos,
> Pep.
>
> --
> O O O Universitat Politecnica de Catalunya
> O O O BarcelonaTECH
> O O O ------------------------------------
> U P C Facultat de Matematiques i Estadistica
>       Pau Gargallo, 14 - 08028 Barcelona
>
>       Pep Ciuraneta Sanchez
>       Serveis TIC
>       josep.ciuraneta en upc.edu
>       Tel. 934015853
>
> AVIS DE CONFIDENCIALITAT:
> Aquest missatge pot contenir informacio confidencial o legalment protegida i esta exclusivament adrecat a la persona o entitat destinataria. Si no sou el destinatari final o persona encarregada de recollir-lo, no esteu autoritzat a llegir-lo, retenir-lo, modificar-lo, distribuir-lo, copiar-lo ni a revelar el seu contingut. Si heu rebut aquest missatge per error, us preguem que informeu al remitent i elimineu del vostre sistema el missatge i el material annex que pugui contenir. Gracies per la vostra col.laboracio.
>
> Abans d'imprimir aquest correu, penseu si es necessari.
>
>
>
> Missatge de Miguel Sánchez Sánchez <msanchez en fi.upm.es> del dia dv., 9 de
> jul. 2021 a les 12:39:
>
>> Buenas. Me estoy encontrando con que un porcentaje de ogLive, cuando van
>> a acabar la descarga de una imagen, ctorrent aborta con error
>> std::bad_array_new_length.
>> Todos los clientes torrent van más o menos igual en la descarga, pues
>> acaban bien o fallan al alimón, pues el semillero en el servidor parece
>> que no supera los 50Mbit por conexión, y aunque empiezan la descarga
>> aleatoriamente van convergiendo. Abortan con un número pequeño de partes
>> por completar, menos de 20.
>>
>> No estoy seguro si está relacionado con algún parámetro del semillero en
>> el servidor, pues hasta ahora nuestro servidor de OpenGnsys estaba un
>> poco escaso de recursos y el problema parece que desaparecía cuando se
>> limitaban en el semillero el número de peers que se podían conectar.
>> Pero hemos cambiado a versión 1.2.0 en un nuevo servidor y el problema
>> persiste.
>> El semillero que estamos utilizando actualmente es
>> btlaunchmany.bittorrent, por aquello de que utiliza un thread por imagen
>> servida. Pero creo recordar que con btlaunchmany.bittornado los errores
>> también se producían.
>>
>> ¿Os habéis encontrado alguno con este problema? ¿Cómo lo habéis
>> solventado?
>>
>> Saludos.
>> _______________________________________________
>> Opengnsys-users mailing list
>> Opengnsys-users en listas.unizar.es
>> https://listas.unizar.es/cgi-bin/mailman/listinfo/opengnsys-users
>> ----------
>> INFORMACIÓN SOBRE PROTECCIÓN DE DATOS DE CARÁCTER PERSONAL
>>
>> Ud. recibe este correo por pertenecer a una lista de correo gestionada
>> por la Universidad de Zaragoza.
>> Puede encontrar toda la información sobre como tratamos sus datos en el
>> siguiente enlace:
>> https://sicuz.unizar.es/informacion-sobre-proteccion-de-datos-de-caracter-personal-en-listas
>> Recuerde que si está suscrito a una lista voluntaria Ud. puede darse de
>> baja desde la propia aplicación en el momento en que lo desee.
>> http://listas.unizar.es
>> ----------
>>
>
> _______________________________________________
> Opengnsys-users mailing listOpengnsys-users en listas.unizar.eshttps://listas.unizar.es/cgi-bin/mailman/listinfo/opengnsys-users
> ----------
> INFORMACIÓN SOBRE PROTECCIÓN DE DATOS DE CARÁCTER PERSONAL
>
> Ud. recibe este correo por pertenecer a una lista de correo gestionada por la Universidad de Zaragoza.
> Puede encontrar toda la información sobre como tratamos sus datos en el siguiente enlace: https://sicuz.unizar.es/informacion-sobre-proteccion-de-datos-de-caracter-personal-en-listas
> Recuerde que si está suscrito a una lista voluntaria Ud. puede darse de baja desde la propia aplicación en el momento en que lo desee.http://listas.unizar.es
> ----------
>
>
> _______________________________________________
> Opengnsys-users mailing list
> Opengnsys-users en listas.unizar.es
> https://listas.unizar.es/cgi-bin/mailman/listinfo/opengnsys-users
> ----------
> INFORMACIÓN SOBRE PROTECCIÓN DE DATOS DE CARÁCTER PERSONAL
>
> Ud. recibe este correo por pertenecer a una lista de correo gestionada por
> la Universidad de Zaragoza.
> Puede encontrar toda la información sobre como tratamos sus datos en el
> siguiente enlace:
> https://sicuz.unizar.es/informacion-sobre-proteccion-de-datos-de-caracter-personal-en-listas
> Recuerde que si está suscrito a una lista voluntaria Ud. puede darse de
> baja desde la propia aplicación en el momento en que lo desee.
> http://listas.unizar.es
> ----------
>
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <http://listas.unizar.es/pipermail/opengnsys-users/attachments/20210712/5adafcb5/attachment-0001.html>


Más información sobre la lista de distribución Opengnsys-users