META ha entrenado a su IA con la plataforma de peertube

Estuve leyendo el artículo que compartió la cuenta FediPact ayer, donde se citaba la filtración de un documento con la lista de más de mil sitios a los que META scrapeó para entrenar a sus modelos de IA. Pueden descargalo aquí.

Resulta que entre los numerosos sitios que había encontré a video.anartist.org :shaking_face:

No sé qué se puede hacer al respecto. En el propio artículo confiesa que los archivos robots.txt son inútiles para evitar este asedio. Hoy también leí una publicación de @t3rr0z0n3 donde compartió una herramienta para bloquear a algunos bots que intentan scrapear la instancia de xarxa.cloud, pero reconoce que es insuficiente. Quizás se pueda replicar ese esfuerzo en nuestro servidor de Mastodon. ¿Qué opinan?

1 me gusta

GUUUUAT!?! Malditos! Sí, habría que ver como bloqueamos esto :scream:
Gracias por pasar dato

1 me gusta

Nose que hacer soy una ignorante en temas de programación, pero de todas formas gracias por la información, con esto detesto mas a meta :frowning:

1 me gusta