Meta ha due nuovi bot che raccolgono dati in rete per addestrare l’AI

Meta continua a investire nei i suoi progetti di intelligenza artificiale. Lo scorso mese, infatti, la compagnia ha rilasciato due nuovi bot progettati per scansionare il web e raccogliere dati utili per la formazione dell’AI, rendendo ai proprietari dei siti web ancora più difficile bloccare la loro azione di scraping, ossia il rastrellamento dei dati dalla rete. Nello specifico, secondo quanto riferito dalla società, il bot Meta-ExternalAgent è pensato “per casi d’uso come l’addestramento di modelli AI o il miglioramento di prodotti” correlati attraverso l’indicizzazione dei contenuti, svolgendo così un doppio lavoro. Il bot Meta-ExternalFetcher, invece, è dedicato a raccogliere link per supportare funzioni specifiche dei prodotti AI di assistenza.

Il logo di Meta nel quartier generale di Menlo ParkJustin Sullivan/Getty Images - Fonte: Wired


Tuttavia sembra che i proprietari dei siti web non abbiamo ancora preso provvedimenti, anche se hanno adottato contromisure ferree per evitare la raccolta dei dati da parte dei bot di OpenAI, Anthropic e altri. Secondo quanto riportato da Originality.AI, soltanto l’1,5% dei siti web più noti al mondo sta bloccando il nuovo bot Meta-ExternalAgent. Il motivo? I proprietari dei siti potrebbe essere interessati al fatto che il bot indicizzi i loro contenuti, così da ampliarne la visibilità e incrementarne il traffico. Stesso destino anche per Meta-ExternalFetcher, bloccato da meno dell’1% dei siti web più noti e visitati dagli utenti.

Sembra che Meta sia riuscita a trovare la “soluzione” per raccogliere i dati di cui ha bisogno per la formazione dei suoi modelli AI, senza indispettire i proprietari dei siti web. Scambiare la visibilità con i dati può risultare poco etico, ma è senza dubbio molto funzionale. “Come altre aziende, addestriamo i nostri modelli di AI generativa su contenuti pubblicamente disponibili online - ha riferito un portavoce di Meta a Business Insider -. E riconosciamo che alcuni editori e proprietari di domini web vogliono avere delle opzioni di scelta per quanto riguarda i loro siti web e l’AI generativa”. Proprio per questo, la società permette a proprietari di siti web e sviluppatori di scegliere se bloccare o meno l’attività dei suoi bot. Per ora nessuno sembra intenzionato a farlo.


Fonte: Wired

  • Condividi:

Altri articoli di Redazione TheLiquidJournal

Evoluzione e declino delle neobanche

Revolut, Monzo e Starling avrebbero dovuto minacciare la stabilità del sistema bancario tradizionale

Ora la moda si converte agli showroom in realtà virtuale

Ferragamo, Versace, Max Mara e altri marchi, anche grazie all’italiana Hyphen, stanno cavalcando la rivoluzione digitale con l’introduzione di processi e tecnologie all’avanguardia

L’enoturismo ha reso l’Italia la meta più desiderata nel 2019, il digitale sarà la risorsa chiave per non perdere questo primato

L’Università Bocconi con la collaborazione del Consorzio di Tutela del Gavi, ha condotto una ricerca sull’enoturismo

Must Read

Ultimi articoli di Innovazione

Anthropic raccoglie fondi per sfidare OpenAI sull’intelligenza artificiale

La società fondata dai fratelli italoamericani Dario e Daniela Amodei è pronta a competere sempre più con il gruppo di Altman per il ruolo di leader del settore

Dai tostapane agli smartphone, nasce BALMUDA Phone

Un nuovo ingresso nel competitivo mondo degli smartphone, ma non è una startup, anzi l’azienda è molto nota anche in occidente. Ma per i suoi raffinati tostapane.

Un nuovo sistema di traduzione automatica

È DeepL Pro, dell’omonima startup, ed è disponibile in 165 paesi. Obiettivo: aiutare le aziende ad accelerare la loro espansione nel mercato globale

Tesla introdurrà dispositivi per il rilevamento di presenza all’interno delle sue vetture

L’intenzione di Tesla di introdurre dispositivi intelligenti per rilevare la presenza all’interno dell’abitacolo è rivolta in special modo alla salvaguardia dei più piccoli.