Migliaia di repository GitHub esposti, ora privati, sono ancora accessibili tramite Copilot

Gli esperti di sicurezza avvertono che i dati esposti a Internet, anche solo per un momento, possono rimanere nei chatbot di intelligenza artificiale generativa online come Microsoft Copilot molto tempo dopo che i dati sono diventati privati.
Secondo le nuove scoperte di Lasso, un'azienda israeliana di sicurezza informatica focalizzata sulle minacce emergenti dell'intelligenza artificiale generativa, sono interessati migliaia di repository GitHub, un tempo pubblici, di alcune delle più grandi aziende del mondo, tra cui Microsoft.
Il co-fondatore di Lasso, Ophir Dror, ha detto a TechCrunch che l'azienda ha trovato contenuti dal suo repository GitHub che apparivano in Copilot perché erano stati indicizzati e memorizzati nella cache dal motore di ricerca Bing di Microsoft. Dror ha detto che il repository, che era stato reso pubblico per errore per un breve periodo, era stato da allora impostato su privato e che accedervi su GitHub restituiva un errore "pagina non trovata".
"Su Copilot, sorprendentemente, abbiamo trovato uno dei nostri repository privati", ha detto Dror. "Se dovessi navigare sul web, non vedrei questi dati. Ma chiunque al mondo potrebbe porre la domanda giusta a Copilot e ottenere questi dati".
Dopo essersi reso conto che tutti i dati su GitHub, anche se conservati per breve tempo, avrebbero potuto essere potenzialmente esposti da strumenti come Copilot, Lasso ha indagato ulteriormente.
Lasso ha estratto un elenco di repository che erano pubblici in qualsiasi momento del 2024 e ha identificato i repository che erano stati eliminati o impostati come privati nel frattempo. Utilizzando il meccanismo di memorizzazione nella cache di Bing, l'azienda ha scoperto che oltre 20.000 repository GitHub privati avevano ancora dati accessibili tramite Copilot, il che ha interessato oltre 16.000 organizzazioni.
Le organizzazioni interessate includono Amazon Web Services, Google, IBM, PayPal, Tencent e la stessa Microsoft, secondo Lasso. Per alcune aziende interessate, Copilot potrebbe essere invitato a restituire archivi GitHub riservati che contengono proprietà intellettuale, dati aziendali sensibili, chiavi di accesso e token, ha affermato l'azienda.
Lasso ha osservato di aver utilizzato Copilot per recuperare il contenuto di un repository GitHub, nel frattempo eliminato da Microsoft, che ospitava uno strumento che consentiva la creazione di immagini di intelligenza artificiale "offensive e dannose" utilizzando il servizio di intelligenza artificiale cloud di Microsoft.
Dror ha affermato che Lasso ha contattato tutte le aziende interessate che erano state "gravemente colpite" dall'esposizione dei dati e ha consigliato loro di ruotare o revocare tutte le chiavi compromesse.
Nessuna delle aziende interessate nominate da Lasso ha risposto alle domande di TechCrunch. Anche Microsoft non ha risposto all'inchiesta di TechCrunch.
Lasso informò Microsoft delle sue scoperte nel novembre 2024. Microsoft disse a Lasso che aveva classificato il problema come "di bassa gravità", affermando che questo comportamento di memorizzazione nella cache era "accettabile", Microsoft non incluse più i link alla cache di Bing nei suoi risultati di ricerca a partire da dicembre 2024.
Tuttavia, Lasso afferma che, nonostante la funzionalità di memorizzazione nella cache fosse disattivata, Copilot aveva comunque accesso ai dati, anche se questi non erano visibili tramite le tradizionali ricerche web, il che indica una soluzione temporanea.
techcrunch