Origini della Covid: perché la storia delle 13 sequenze di dicembre 2019 cancellate non è un giallo

Uno studio preprint pubblicato da un ricercatore americano non riaccende le discussioni sull’origine del virus, i dati “scoperti” sono pubblici da marzo 2020

Un ricercatore di Seattle, il biologo computazionale Jesse Bloom della Fred Hutchinson Cancer Research Center, afferma di aver scoperto dei dati riguardanti delle sequenze del Sars-Cov-2 «misteriosamente rimossi» dal database americano Sequence Read Archive della NIH. Lo rende noto attraverso un documento preprint pubblicato su Biorxiv (non revisionato), ripreso dai media come un nuovo giallo sull’origine della Covid19 e in alcuni casi come una nuova prova a sostegno della fuga da un laboratorio nonostante lo stesso autore non lo dichiari affatto. Una rimozione illecita dal database americano? Bloom scagiona in un tweet l’NIH, ricordando che la politica del Sequence Read Archive consente agli autori dell’inserimento di inviare una richiesta di rimozione tramite email, mantenendo in archivio le motivazioni presentate nella richiesta di rimozione che sarebbero state fornite dallo stesso ente al ricercatore (come lui stesso afferma in un tweet). C’è da dire che non si tratta affatto di un nuovo giallo o una nuova spy story sull’origine del virus, per il semplice motivo che tali sequenze erano già note alla comunità scientifica e disponibili in altre pubblicazioni del 2020.

Per chi ha fretta:

  • Secondo quanto afferma Bloom, la rimozione delle sequenze è avvenuta prima nel database americano.
  • Non è l’unica rimozione richiesta nel database americano, nell’ultimo anno sono state presentate 8 richieste.
  • Le richieste di rimozione vengono fatte dagli autori dell’inserimento.
  • Bloom riscontra le stesse sequenze in uno studio cinese in preprint nel marzo 2020 e pubblicato con la peer review a giugno 2020.
  • Lo studio che riporta le stesse sequenze non è stato rimosso o ritirato.
  • Le informazioni “scoperte” da Bloom non sono per nulla nuove e sono note all’intera comunità scientifica fin dall’inizio del 2020.

Analisi

Ad ammettere che i dati cancellati erano di dominio pubblico, dunque a conoscenza dell’intera comunità scientifica, è lo stesso Bloom in un tweet del 22 giugno 2021. Nel suo messaggio, afferma che le sequenze corrispondevano con quelle contenute in uno studio preprint caricato su Medrxiv il 6 marzo 2020, pubblicato il 24 giugno 2020 dalla rivista Small passando la peer review. Come afferma lo stesso Blomm, si tratta di sequenze ricavate da 45 campioni nasofaringei prelevati a Wuhan da altrettanti pazienti ambulatoriali. Dai 34 test risultati positivi al virus, Bloom avrebbe poi ricavato le 13 sequenze che cita nella sua pubblicazione.

Detto questo, perché Bloom è intervenuto nell’intera discussione nonostante fossero dati noti a tutto il mondo e per nulla nascosti alla comunità scientifica? Nel lungo thread pubblicato via Twitter, il ricercatore spiega l’importanza dell’accesso ai dati e la loro condivisione, senza che questi vengano rimossi o nascosti, al fine di determinare le origini del Sars-Cov-2. C’è da dire, inoltre, che il ricercatore di Seattle è uno dei firmatari della lettera pubblicata su Science in cui vengono richieste ulteriori indagini sulle origini della Covid19, una corrispondenza dove tra i co-firmatari troviamo la dottoressa Alina Chan, una biologa molecolare che aveva citato il fantomatico Yan Report sponsorizzato da Steve Bannon. Non solo, Bloom aveva dato in qualche modo credito alle narrative del team DRASTIC e in particolare quella riguardante i fatti di Mojiang di cui ci siamo occupati nel dettaglio in un precedente articolo di Open Fact-checking.

Il processo di rimozione

Il database SRA dell’NIH è molto rigido dal punto di vista della catalogazione della documentazione. Infatti, le regole interne impongono che qualunque inserimento non possa essere in alcun modo aggiornato o sostituito. Bloom riporta un esempio di richiesta di rimozione, presentato dall’autore, della documentazione relativa al coronavirus del pangolino, accettata dall’NIH.

Email di richiesta di rimozione dal database SRA

La richiesta di rimozione delle sequenze “scoperte” da Bloom sarebbe stata presentata in data successiva al 30 marzo 2020, come riporta nel suo documento a pagina 2. Questo perché, come lui stesso non nasconde, i dati erano stati pubblicati nello studio poi pubblicato a giugno 2020 su Small. Bloom specifica, a pagina 3 del suo documento, che lo studio in preprint e in quello peer review non riporta alcuna correzione o note che indichino una giustificazione scientifica tale da spiegare la rimozione dal database dell’NIH.

Nessun illecito, ma delle criticità

Sia nel documento che via Twitter, Bloom non incolpa l’NIH di aver compiuto un illecito. Benché vi sia un processo ben preciso di richiesta di rimozione, e in totale mancanza di un aggiornamento dei dati, il ricercatore ritiene possibile che, di fronte a milioni di sequenze registrate, i dipendenti dell’ente non possano convalidare in maniera attenta tutte le richieste. Per tale ragione, Bloom suggerisce di rivalutare il sistema di archiviazione al fine di evitare improvvise cancellazioni di dati utili a valutare l’origine del Sars-Cov-2.

Le motivazioni dell’NIH

Secondo quanto riportato dal Washington Post, in un articolo del 24 giugno 2021, l’NIH ha rilasciato una dichiarazione affermando che le sequenze erano state rimosse dal database a seguito della richiesta pervenuta a giugno 2020 da parte di uno dei ricercatori coinvolti (l’ente non riporta il nome), motivata dal fatto che sarebbero state aggiornate e pubblicate in un database diverso.

L’NIH, interpellato ancora dal Washington Post, afferma che non si tratta di un caso isolato e che nel corso dell’ultimo anno ci sarebbero state 8 richieste di rimozione da diversi ricercatori che avevano precedentemente pubblicato la propria documentazione nel loro database. Nel documento, Bloom ritiene utile la possibilità di poter esaminare la corrispondenza email dell’ente per identificare ulteriori richieste di rimozione.

I cinesi hanno cancellato per primi?

Bisogna chiarire una cosa. I dati erano stati rimossi dal database americano Sequence Read Archive dell’NIH, ma quelle specifiche sequenze erano state fornite dagli scienziati cinesi così come la richiesta di rimozione sarebbe pervenuta da uno di loro. L’NIH precisa, sempre secondo quanto riportato dal Washington Post, che le restanti richieste di rimozione pervenute da inizio pandemia avevano come mittenti dei ricercatori americani. Bloom, in un tweet del 23 giugno 2021, sostiene che la rimozione delle sequenze sia avvenuta anche nel database China National GeneBank (CNGB) poco dopo («shortly after») la rimozione effettuata negli Stati Uniti.

Tweet di Jesse Bloom con la cronologia delle rimozioni

Ciò che risulta ulteriormente curioso è lo stesso Bloom riporta che le rimozioni dal database cinese risultano salvate su Web.Archive.org (qui e qui). Resta il fatto che lo studio reso pubblico a marzo 2020, così come la sua pubblicazione su Small nel giugno 2020, non risultano rimosse o ritirate dagli autori.

I pazienti di Guangdong

Alcuni dei campioni analizzati dai quali sono state tratte le sequenze “eliminate” provengono dei test PCR ricavati da alcuni pazienti della provincia meridionale del Guangdong (circa 800 km a sud di Wuhan). Questi pazienti, secondo quanto riportato da Bloom nella sua recente pubblicazione, si sarebbero recati a Wuhan a fine dicembre 2019 per poi tornare nella loro provincia e risulterebbe plausibile che possano essersi contagiati durante la loro permanenza.

Uno dei pazienti di Guangdong, secondo quanto riportato nello scritto di Bloom, avrebbe sviluppato i primi sintomi a Wuhan il 4 gennaio 2020. Nel documento non viene riportato alcun riferimento sul periodo trascorso a Wuhan che ci permetta di considerare se i soggetti fossero pre-sintomatici al loro arrivo a Wuhan (ricordiamo che per la Covid gli asintomatici possono trasmettere il virus). Non ci sono certezze, così come non possiamo sapere se questi potessero essere o meno i primi contagiati. Il test PCR utile all’individuazione dei positivi non esisteva a dicembre 2019, il virus non era stato ancora individuato e sequenziato, e risulta difficile scoprire se i primi episodi risalissero a inizio dicembre o inizio novembre 2019. Insomma, manca ancora il cosiddetto «paziente zero».

Le critiche degli esperti al documento di Bloom

Nell’articolo del Washington Post vengono riportati i commenti da parte di diversi esperti del settore. Tra questi troviamo il virologo Robert F. Garry, autore insieme a Kristian Andersen dell’articolo di Nature sull’origine naturale del Sars-Cov-2 (ne parlavamo nell’articolo sulle email inviate a Fauci), il quale afferma che i dati dello studio cinese erano rimasti a disposizione della comunità scientifica all’interno dell’appendice dello stesso studio. Stesso discorso da parte del virologo della Texas A&M University, Benjamin Neuman, il quale ribadisce ancora una volta che i dati delle sequenze erano rimasti pubblici. Un biologo evoluzionista dell’Università della California a San Diego che aveva studiato l’evoluzione del virus nella provincia di Hubei, Joel Wertheim, ha dichiarato che Bloom non avrebbe scoperto alcunché di nuovo e non aggiungerebbe nuovi elementi nel dibattito sulle origini del Sars-Cov-2.

Conclusioni

Parliamo di disinformazione in quanto la notizia è stata diffusa parzialmente, da media sia internazionali che italiani, senza riportare gli elementi presenti nello stesso documento pubblicato da Bloom, il quale dimostra che non c’è alcun “giallo” o una “spy story” sulla vicenda.

Foto di copertina: J.Bloom.

Leggi anche: