INVESTIGACIÓN BIOTECNOLOGÍA

Crean un algoritmo que detecta los errores en las secuenciaciones masivas

EFEFUTURO.- Científicos del Centro de Astrobiología (INTA) y del Centro Nacional de Biotecnología (CNB) han desarrollado un nuevo algoritmo que permite filtrar con mucha precisión las secuencias erróneas de los estudios de secuenciación masiva de ácidos nucleicos.

Crean un algoritmo que detecta los errores en las secuenciaciones masivas
La secuenciación es una moderna técnica que permite leer la información contenida en las moléculas de ADN o ARN, es decir, se obtiene la lista de bases (adenina, citosina, guanina, timina/uracilo) que compone el segmento leído.

Gracias a las actuales plataformas de secuenciación masiva, se pueden producir millones de lecturas en poco tiempo y por un bajo coste, lo que ha supuesto una revolución en muchas disciplinas científicas como la biología o la paleontología, entre otras.

Sin embargo, algunas de estas lecturas pueden contener errores de secuenciación que comprometen los resultados y conducen a interpretaciones imprecisas.

Errores peligrosos en los estudios de poblaciones microbianas


Los errores, que son frecuentes en estos estudios, repercuten en mayor medida en los referidos a poblaciones microbianas.

Cuando los errores alcanzan, al menos, el 3 por ciento en toda una secuencia leída, que se suponía de una misma especie, aparecen lo que el investigador principal, Fernando Puente Sánchez, llama “especies fantasmas”.

Por tanto, se produce una sobreestimación muy acusada de la diversidad microbiana presente en la muestra.

“Se trata de un problema que se aprecia sobre todo en la secuenciación masiva, porque al haber muchas más secuencias, el número total de errores también es mayor”, comenta el científico.

Precisamente, Puente Sánchez necesitaba analizar poblaciones microbianas para su tesis y los errores que surgían de la secuenciación lo llevaron a desarrollar este estudio, que comenzó hace dos años, para identificarlos.

“Al hacer el análisis, el secuenciador te indica cuánto ‘se fía’ de cada base analizada. El algoritmo utiliza esa información para descartar las secuencias que tengan más probabilidad de contener errores, y obtener así un resultado más preciso”, sostiene.

El método se validó con 37 conjuntos de datos públicos de secuenciación masiva de comunidades microbianas artificiales y ambientales, con las plataformas de secuenciación 454-Roche, Illumina MiSeq y IonTorrent PGM.

Los resultados obtenidos con este nuevo algoritmo se compararon con los obtenidos con otros métodos al uso, como los incluidos en las distribuciones de software mothur, QIIME y USEARCH, tres referentes en el campo de la ecología microbiana.

Un algoritmo compatible con todas las plataformas y ordenadores


El algoritmo PBF descarta sustancialmente menos lecturas que sus predecesores, pero produce representaciones más fidedignas, tanto cuantitativa como cualitativamente, de la verdadera diversidad microbiana presente en las muestras estudiadas.

Además, el algoritmo da resultados óptimos para todas las plataformas de secuenciación existentes y requiere de poca potencia de cálculo, es decir, se puede ejecutar en cualquier ordenador.

Asimismo, el algoritmo PBF está diseñado para que sea fácil de integrar en los protocolos de análisis de datos ya existentes.

Por todo ello, sus creadores confían en que el uso de su método se extienda rápidamente en el campo de la ecología microbiana.

El Centro de Astrobiología (CAB), el primer centro del mundo dedicado únicamente a la investigación astrobiológica, es un centro de investigación mixto del CSIC y del Instituto Nacional de Técnica Aeroespacial (INTA), asociado al NASA Astrobiology Institute (NAI). EFEfuturo
Etiquetado con: , , ,
Publicado en: Ciencia
La secuenciación es una moderna técnica que permite leer la información contenida en las moléculas de ADN o ARN, es decir, se obtiene la lista de bases (adenina, citosina, guanina, timina/uracilo) que compone el segmento leído.

Gracias a las actuales plataformas de secuenciación masiva, se pueden producir millones de lecturas en poco tiempo y por un bajo coste, lo que ha supuesto una revolución en muchas disciplinas científicas como la biología o la paleontología, entre otras.

Sin embargo, algunas de estas lecturas pueden contener errores de secuenciación que comprometen los resultados y conducen a interpretaciones imprecisas.

Errores peligrosos en los estudios de poblaciones microbianas


Los errores, que son frecuentes en estos estudios, repercuten en mayor medida en los referidos a poblaciones microbianas.

Cuando los errores alcanzan, al menos, el 3 por ciento en toda una secuencia leída, que se suponía de una misma especie, aparecen lo que el investigador principal, Fernando Puente Sánchez, llama “especies fantasmas”.

Por tanto, se produce una sobreestimación muy acusada de la diversidad microbiana presente en la muestra.

“Se trata de un problema que se aprecia sobre todo en la secuenciación masiva, porque al haber muchas más secuencias, el número total de errores también es mayor”, comenta el científico.

Precisamente, Puente Sánchez necesitaba analizar poblaciones microbianas para su tesis y los errores que surgían de la secuenciación lo llevaron a desarrollar este estudio, que comenzó hace dos años, para identificarlos.

“Al hacer el análisis, el secuenciador te indica cuánto ‘se fía’ de cada base analizada. El algoritmo utiliza esa información para descartar las secuencias que tengan más probabilidad de contener errores, y obtener así un resultado más preciso”, sostiene.

El método se validó con 37 conjuntos de datos públicos de secuenciación masiva de comunidades microbianas artificiales y ambientales, con las plataformas de secuenciación 454-Roche, Illumina MiSeq y IonTorrent PGM.

Los resultados obtenidos con este nuevo algoritmo se compararon con los obtenidos con otros métodos al uso, como los incluidos en las distribuciones de software mothur, QIIME y USEARCH, tres referentes en el campo de la ecología microbiana.

Un algoritmo compatible con todas las plataformas y ordenadores


El algoritmo PBF descarta sustancialmente menos lecturas que sus predecesores, pero produce representaciones más fidedignas, tanto cuantitativa como cualitativamente, de la verdadera diversidad microbiana presente en las muestras estudiadas.

Además, el algoritmo da resultados óptimos para todas las plataformas de secuenciación existentes y requiere de poca potencia de cálculo, es decir, se puede ejecutar en cualquier ordenador.

Asimismo, el algoritmo PBF está diseñado para que sea fácil de integrar en los protocolos de análisis de datos ya existentes.

Por todo ello, sus creadores confían en que el uso de su método se extienda rápidamente en el campo de la ecología microbiana.

El Centro de Astrobiología (CAB), el primer centro del mundo dedicado únicamente a la investigación astrobiológica, es un centro de investigación mixto del CSIC y del Instituto Nacional de Técnica Aeroespacial (INTA), asociado al NASA Astrobiology Institute (NAI). EFEfuturo

RSS Feed desconocido

Uso de cookies

Utilizamos cookies propias y de terceros para mejorar nuestros servicios y mostrarle publicidad relacionada con sus preferencias mediante el análisis de sus hábitos de navegación. Si continúa navegando, consideramos que acepta su uso. Puede obtener más información, o bien conocer cómo cambiar la configuración, en nuestra política de cookies, pinche el enlace para mayor información.

Login

Registro | Contraseña perdida?