cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br

[ad_1]

Algumas notícias muito interessantes foram anunciadas recentemente sobre o impacto da Inteligência Artificial na previsão da estrutura da proteína. Mas, como muitos de nós, você provavelmente pensou: “Oh, que bom”. Seguido por: “Mas é improvável que isso tenha impacto sobre a medicina de laboratório” ou “Não tenho ideia de como eles fizeram isso”. Hoje vou ajudar a reverter esses dois últimos pensamentos para você!

A grande notícia foi que uma empresa britânica especializada em inteligência artificial, a DeepMind (de propriedade do Google, é claro), venceu a competição CASP14. CASP14 é o 14º edição da competição bake-off bianual, onde as equipes usam abordagens bioinformáticas para prever estruturas de proteínas. Os organizadores então avaliam como as previsões correspondem às estruturas derivadas experimentalmente usando uma pontuação chamada: GDT. Esta pontuação reflete a distância de onde algo está vs. onde deveria estar. Cada uma das ~ 150 sequências de proteínas são pontuadas nesta base e recebem uma pontuação de identidade percentual final (0-100%).

Prevendo variantes patogênicas? - Lablogatory 2
Figura 1. O Z-score é apenas a diferença do valor de uma amostra em relação à média da população, dividido pelo desvio padrão. Os grupos marcadamente melhores do que a média terão escores Z maiores.

Desde que a competição começou em 1997, os vencedores pontuaram cerca de 50% em média. Isso foi até 2 anos atrás, quando AlphaFold, a IA criada pela DeepMind, venceu com uma pontuação máxima de 55%. O artigo foi publicado em acesso aberto (Ref: https://www.nature.com/articles/s41586-019-1923-7) e usou técnicas semelhantes aplicadas por outros, onde as proteínas foram progressivamente dobradas por um computador até que o estado de menor energia seja revelado.

Prevendo variantes patogênicas? - Lablogatory 3
Figura 2. Melhorias na precisão da mídia das previsões na categoria de modelagem livre para a melhor equipe em cada CASP. Medido como melhor de 5 GDT.
GDT: Teste de distância global (0-100); a porcentagem de resíduos de aminoácidos dentro de uma distância limite da posição correta. GDT de cerca de 90 é considerado competitivo com os resultados obtidos a partir de métodos experimentais.

Os programas que conduzem esse dobramento podem considerar carga de aminoácidos, tamanho e polaridade, conservação genética (Ref) ou similaridade com outros domínios de proteína. No entanto, a inovação aqui foi que DeepMind usou inteligência artificial para examinar informações de sequência com uma rede neural convolucional para identificar restrições estruturais que são usadas para prever o dobramento preciso de proteínas.

Prevendo variantes patogênicas? - Lablogatory 4

Figura 3. Sequência de eventos de Dataà Deep neural network (Artificial intelligence) àPredições à Processo de dobramento de proteínas. (Figura 2 desta referência: https://www.nature.com/articles/s41586-019-1923-7/figures/2).

Isso resulta em um daqueles algoritmos famosos de que você já ouviu falar. No entanto, esses algoritmos são mais complexos do que uma regressão linear simples e é quase impossível rastrear exatamente como os diferentes níveis de importância foram atribuídos a cada variável. Um requisito importante para um algoritmo derivado de IA preciso é que ele tenha um grande conjunto de dados de treinamento. Felizmente para a Deepmind, eles foram capazes de treinar AlphaFold usando cerca de 170.000 estruturas que foram determinadas experimentalmente usando cristalografia de raios-X, espectroscopia de ressonância magnética nuclear e microscopia eletrônica.

cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br

Embora não tenhamos visto o que mudou entre AlphaFold e AlphaFold 2, descobrimos que AlphaFold 2 superou amplamente o original em CASP14 com 91% de precisão. Quando os programas são> 90% precisos, eles são considerados essencialmente tão bons quanto as estruturas derivadas experimentalmente. Na verdade, AlphaFold 2 foi capaz de fornecer mais informações do que os experimentos! Um pesquisador descobriu que sua estrutura derivada experimentalmente tinha uma configuração diferente daquela prevista por AlphaFold, então eles presumiram que a previsão por AlphaFold 2 estava incorreta. Após uma análise mais aprofundada, a estrutura derivada experimentalmente foi considerada muito semelhante à estrutura prevista por AlphaFold 2. Em outro caso, AlphaFold 2 previu que um aminoácido estava em uma conformação raramente encontrada, então eles perceberam que AlphaFold 2 cometeu um erro. Depois de reanalisar os dados experimentais, eles descobriram que o AlphaFold 2 estava correto. Suspeitou-se até que várias estruturas de pontuação mais baixa com base em dados de NMR podem refletir menor precisão na estrutura experimental em vez de um problema com o algoritmo.

Prevendo variantes patogênicas? - Lablogatory 5
Figura 4. Modelo (à esquerda) para o alvo T1064 (vermelho) superimporado na estrutura do DeepMind em CASP14 (azul). (Direita) As estruturas pretas e verdes são dos vice-campeões que fizeram previsões para a mesma estrutura (correto em azul). Obtido na página do CASP14 na terça-feira, 1º de dezembro de 2020.

A IA substituirá a cristalografia experimental? Para responder a essa pergunta, procurei um colega em meu laboratório de ciências básicas, Lijing Su, que é biólogo estrutural há muitos anos. Como muitos casos de IA, esta é uma ferramenta útil, mas não substitui inteiramente seu trabalho, porque grande parte da pesquisa em biologia estrutural se concentra em como as proteínas se movem e mudam à medida que fazem seu trabalho. A biologia estrutural foi além das estruturas de proteínas individuais e agora está focada em como diferentes proteínas interagem. Ainda há um papel para os cristalógrafos, pois AlphaFold não pode desempenhar esse papel … ainda.

Tudo isso ainda levanta a questão de um laboratorista “Quem precisa saber a estrutura da proteína de qualquer maneira?“Nós entendemos que conhecer as estruturas das proteínas pode ajudar a explicar a função, o que tem implicações no desenvolvimento de drogas. Contudo, nosso papel principal é fornecer testes que diagnosticam doenças. Um grande desafio na patologia molecular é prever se uma variante genética causa perda da função da proteína. O software atual tem baixo desempenho (sensibilidade do PolyPhen2 = 45% de especificidade = 50%), pois mede principalmente as mudanças nas propriedades químicas e na conservação do sítio de aminoácidos. Uma aplicação potencial do AlphaFold é examinar o efeito das variantes genéticas na estrutura da proteína. Seria previsto que as alterações patogênicas deformassem porções da estrutura, prejudicando a atividade ou provocando degradação por meio da resposta da proteína desdobrada.

Como a velocidade atual do programa é bastante longa, isso pode ser difícil de implementar imediatamente, mas é imaginável que isso se torne mais rápido. Uma maneira simples de validar este software de IA seria usar variantes patogênicas ou benignas confirmadas do banco de dados público ClinVar. Existem mais de 1.000.000 de entradas neste banco de dados, o que forneceria um conjunto útil de treinamento e validação. É provável que a mudança na estrutura da proteína seja um mecanismo mais forte de doença para certos tipos de proteínas (canais iônicos para epilepsia ou cadeias de miosina para distúrbios musculares) e um preditor menos forte de patogenicidade para outros tipos de proteínas (enzimas para distúrbios metabólicos ou proteínas de sinalização onde a interação proteína-proteína é importante para a função).

Esta entrada do blog foi escrita com as percepções e conhecimentos muito úteis de Lijing Su, PhD.

Referências

  1. Senior AW et al. Melhor predição da estrutura da proteína usando potenciais de aprendizagem profunda. Natureza. 2020; 577: 706–710.
  2. Site do CASP14: https://predictioncenter.org/casp14/
  3. Arnold CN et al. Fenovariância induzida por ENU em camundongos: inferências de 587 mutações. BMC Res Notes. 2012; 5: 577.
  4. https://deepmind.com/blog/article/alphafold-a-solution-to-a-50-year-old-grand-challenge-in-biology

-Lijing Su é professor assistente no Centro de Genética de Defesa de Hospedeiros da University of Southwestern Medical Center. Ela é especialista em biologia estrutural e ajuda a determinar interações multi-proteínas para explicar mecanismos desconhecidos de genes importantes para a imunologia.

Prevendo variantes patogênicas? - Lablogatory 6

Jeff SoRelle, MD, é instrutor assistente de patologia no Southwestern Medical Center da Universidade do Texas em Dallas, TX, trabalhando no laboratório de sequenciamento de última geração. Seus interesses de pesquisa clínica incluem a compreensão de como a medicina de laboratório afeta a saúde para transgêneros e o aprimoramento da interpretação de variantes genéticas. Siga-o no Twitter @Jeff_SoRelle.

[ad_2]

cupom com desconto - o melhor site de cupom de desconto cupomcomdesconto.com.br

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *