Cientistas dão novos nomes para genes humanos por causa do Excel; entenda
TECNOLOGIA
Publicado em 09/02/2021

O genoma humano é composto por dezenas de milhares de genes e cada um deles guarda determinadas características que são transmitidas de forma hereditária. Para se diferenciarem, essas partes do DNA recebem um nome específico junto de um código alfanumérico, de acordo com a imaginação dos cientistas ou suas características. Entretanto, essa criatividade tem limites, colocados pelo Excel, o editor de planilhas da Microsoft.

Somente no ano passado, cerca de 25 genes humanos foram renomeados, tudo porque o Excel interpreta a abreviação de seus nomes, o símbolo de cada gene, como datas, o que causa uma confusão nas planilhas. Isso porque o programa é muito usado pelos cientistas para rastrear e até conduzir ensaios clínicos.

No entanto, as configurações, de forma geral, não foram pensadas para esse fim, segundo os pesquisadores. A prova disso é que quando um usuário insere um símbolo alfanumérico aleatório de um gene em uma planilha, como MARCH1 (abreviação de Membrane Associated Ring-CH-Type Finger 1), o Excel o converte, automaticamente, em uma data (1-Mar). Veja o que a acontece com o símbolo:

excel-genes
Cientistas mudam nomes de genes por causa do Excel (GIF: Reprodução/ The Verge)

Problema de cientista

Em 2016, um estudo australiano examinou dados genéticos presentes em 3.597 artigos publicados e descobriu que aproximadamente um quinto deles tinha sido afetado por erros causados, de forma automática, pelo Excel. Para arrumar esses dados corrompidos, os cientistas precisam examinar manualmente cada célula da planilha, restaurando os nomes corretos dos genes.

"É muito, muito chato", afirma Dezső Módos, biólogo de sistemas do Quadram Institute, no Reino Unido, para o The Verge. Analisando dados genéticos recém-sequenciados, o biólogo comenta que esses erros no Excel são bastante comuns e acontecem o tempo todo. Isso porque o software é, frequentemente, usado por cientistas, principalmente por aqueles que estão no início de carreira, para o processamento de dados numéricos.

No entanto, o Excel não oferece uma opção que desative a formatação automática, ou seja, a única maneira de evitá-la é alterando o tipo de dados para as colunas individuais. Mesmo que um cientista corrija os próprios dados, dependendo da forma como alguém abrir a mesma planilha para a edição, os erros podem reaparecer.

Novos nomes

Para evitar que o problema continue a afetar a produção acadêmica e a análise de genes, o HUGO Gene Nomenclature Committee (HGNC) publicou, nesta semana, novas diretrizes para a nomeação de genes, incluindo “símbolos que afetam o manuseio e a recuperação de dados”. A partir de então, a orientação é de que os genes humanos e as proteínas que eles expressem sejam nomeados de acordo com a formatação automática do Excel.

"Consultamos as respectivas comunidades de pesquisa para discutir as atualizações propostas e também notificamos pesquisadores que haviam publicado sobre esses genes, especificamente, quando as mudanças estavam sendo efetivadas", explica Elspeth Bruford, coordenadora do comitê responsável pelas mudanças.

Para evitar confusões, nomes de genes foram adaptados para o uso no Excel (Imagem: Reprodução/ Pixabay)

A partir de então, o símbolo MARCH1, usado no começo do texto como exemplo, agora passa a ser conhecido como MARCHF1, já o SEPT1 se torna o SEPTIN1. Para garantir que eventuais problemas aconteçam no futuro por causa dessas alterações, o HGNC armazenará um registro de símbolos e nomes antigos.

Segundo Bruford, as mudanças poderiam ter acontecido de forma contrária, ou seja, o Excel se adaptando ao uso feito pelo software dos cientistas. No entanto, "este é um caso de uso bastante limitado do software Excel... Há muito pouco incentivo para a Microsoft fazer uma alteração significativa nos recursos que são usados ​​extremamente amplamente pelo restante da comunidade massiva de usuários do Excel", declara.

Embora possa ser curiosa a decisão de renomear genes, essa não foi a primeira vez que isso aconteceu na história. Um outro exemplo é que muitos símbolos genético podiam ser lidos como substantivos e, por isso, foram renomeados, evitando possíveis entendimentos errados. Nesse sentido, CARS (carros, em português) foi adaptado para CARS1, já WARS (guerras, em português) virou WARS1. "Sempre temos que imaginar um clínico tendo que explicar aos pais que seus filhos têm uma mutação em um gene específico", lembra Bruford sobre a importância dos nomes não causarem confusão.

Comentários