Não há dúvidas, o evento destes dias é o anúncio chocante do lançamento do DeepSeek, o concorrente chinês de baixo custo da OpenAI, se não fosse pelo alvoroço criado nos mercados de ações, arrastado pela queda repentina da NVIDIA. Muito foi escrito sobre o evento, incluindo especificações técnicas muito detalhadas: o nosso interesse é focar nos pontos principais desta questão para sustentar que, talvez, como muitas vezes acontece, houve exageros. Para explicar o sentido desta questão, recorremos a um exemplo. Todos estamos acostumados a ordenar uma lista de informações segundo um critério, por exemplo, ordenar uma lista de nomes em ordem alfabética em uma planilha excel. Existem algoritmos que realizam essa simples operação. Em sua versão primitiva, o algoritmo de ordenação exigia cerca de operações elementares (ou flops), onde
é o número de objetos a ordenar. Assim, para ordenar mil nomes, o algoritmo exigia cerca de 1 milhão de operações. Este algoritmo foi logo aperfeiçoado, reduzindo o número de operações para aproximadamente
exigindo, portanto, 10.000 operações para ordenar alfabeticamente 1000 nomes. Esta é uma típica inovação no campo da ciência computacional, e a inteligência artificial não é exceção.
Então, o que aconteceu com o DeepSeek? Fundamentalmente, três coisas:
1) Uma réplica das capacidades da OpenAI a custos muito mais baixos;
2) Foi distribuído com uma licença MIT e, portanto, de código aberto;
3) Oferece APIs que tornam seu uso muito simples, além de gratuito.
O primeiro ponto é o mais interessante para nós porque nos permite esclarecer alguns aspectos. Nas redes sociais, circulou a informação de que o DeepSeek basicamente emulou a OpenAI com um custo de apenas 5 milhões de dólares. Na realidade, essa é uma estimativa baseada no treinamento da V3, que trabalha com o Mixture-of-Expert, o que, por si só, requer menos poder computacional. Mas, além de ser uma estimativa, nada é dito sobre os custos de aprendizagem da R1, que é a versão que nos interessa. Além disso, ao que parece — mas teremos informações mais precisas nos próximos dias ou meses —, a pequena startup chinesa utilizou amplamente (e ainda está sendo avaliado se de maneira correta) as APIs da OpenAI para “destilar” o conhecimento da plataforma americana. Na prática, aproveitou o conhecimento e os métodos computacionais da OpenAI, usada como “professora” para ensinar o “aluno” DeepSeek. Esse processo, ainda sob análise, explicaria muito bem por que a plataforma chinesa conseguiu replicar com custos significativamente baixos o desempenho da OpenAI. Isso não tira o mérito de que, em muitos aspectos — desde o uso inteligente de modelos de Machine Learning conhecidos há muito tempo até a otimização do uso da memória —, o DeepSeek seja uma inovação tecnológica respeitável, de matriz muito semelhante à do algoritmo de ordenação descrito anteriormente. E, portanto, é justo e correto falar de uma inovação real, colocada gratuitamente à disposição de todos. Esses dois aspectos são, de fato, disruptivos.
Dito isso, parece-nos que a reação dos mercados foi marcada por histeria, parcialmente revertida após uma reflexão mais aprofundada com a chegada de novas informações. Certamente, o uso dos distillation models (ainda não plenamente compreendido em todos os seus aspectos técnicos) nos colocaria diante do clássico caso em que os Estados Unidos mais uma vez inovaram e a China replicou (ainda que tenha replicado de forma inovadora). E a Europa? Bem, como sempre, ficou de fora, pensando em como regulamentar situações como essa.
Disclaimer: Este artigo expressa a opinião pessoal dos colaboradores da Custodia Wealth Management que o redigiram. Não se trata de conselhos ou recomendações de investimento, nem de consultoria personalizada, e não deve ser considerado como convite para realizar transações com instrumentos financeiros.