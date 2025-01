A aplicação chinesa de modelos de inteligência artificial generativa (IA) DeepSeek R-1 liderou a tabela de descargas na App Store, tanto na China como nos Estados Unidos, na manhã de ontem, batendo o popular ChatGPT.

O modelo DeepSeek-R1, lançado a 20 de Janeiro, é, de acordo com o criador, comparável ao modelo o1 da OpenAI, o criador do ChatGPT, na resolução de problemas matemáticos, programação e inferência de linguagem natural.

O modelo é uma criação da DeepSeek, empresa chinesa de modelação de inteligência artificial apoiada pela empresa de investimentos quantitativos Huanfang Quant. A ferramenta de código aberto teve recentemente um impacto significativo na comunidade internacional de programadores e no sector tecnológico devido à sua eficiência e baixo custo.

Segundo a empresa, o modelo foi treinado ao longo de 55 dias, com um orçamento de 5,57 milhões de dólares, utilizando um conjunto de 2.048 unidades de processadores gráficos H800 do fabricante norte-americano de semicondutores Nvidia, uma versão de baixa capacidade concebida para o mercado chinês, face às restrições impostas pelos Estados Unidos sobre as exportações de alta tecnologia para a China.

Este custo representa menos de um décimo da despesa de formação do modelo 4o da OpenAI, segundo a imprensa chinesa.

A empresa tornou públicos os detalhes técnicos do processo de formação, permitindo que outros utilizadores os utilizem como base para o desenvolvimento de outras ferramentas.

As comparações de preços são baseadas no cálculo de fichas (“tokens”), no qual 1.000 fichas equivalem a aproximadamente 750 palavras em inglês. O DeepSeek oferece serviços de interface de programação de aplicações (API) a um custo de 1 yuan por milhão de fichas introduzidas e 16 yuan por milhão de fichas produzidas.

Em comparação, o modelo o1 da OpenAI tem um preço de 15 dólares por milhão de fichas introduzidas e 60 dólares por milhão de fichas produzidas.

Portas abertas

O lançamento do DeepSeek-R1 ocorreu na mesma semana em que o Presidente dos EUA, Donald Trump, anunciou o projecto ‘Stargate’, que visa investir até 500 mil milhões de dólares, nos próximos quatro anos, para construir 20 novos centros de dados para apoiar projectos de IA.

“A abordagem tecnológica da DeepSeek desafia o domínio dos EUA na IA, demonstrando que as suas restrições à venda de semicondutores à China têm sido ineficazes”, disse Li Baiyang, professor de estudos de inteligência artificial na Universidade de Nanjing, citado pelo jornal oficial chinês Global Times.

O especialista Tian Feng disse ao mesmo órgão de comunicação que os resultados do DeepSeek, com custos de formação mais baixos, juntamente com a sua abordagem de código aberto, “redefinirão as regras de desenvolvimento da IA”.

Mais de 200 grandes modelos linguísticos foram lançados no mercado chinês, alguns desenvolvidos pelos gigantes tecnológicos do país, como o “Doubao” da ByteDance, o “Jiutian” da operadora de telecomunicações China Mobile, o “Wenxin Yiyan” da Baidu, o “Tongyi Qianwen” do gigante do comércio electrónico Alibaba, o “Pangu” da Huawei Cloud e o “Lanxin” da Vivo.