Depois de anos de preocupação nos EUA de que suas ambições de inteligência artificial poderiam ser superadas por Pequim, a maior ameaça à hegemonia do Vale do Silício não veio de uma das quatro maiores empresas de tecnologia da China, mas de uma startup até então pouco conhecida. Com informações do The Guardian.
NOVATA, MAS POTENTE
Em vez de Baidu, Alibaba, Tencent ou Xiaomi liderarem a loja de aplicativos iOS com seu mais recente chatbot esta semana e fazer os mercados cambalearem , é a DeepSeek — fundada há menos de dois anos — que está sendo creditada com um "momento Sputnik" na corrida global de desenvolvimento de IA.
A surpresa veio de sua alegação de que treinou um modelo de IA no mesmo nível do ChatGPT da OpenAI com menos de US$ 6 milhões (£ 4,8 milhões). Para efeito de comparação, a Microsoft, principal parceira da OpenAI, planeja investir cerca de US$ 80 bilhões em infraestrutura de IA este ano. O DeepSeek se tornou rapidamente o aplicativo gratuito mais baixado no Reino Unido e nos EUA.
QUEM É O FUNDADOR?
Então, quem está por trás do DeepSeek e como ele conseguiu um feito tão impressionante e transformador no mercado em tão pouco tempo?
Fundada em maio de 2023, a startup é o projeto de paixão de Liang Wenfeng, um empreendedor de fundos de hedge millennial da província de Guangdong, no sul da China. Parte de seu sucesso parece vir do fato de ser projetada como uma organização puramente focada em pesquisa, não uma empresa comercial e voltada para o lucro.
OBJETIVO NÃO É LUCRAR
Em uma entrevista à mídia chinesa no ano passado, após a estreia de um modelo de IA anterior que causou burburinho nos círculos da indústria, Liang disse: “Nosso princípio não é perder dinheiro, nem obter lucros enormes... nosso ponto de partida não é aproveitar a oportunidade de fazer fortuna, mas estar na vanguarda da tecnologia e promover o desenvolvimento de todo o ecossistema.”
O foco de pesquisa da DeepSeek é financiado pelo fundo de hedge de Liang, High-Flyer Capital, que ele iniciou em 2015. Depois de estudar engenharia de informação eletrônica na Universidade de Zhejiang, Liang evitou empregos de programador em grandes empresas de software para se concentrar em sua obsessão com IA. Com a High-Flyer Capital, Liang usou IA para identificar padrões nos preços das ações – gerando toneladas de dinheiro. Em 2021, seus ativos sob gestão supostamente ultrapassaram 100 bilhões de yuans (£ 11 bilhões)
No mesmo ano, começaram a se espalhar rumores de que Liang havia acumulado uma grande coleção de unidades de processamento gráfico (GPUs) da Nvidia. Em 2021, foi relatado que ele havia comprado 10.000 chips, aparentemente para seu hobby pessoal. Apenas um punhado de grandes empresas de tecnologia chinesas têm reservas semelhantes de semicondutores da Nvidia. “Muitas pessoas pensariam que há uma lógica de negócios desconhecida por trás disso, mas, na verdade, é principalmente motivada pela curiosidade”, disse Liang em 2023.
PROIBIÇÃO DE CHIP
A curiosidade foi oportuna. Em 2022, Joe Biden anunciou controles abrangentes de exportação de semicondutores destinados à China , com o objetivo de impedir que o país acesse o equipamento necessário para o rápido desenvolvimento de IA. O poderoso chip H100 da Nvidia foi banido. A empresa desenvolveu os chips H800 menos potentes para o mercado chinês – nos quais a DeepSeek treinou seu modelo – embora estes também tenham sido banidos em 2023 .
“Nosso maior desafio nunca foi dinheiro, mas sim o embargo aos chips de ponta”, disse Liang. Há relatos de que ele está pessoalmente envolvido na pesquisa da DeepSeek e falou sobre como prefere contratar talentos locais para o campus da empresa em Hangzhou, cidade do leste da China onde o Alibaba também está sediado, em vez de trabalhadores que estudaram nos EUA ou no exterior.
DEIXANDO OS EUA PARA TRÁS
Isso torna o sucesso da DeepSeek ainda mais impressionante. Os EUA tradicionalmente estão na liderança da corrida de IA com a China, dominando os equipamentos de fabricação de chips mais avançados e produzindo talentos de primeira linha em suas universidades.
O lançamento do poderoso modelo do DeepSeek sugere que os cientistas chineses – como previsto – encontraram uma maneira de contornar as restrições dos EUA que pretendem impedi-los de alcançá-los.
Isso pode levar a um maior aperto dos controles dos EUA ou minar a ideia de que eles podem funcionar efetivamente. Além do DeepSeek, muitas empresas chinesas de IA estão lutando para se desenvolver sem acesso a GPUs avançadas.
O analista da China Bill Bishop disse em um boletim informativo: “Qualquer que seja a decisão do governo Trump sobre os controles de exportação, provavelmente causará uma divisão ainda maior sobre IA entre os EUA e seus amigos próximos e o resto do mundo, e especialmente o sul global.”
Alguns analistas e investidores expressaram ceticismo sobre as alegações perturbadoras do mercado feitas pela DeepSeek.
“Os laboratórios chineses têm mais H100s do que as pessoas pensam”, disse Alexandr Wang, um empreendedor americano de IA, em uma entrevista à CNBC. Wang disse que acreditava que a DeepSeek tinha um estoque de chips avançados que não havia divulgado publicamente por causa das sanções dos EUA. A DeepSeek foi abordada para comentar.
A empresa também é conhecida por pagar bem os melhores talentos, caçando desenvolvedores com ofertas de emprego de empresas maiores, como a Nvidia. As listas de empregos para desenvolvedores na DeepSeek no site de recrutamento chinês Zhipin anunciam salários de até 60.000 yuans por mês (cerca de £ 6.600). O salário médio na Tencent e outras grandes empresas de tecnologia é de cerca de 35.000 yuans por mês.
Quanto ao próprio Liang, ele está se mantendo longe dos holofotes. Um colega de escola entrevistado na imprensa chinesa disse: “Alguns dias atrás, enviei uma mensagem para parabenizá-lo. Ele disse que retornaria para [sua cidade natal] para o ano novo lunar, mas que estaria escondido.”