Companhias estão compartilhando de graça sua IA. Conseguirão minar o domínio da OpenAI?
Mistral AI, Hugging Face e outras apostam que podem enfrentar a OpenAI abrindo o código de sua tecnologia — o que pode gerar mais risco do que vantagem
[Publicado originalmente em 21 de março]
À medida que o mercado de modelos de inteligência artificial se consolida em torno da Microsoft, da OpenAI e de um punhado de outros sistemas e atores proprietários, algumas empresas pretendem competir oferecendo gratuitamente sua IA.
A proposta de distribuir gratuitamente o código aberto da tecnologia para que o público a utilize, a compartilhe e a modifique ajudou a criar a internet moderna, a computação em nuvem e empresas bilionárias. Não há garantia de que funcionará com modelos de linguagem de código aberto de grande porte, mas alguns dos maiores integrantes do setor estão apostando que isso pode ajudá-los a eliminar o domínio da OpenAI.
A OpenAI foi responsável por quase 80% do mercado global de IA generativa em 2023, de acordo com uma estimativa da empresa de pesquisa de mercado Valuates Reports.
Elon Musk disse na semana passada que sua startup xAI abrirá o código de seu chatbot Grok, que não conquistou tanto interesse quanto o ChatGPT da OpenAI ou o Claude, da Anthropic. A Meta lançou no ano passado seu modelo de código aberto Llama 2, intensificando a competição entre os modelos privados e os de código aberto. O Google lançou seus modelos de código aberto Gemma em fevereiro, embora também venda acesso a seu Gemini, mais poderoso.
Muitas startups de IA estão apostando no código aberto, com algumas mais bem financiadas como Mistral AI, Hugging Face, Runway ML, Together AI, Writer, Cerebras e Databricks.
Os modelos de IA de código aberto atraem empresas porque podem ser usados sem pagamentos e sem compartilhar dados com um fornecedor como a Microsoft. E, como são compartilhados para análise pública, o que normalmente inclui seu funcionamento interno, as empresas podem usá-los para desenvolver seus próprios modelos.
Porém, empresas de IA enfrentam uma série de desafios — os custos iniciais necessários para treinar os modelos, que podem chegar às centenas de milhões de dólares, o licenciamento de sua tecnologia e a manutenção da lealdade de programadores independentes que impulsionam sua popularidade.
A volta ao modelo gratuito de código aberto
As empresas de software de código aberto tradicionalmente ganham dinheiro cobrando por serviços que facilitam a utilização de suas tecnologias, explicou Joseph Jacks, fundador da OSS Capital, empresa de capital de risco que financia startups de código aberto. Essa abordagem rendeu dividendos para empresas como a MongoDB, que vende uma versão corporativa de seu banco de dados de código aberto.
As empresas de IA de código aberto dizem que também podem obter lucro vendendo serviços e aplicativos de nível empresarial além de seus modelos abertos — apostando na disposição das corporações de pagar por recursos e suporte, aplicativos prontos para uso, como chatbots, e pela conveniência de terceirizar o trabalho de desenvolvimento de modelos personalizados.
Os modelos de IA por si só não têm grande valia para negócios, dando a empresas como a Databricks a oportunidade de vender recursos para ajudá-las a usá-los, disse Ali Ghodsi, seu cofundador e CEO. O novo grupo de IA da Databricks lançou modelos abertos e ajuda as empresas a desenvolvê-los com baixo custo e dados proprietários.
Outra estratégia envolve o desenvolvimento de uma coleção de modelos de IA — alguns deles gratuitos e os mais poderosos exigindo uma taxa ou assinatura paga.
A startup francesa Mistral AI anunciou no mês passado uma parceria com a Microsoft e um sistema de IA proprietário mais poderoso que os clientes terão de pagar para usar. Seus modelos gratuitos, considerados avançados, são menos sofisticados que o pago.
Outras startups conhecidas, como a Stability AI, que construiu o popular modelo de geração de imagens de código aberto Stable Diffusion ao lado da startup Runway ML, começaram a cobrar uma taxa de assinatura para uso comercial de alguns de seus modelos avançados em dezembro. Uma assinatura também oferece recursos empresariais, afirmou um porta-voz.
Mesmo assim, não é fácil tecnologias de código aberto se pagarem. A loja de móveis on-line Wayfair usou o Stable Diffusion para criar uma ferramenta de design de interiores que ajuda os clientes a gerar imagens da nova decoração de sua casa, explicou a diretora de tecnologia Fiona Tan. Contudo, está usando uma versão do modelo que é gratuita para uso comercial.
Da mesma forma, a startup Writer, com sede em San Francisco, lançou modelos de linguagem de código aberto e proprietário destinados a ajudar as empresas a produzir conteúdo escrito. Seus modelos abertos são menos poderosos que os pagos, disse a cofundadora e presidente-executiva da Writer, May Habib.
Sim Simeonov, diretor de tecnologia da empresa de serviços de tecnologia e marketing de saúde Real Chemistry, garante que a escolha não é entre modelos abertos ou fechados de fornecedores como a Writer, mas sim de uma seleção de tecnologia que atenda às necessidades técnicas, legais e de negócios de uma empresa.
O efeito ecossistema
O financiamento de capital de risco para startups de IA de código aberto aumentou globalmente de US$ 900 milhões em 2022 para US$ 2,9 bilhões no ano passado, de acordo com o PitchBook. Isso ocorre em parte porque os investidores são atraídos pelo fato de que essas empresas podem inovar rapidamente por meio da legião de desenvolvedores independentes que atraem, disse Jon Turow, sócio do Madrona Venture Group.
A Cerebras, startup que levantou US$ 750 milhões, ganha dinheiro vendendo chips de IA e serviços de desenvolvimento de modelos. Ela constrói modelos de código aberto não porque são lucrativos, mas porque podem ajudar a atrair programadores, afirmou o cofundador e executivo-chefe Andrew Feldman.
O código aberto também ajuda a criar uma plataforma ou ecossistema de software e serviços para a tecnologia, que outras startups podem vender.
Uma delas, a Together AI, conseguiu neste mês US$ 106 milhões da Salesforce Ventures e de outros investidores, levando sua avaliação para US$ 1,25 bilhão. A startup lançou seus próprios modelos abertos, mas vende principalmente ferramentas que barateiam e aceleram o uso de modelos de código aberto desenvolvidos por outros, afirmou o cofundador e CEO Vipul Ved Prakash.
A Hugging Face, que conseguiu quase US$ 400 milhões de gigantes da tecnologia, incluindo a Alphabet e a Nvidia, ajudou a desenvolver os modelos de código aberto BLOOM e StarCoder. Porém, em vez de se concentrar no desenvolvimento de modelos, a startup vende poder de computação e suporte empresarial para outros modelos abertos, além de sua plataforma de compartilhamento de modelos de código aberto, segundo Jeff Boudier, chefe de produto da Hugging Face.
“Modelos abertos tendem a criar um ecossistema, enquanto modelos fechados tendem a encontrar clientes”, disse ele.
“Território desconhecido”
Ao contrário do software de código aberto, que foi desenvolvido décadas atrás, a comercialização desse tipo de modelo de IA é “um território desconhecido”, acrescentou Boudier.
Por um lado, os modelos de IA exigem mais capital que software. Grandes empresas de tecnologia como Microsoft e Alphabet têm muito dinheiro para comprar unidades de processamento gráfico, ou GPUs, da Nvidia e investir bilhões na construção de sua IA.
Outro desafio é a dificuldade de portar licenças de software, projetadas para códigos de computador, para modelos de IA, que consistem em parâmetros numéricos ou “pesos”, dados de treinamento e outros componentes — em grande parte o que é considerado “matemática”, disse Mark Shuttleworth, fundador e CEO da Canonical, empresa que vende serviços comerciais para a tecnologia Ubuntu de código aberto.
Além disso, embora muito trabalho esteja sendo feito, ainda não há uma definição padrão ou um conjunto de licenças para IA de código aberto. Algumas empresas optaram por lançar apenas certos elementos de seus modelos de IA, o que limita sua utilidade técnica.
Por exemplo, empresas como a Meta consideram seus modelos como sendo de código aberto, mesmo restringindo certos recursos, disse Lawrence Lessig, professor da Escola de Direito de Harvard especializado em tecnologia e política. A licença do Llama 2 permite que os desenvolvedores o usem comercialmente, mas requer a permissão da Meta para uso em um produto com mais de 700 milhões de usuários mensais. Um representante da Meta explicou que sua abordagem aberta visa ajudar empresas e desenvolvedores com recursos limitados a ter acesso à IA e permitir que essa comunidade “avance o estado da arte em termos de segurança e desempenho geral do modelo, equilibrando as preocupações de responsabilidade”.
Até agora, o licenciamento impediu que algumas empresas abrissem seus modelos de IA, disse Shuttleworth. “Uma vez que você tem uma licença que muitas pessoas entendem”, disse ele, “há uma ampla compreensão do que podemos fazer sem que haja perdas”.
Escreva para Belle Lin em [email protected]