A geração de vídeo com inteligência artificial está fervendo após o lançamento do modelo Sora pela OpenAI no mês passado. Dois ex-membros da DeepMind, Yishu Miao e Ziyu Wang, surpreenderam o mercado ao apresentar sua própria ferramenta de geração de vídeo, Haiper, alimentada por um modelo de IA desenvolvido por eles mesmos.
Miao, que anteriormente estava na equipe de Confiança e Segurança Global da TikTok, e Wang, renomado como cientista pesquisador na DeepMind e Google, deram vida à Haiper em 2021, formalizando-a como empresa em 2022.
Com vasta expertise em aprendizado de máquina, a dupla inicialmente focou em resolver o desafio da reconstrução 3D usando redes neurais. No entanto, após o treinamento com dados de vídeo, Miao revelou à TechCrunch em uma ligação que a geração de vídeo se mostrou um problema ainda mais cativante. Esse redirecionamento levou a Haiper a focar exclusivamente na geração de vídeos há cerca de seis meses.
Impulsionada por investimentos, a Haiper captou $13.8 milhões em uma rodada seed liderada pela Octopus Ventures, com participação da 5Y Capital. Investidores-anjo renomados como Phil Blunsom e Nando de Freitas também contribuíram com $5.4 milhões em uma rodada pre-seed em abril de 2022.
Serviço de Geração de Vídeo
Os usuários podem visitar o site da Haiper e começar a criar vídeos gratuitamente apenas inserindo textos como prompts. No entanto, existem algumas limitações: é possível gerar um vídeo HD de dois segundos ou um vídeo de até quatro segundos com uma qualidade ligeiramente inferior.
O site também oferece recursos como animar imagens e repintar vídeos em diferentes estilos. Além disso, a empresa está trabalhando para introduzir capacidades como a extensão de vídeos.
Miao afirmou que a empresa pretende manter esses recursos gratuitos para construir uma comunidade. Ele ressaltou que ainda é “cedo demais” na jornada da startup para pensar em um produto de assinatura para geração de vídeo. No entanto, a Haiper já colaborou com empresas como a JD.com para explorar casos de uso comerciais.
Construindo um Modelo Central de Vídeo
Embora a Haiper esteja atualmente focada em seu site voltado para consumidores, seu objetivo é desenvolver um modelo central de geração de vídeo que possa ser oferecido a outros. A empresa ainda não divulgou publicamente detalhes sobre esse modelo.
Miao revelou que a empresa entrou em contato privadamente com diversos desenvolvedores para testar sua API fechada. Ele espera que o feedback dos desenvolvedores seja crucial, com a empresa iterando rapidamente sobre o modelo. A Haiper também considera a possibilidade de disponibilizar seus modelos como código aberto no futuro, permitindo que as pessoas explorem diferentes casos de uso.
O CEO acredita que atualmente é importante resolver o problema do “vale estranho” — um fenômeno que evoca sentimentos estranhos quando as pessoas veem figuras humanas geradas por IA — na geração de vídeos.
“Não estamos trabalhando para resolver problemas na área de conteúdo e estilo, mas estamos tentando resolver questões fundamentais, como a aparência de humanos gerados por IA enquanto caminham ou neve cai”, afirmou.
Atualmente, a empresa possui cerca de 20 funcionários e está contratando ativamente para várias funções nas áreas de engenharia e marketing.
Competição à Frente
O Sora, lançado recentemente pela OpenAI, é provavelmente o concorrente mais popular da Haiper no momento. No entanto, há outros players como o Runway, apoiado pelo Google e Nvidia, que levantou mais de $230 milhões em financiamento. Google e Meta também possuem seus próprios modelos de geração de vídeo. No ano passado, a Stability AI anunciou o modelo Stable Diffusion Video em pré-visualização de pesquisa.
Rebecca Hunt, sócia da Octopus Ventures, acredita que nos próximos três anos a Haiper precisará desenvolver um modelo sólido de geração de vídeo para se diferenciar neste mercado.
“Honestamente, há apenas um punhado de pessoas posicionadas para alcançar isso; essa é uma das razões pelas quais queríamos apoiar a equipe da Haiper. Uma vez que os modelos atinjam um ponto que ultrapasse o ‘vale estranho’ e reflita o mundo real com toda a sua física, haverá um período em que as aplicações serão infinitas”, disse ela à TechCrunch por e-mail.
Enquanto os investidores estão de olho em startups de geração de vídeo com IA, eles também acreditam que a tecnologia ainda tem muito espaço para melhorias.
“Parece que a geração de vídeo por IA está no nível do GPT-2. Fizemos grandes avanços no último ano, mas ainda há um longo caminho a percorrer antes que os consumidores comuns estejam usando esses produtos diariamente. Quando será o ‘momento ChatGPT’ para vídeos?” escreveu Justine Moore da a16z no ano passado.
O artigo anteriormente mencionava Geoffrey Hinton como um investidor-anjo. Embora Hinton tenha trabalhado com os fundadores da startup antes da criação da empresa, ele não está envolvido como investidor.