Casa Tech Pocket FM colabora com a ElevenLabs para converter rapidamente scripts em conteúdo de áudio

Pocket FM colabora com a ElevenLabs para converter rapidamente scripts em conteúdo de áudio

A plataforma de áudio Pocket FM, apoiada pela Lightspeed Ventures, acaba de anunciar que se associou à empresa de clonagem de voz ElevenLabs para converter rapidamente conteúdo de texto, como scripts, em séries de áudio usando inteligência artificial.

Pocket FM, que arrecadou US$ 103 milhões em financiamento da Série D em março, disse ao TechCrunch na época que já estava experimentando a capacidade de converter conteúdo de texto em áudio usando a tecnologia da ElevenLabs. Agora, a empresa sediada na Índia expandiu a parceria para tornar a ferramenta de conversão disponível para todos os criadores ao longo das próximas semanas.

Créditos da Imagem: Pocket FM

Na fase de teste, o Pocket FM já produziu 30.000 horas de séries de áudio usando a tecnologia de IA da ElevenLab. Com o novo lançamento, a startup espera triplicar sua biblioteca de conteúdo de áudio de mais de 100.000 horas este ano. O Pocket FM também afirmou que, durante a fase experimental, as ferramentas alimentadas por IA ajudaram a reduzir o custo de produção de áudio em 90%.

O co-fundador e CTO do Pocket FM, Prateek Dixit, disse ao TechCrunch durante uma ligação que, com esta parceria, a empresa deseja facilitar para os escritores a conversão de seus textos em séries de áudio.

'Temos mais de 250.000 escritores (incluindo aqueles na plataforma de escrita de novelas Pocket da empresa) e esta parceria diminui o custo de configuração e gravação de áudio para eles', disse ele.

'Mesmo com um bom conjunto de ferramentas e equipamentos de gravação, os escritores podem produzir aproximadamente 30 minutos de conteúdo de áudio de alta qualidade por dia. Com as ferramentas de IA, esse resultado pode ser 10 vezes maior', acrescentou.

O Pocket FM construiu uma ferramenta integrando a tecnologia ElevenLabs, através da qual está oferecendo 50 vozes para escritores que desejam converter seu conteúdo. O co-fundador da ElevenLabs, Mati Staniszewski, disse que a ferramenta de sua empresa compreende o contexto da escrita e infere emoções através da voz automaticamente.

'Trabalhando com o Pocket FM, estamos implantando nossos modelos mais recentes que entendem o gênero da escrita e são ainda mais emocionais', disse Staniszewski.

Dixit observou que, com base nos dados do envolvimento dos usuários com esse tipo de conteúdo, a plataforma também planeja sugerir vozes que funcionem bem para escritores em um determinado gênero.

O Pocket FM não é a única plataforma de séries de áudio a experimentar com ferramentas alimentadas por IA. O Kuku FM, apoiado pelo Google, está usando GPT-4, Claude, BandLab e até a ElevenLabs para ajudar seus escritores em diferentes estágios de criação, incluindo refinar roteiros, gerar miniaturas, adicionar efeitos sonoros e converter texto em áudio.

O Kuku FM disse ao TechCrunch que também está experimentando o uso de ferramentas de geração visual como MidJourney e Runway para criar anúncios relacionados ao conteúdo.

Qualidade do conteúdo e impacto nos artistas

A promessa de ferramentas alimentadas por IA é gerar mais conteúdo mais rapidamente, mas isso não significa que o conteúdo seja bom. A resposta do Pocket FM para auxiliar na descoberta e apresentação de conteúdo de qualidade é tornar seu algoritmo de descoberta sofisticado e experimentar com o envolvimento do usuário.

'Se um escritor publica uma série de áudio, apresentamos esse conteúdo a um número seleto de usuários e observamos métricas de envolvimento. Se essas métricas forem positivas, propomos ainda mais isso', disse Dixit.

A utilização de IA pode levar a resultados mais rápidos e a uma biblioteca de conteúdos maior para essas plataformas, mas também reduzirá o papel dos artistas de locução que trabalham com elas. A Associação de Artistas de Locução da Índia (AVA) expressou sua preocupação com a IA assumindo o controle.

'Se a IA assumir o controle, estaremos acabados. Como artistas de voz, precisamos obter alguma regulamentação para proteger nosso sustento', disse Amarinder Singh Sodhi, secretário-geral da associação, ao jornal indiano Scroll.

Sodi também contou ao Scroll sobre incidentes em que artistas de locução foram chamados para o estúdio para gravar amostras para treinar a IA sem obter seu consentimento ou informá-los.

'Em um nível emocional, isso me assusta. Ao usar a IA, essencialmente você está diluindo a experiência humana de contar histórias. Você perde a conexão emocional', disse o artista de locução de Nova Delhi, Aditya Mattoo, ao TechCrunch.

Ele acrescentou que dar acesso a vozes premium para pessoas que ainda não desenvolveram o gosto e habilidade para produzir conteúdo de qualidade levará ao mercado se inundar com conteúdo ruim.

Quando perguntamos sobre o impacto da geração de voz alimentada por IA no Pocket FM, a empresa não respondeu diretamente à pergunta. No entanto, Dixit observou que o envolvimento com o conteúdo gerado por IA em seus experimentos é 'tão bom quanto a produção de voz humana'. Notavelmente, a empresa também está trabalhando em tecnologia para incorporar múltiplas vozes em uma saída de áudio.

Tanto o Pocket FM quanto o Kuku FM atualmente não rotulam seu conteúdo para indicar se a IA foi usada no processo de criação.