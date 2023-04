Em 2022, o Conteúdo Gerado por Inteligência Artificial (CGIA) tomou a Internet de assalto, desde modelos de Inteligência Artificial (IA) como DALL-E 2 e Stable Diffusion, que explodiram na arte, até modelos de conversação como o ChatGPT, que exibem um desempenho de nível humano. As pessoas perguntam: vai a IA substituir os criadores? Porque é que a utilização do CGIA cresceu tão subitamente? Significará que a IA está a entrar numa nova era e onde nos irá conduzir? Qual será o impacto do CGIA na economia e na sociedade, e como é que as diferentes entidades o devem percepcionar?

O Tencent Research Institute realizou um fórum intitulado “CGIA: Tendências e Perspectivas da IA na Nova Era”, discutindo o desenvolvimento actual e as práticas da indústria da tecnologia AIGC e as oportunidades e desafios futuros. Participaram Xin YAO, Professor Catedrático da Universidade do Sul de Ciência e Tecnologia, Weiwen DUAN, Director do Departamento de Filosofia da Ciência e Tecnologia da Academia Chinesa de Ciências Sociais, Yuntao WANG, engenheiro-chefe adjunto da Academia Chinesa de Tecnologias da Informação e Comunicação, Baoyuan WU, Professor Associado da Universidade Chinesa de Hong Kong, Jun YIN, Director do Centro de Tecnologia de Conteúdo Digital da Tencent Games e Shuming SHI, Chefe do Centro de Processamento de Linguagem Natural da Tencent, tendo como moderador Jian YANG, vice-presidente da Tencent.

Jian Yang: Como vê a explosão do CGIA (Conteúdo Gerado por Inteligência Artificial) na segunda metade de 2022? O CGIA representa a próxima era da tecnologia da IA?

Xin Yao: A explosão do CGIA é um sucesso abrangente. Embora a IA tenha uma longa história na geração de conteúdos, ainda não avançou tanto quanto hoje devido a dados, poder computacional e limitações da tecnologia de algoritmos. Um factor importante que contribui para o grande interesse no CGIA é o facto de ter excedido as expectativas das pessoas, tornando-o particularmente interessante. Contudo, temos ainda de considerar os avanços tecnológicos que o CGIA tem feito. Em primeiro lugar, alcançar resultados que excedam as expectativas das pessoas em relação ao avanço tecnológico é relativamente fácil. Por exemplo, em áreas como imagens, diálogos, e mesmo música, pode gerar peças que possuem um certo estilo de compositor mas que não são inteiramente idênticas. No entanto, muitos acreditam que a AIGC pode ser um caminho eficaz para a IGA (inteligência geral artificial), o que requer uma consideração cuidadosa. Isto porque o CGIA gera conteúdo através de uma grande quantidade de dados e poder computacional, em comparação com o processo conceptual a que o ser humano se submete ao criar conteúdo. Por exemplo, quando olho para muitas imagens, o meu cérebro passa por um processo abstracto e depois regressa ao espaço da imagem para criar uma nova imagem. Não tenho a certeza se o CGIA tem actualmente tais funções abstractas incorporadas. Se uma máquina tiver visto um milhão de fotos de cães e gatos, não irá gerar conceitos como quatro pernas, pêlo, etc. Em segundo lugar, à medida que o CGIA se desenvolve e envolve campos científicos e tecnológicos ou aplicações verdadeiramente relacionadas com o bem-estar nacional, pode haver desafios adicionais, pois é difícil assegurar que o conteúdo gerado pelo CGIA cumpre certos constrangimentos. Deixem-me usar uma analogia. Podemos agora enviar muitas moléculas para um sistema de IA, o que pode gerar novas moléculas para si. Embora o desenvolvimento de drogas a partir destas moléculas seja concebível, pode haver uma lacuna entre o conceito teórico e a aplicação prática. Até que ponto estamos a alcançar a chamada IGA? Estas são questões que requerem contemplação e exploração.

Jun Yin: As minhas opiniões são consistentes com as do Professor Yao. Seja a partir da abordagem ampla da utilização da IA para gerar conteúdo ou da perspectiva estreita do desenvolvimento de modelos linguísticos profundos e grandes, resulta da experiência e investigação acumuladas. A erupção do CGIA hoje em dia deve-se a múltiplos factores, incluindo a recolha de uma grande quantidade de conjuntos de dados abertos de alta qualidade, avanços teóricos como o modelo de difusão, e novo hardware informático como o GBT3 com modelos maiores e mais eficazes. No passado, pode não ter havido dispositivos informáticos tão poderosos para apoiar modelos de formação a esta escala e, mesmo agora, o custo de formação de tais modelos é ainda muito elevado. A combinação destes factores tornou a geração de imagens ou texto muito mais viável do que antes. Penso que isto explica porque é que o CGIA explodiu em popularidade nesse ano. Em comparação com as primeiras redes neurais profundas, o desenvolvimento do CGIA ainda não passou por uma mudança de paradigma fundamental. Portanto, não podemos concluir que o ChatGPT tenha alcançado inteligência geral artificial (IGA) simplesmente porque tem um bom desempenho na geração de conversas e parece inteligente. O ChatGPT não compreende verdadeiramente o que diz e apenas cria a impressão de que compreende o conteúdo gerado, que ainda está longe da inteligência humana. A próxima era da IA precisa de se concentrar em várias direcções essenciais. Por um lado, deve ser capaz de aprender de forma autónoma. Tal como os humanos, alguma da sua lógica de raciocínio deve ser explicável ou compreensível, e ser capaz de executar tarefas através de domínios. Por outro lado, da perspectiva da implementação industrial, como a utilização de métodos de IA para ajudar na geração de conteúdos de jogos, ainda está longe das normas profissionais da indústria de jogos, seja na geração de imagens, texto, modelos 3D, ou animações de personagens, ou na utilização do ChatGPT para criar scripts de jogos ou diálogos NPC (Non-Player Character).

Jian Yang: Em resumo, a AIGC pode estar à beira de uma mudança quantitativa a qualitativa, e é difícil dizer se realmente sofreu uma mudança qualitativa. Continua a basear-se no paradigma do passado, progredindo apenas devido aos avanços noutras condições tecnológicas. Por conseguinte, resta saber se a AIGC está verdadeiramente em conformidade com os princípios inerentes à inteligência humana ou AGI geral no futuro. Qual é o estado actual e a prática industrial do AIGC? Quais são algumas aplicações e direcções representativas?

Yuntao Wang: Relativamente à prática industrial actual do AIGC, a tecnologia pode ser classificada em texto, áudio, imagem e vídeo, e espaço virtual com base nos modos de processamento.

(1) Texto. Inclui principalmente a criação ou a edição de conteúdos de texto, como a criação de artigos, a conversão de estilos de texto e o diálogo de perguntas e respostas. As aplicações típicas incluem robots de escrita, chatbots, etc.

(2) Áudio. Inclui a conversão de texto em fala (TTS), a conversão da fala e a edição da fala, bem como conteúdos não orais, como a criação de música e a edição de som de cenas, com aplicações típicas que incluem dobragem inteligente, actuações virtuais, composição musical automática e criação de canções.

(3) Imagem e vídeo. Inclui a geração ou edição de conteúdos de imagem e vídeo, como a geração facial, a substituição facial, a edição de atributos de caracteres, a manipulação facial e a manipulação da postura. Tecnologias como a geração, o melhoramento e o restauro de imagens são também relevantes. As aplicações representativas incluem filtros de beleza, troca de rostos, repetições de imagens, modificação de estilos e pintura com IA.

(4) Espaço virtual. Inclui principalmente a geração ou edição de personagens digitais e cenas virtuais, como a reconstrução 3D e a simulação digital. As aplicações típicas incluem metaversos, gémeos digitais, motores de jogos, modelação 3D e RV (realidade virtual).

Em termos de aplicações do CGIA, há vantagens significativas no fornecimento de conteúdos mais diversificados, dinâmicos e interactivos. O CGIA alcançou melhorias inovadoras significativas em sectores com um elevado nível de cultura digital e exigências de conteúdos diversificados, tais como os meios de comunicação social, o comércio electrónico, o cinema e a televisão, e o entretenimento. O CGIA +media promove a convergência dos media através da colaboração homem-máquina. O tempo que um robot demora a gerar um relatório aprofundado foi reduzido dos 30 segundos iniciais para menos de dois segundos. Além disso, o CGIA +e-commerce centra-se no desenvolvimento de modelos 3D de produtos para melhorar a experiência de compra em linha através de exposições e ensaios virtuais de produtos. O CGIA também é utilizado para criar âncoras virtuais para aumentar as vendas de transmissões em directo. O CGIA +filme e televisão expande o espaço criativo do cinema e da televisão para melhorar a qualidade das produções. Actualmente, os produtos já estão a fornecer novas ideias para a criação de guiões, tais como serviços de escrita inteligente para a selecção de guiões, incluindo o filme “Hi, Mom” e “The Wandering Earth”. O CGIA também fornece serviços de processamento de imagem baseados em IA para edição e pós-produção de filmes e televisão, incluindo o filme “Amazing China” e a remasterização do filme “Street Angel”, lançado em 1937. CGIA +entertainment gera imagens divertidas e conteúdo audiovisual. Existem também alguns exemplos de desenvolvimento de aplicações centradas no consumidor para explorar o metaverso. No entanto, embora o CGIA tenha algumas aplicações práticas nos sectores médico e industrial, ainda se encontra na fase exploratória de uma integração mais profunda da indústria e da implementação da lógica empresarial.

Shuming Shi: O CGIA registou avanços significativos em termos de progresso tecnológico global. Há cinco anos, apenas a geração de TTS era considerada utilizável no domínio do CGIA. Há três anos, era inimaginável que a IA pudesse gerar imagens relevantes e de alta qualidade de acordo com o texto. Anteriormente, a maior parte da geração de texto baseava-se em modelos específicos, que tinham um âmbito de aplicabilidade limitado. Com o aparecimento de modelos linguísticos de grande dimensão e a melhoria contínua dos modelos linguísticos, o CGIA tornou-se cada vez mais impressionante. Tanto o Stable Diffusion como o ChatGPT surpreendem as pessoas com a sua robusta compreensão de texto e geração de conteúdos.

É claro que a China ainda precisa de fazer mais esforços para fazer avançar o CGIA. A grande maioria do trabalho está a ser feito por algumas instituições de investigação nos Estados Unidos, que lideraram todo o domínio da tecnologia de IA. Por conseguinte, temos também de nos esforçar por contribuir mais para o desenvolvimento da IA.

Quanto às aplicações comerciais, uma direcção proeminente é a assistência aos seres humanos, como a criação assistida por IA, com o CGIA a desempenhar um papel auxiliar. Pode não ser significativo para o CGIA gerar muitas imagens de forma independente, mas quando as pessoas precisam dele, o CGIA pode produzir imagens requintadas com base nalgumas instruções, que são uma combinação de sugestões. Depois, através de testes repetidos e da interacção com eles, o AIGC pode ajudar a maioria das pessoas que não são boas a desenhar a criar. O mesmo se aplica à criação de texto. Com a ajuda do AIGC, a eficiência na continuação e reescrita do texto será maior e pode também inspirar o nosso pensamento. Portanto, objectivamente, o CGIA melhora a nossa produtividade e a eficiência do trabalho. Quanto às aplicações comerciais, a mais directa é a criação assistida por IA, e outros aspectos ainda precisam de ser mais explorados. É claro que algumas pessoas perguntam se o ChatGPT pode substituir os motores de busca, mas, de momento, parece pouco provável. Pode apenas completar uma parte das funções dos motores de pesquisa, mas não os pode substituir totalmente.

Em resumo, o progresso tecnológico é muito rápido e ultrapassa as expectativas; em segundo lugar, há muito espaço para a imaginação na comercialização, mas ainda não explorámos o aspecto mais crítico.

Jian Yang: Porque é que o CGIA é tão importante? Que tipo de valor e significado tem? Em que domínios pode trazer mudanças? Para além do aspecto material, que tipo de impacto pode ter a nível espiritual e de valores?

Weiwen Duan: Vou falar principalmente de quatro aspectos: Em primeiro lugar, o CGIA proporciona uma nova forma de criação de conteúdos, mas deve ser também uma nova forma de percepção cognitiva. Agora, quando o AIGC gera conteúdos, as ideias individuais tornam-se mais importantes.

Em segundo lugar, o AIGC é uma nova ferramenta de aprendizagem e investigação, porque capacita os indivíduos com capacidades criativas de nível superior. Por exemplo, recentemente, tem havido controvérsia sobre se muitas teses de licenciatura já podem ser escritas utilizando o CGIA e as pessoas pensam que é batota. Se examinarmos cuidadosamente a maior parte das teses de licenciatura actuais, já copiam e colam [de outro sítio], mas fazem-no habilmente. No entanto, a utilização do CGIA pode facilitar a conclusão da pesquisa e do processamento da literatura e melhorar a eficiência da aprendizagem. No trabalho de investigação, o CGIA pode tornar-se uma ferramenta rotineira e benéfica no processo de colaboração da cognição homem-máquina.

Em terceiro lugar, pode envolver o metaverso, que é a criação de um mundo virtual. A arte da IA combina todas as possibilidades, à semelhança da teoria dos mundos possíveis de Saul Kripke. No passado, o cérebro do indivíduo tinha um acesso limitado a estes recursos de dados potenciais. Mas o CGIA pode combinar totalmente estes recursos de acordo com a sua imaginação e tornar-se uma máquina para criar mundos possíveis. Por conseguinte, o potencial do metaverso expandiu-se significativamente e podemos combinar toda a riqueza espiritual, ideias criativas e património cultural da humanidade para criar. (De acordo com o filósofo americano Saul Kripke, os factos modais são interpretados como factos sobre mundos possíveis, em que o mundo real é apenas aquele em que o maior número possível de aspectos do mundo são semelhantes aos nossos).

Em quarto lugar, tem havido algumas aplicações interessantes do AIGC, uma das quais é a prevenção do autismo. Muitas pessoas têm ansiedade social, pelo que podem criar uma pessoa digital com quem conversar. Uma artista utilizou o seu diário de infância para treinar a IA e acabou por ter uma conversa com o seu “eu” mais novo. Isto permitiu-lhe compreender o que a preocupava durante a adolescência e obter um efeito terapêutico. Por conseguinte, o CGIA também pode contribuir para a autoconsciência e a auto-cura espirituais e até tornar-se o nosso bom companheiro, que nos permite ajudar-nos a nós próprios e assumir uma nova vida através da IA para ganhar maior força espiritual.

Hoje Macau / Pekingology