Docente da Universidade de Lisboa, e cientista da área da inteligência artificial e processamento de linguagem natural, António Branco está em Macau para o 9º Encontro de Pontos de Rede de Ensino de Português como Língua Estrangeira na Ásia. O académico considera que Macau pode liderar no desenvolvimento de ferramentas de inteligência artificial

Quais os riscos e oportunidades do uso da Inteligência Artificial (IA) generativa no ensino de línguas?

É sobejamente conhecido que as novas tecnologias trazem benefícios que anteriores tecnologias não conseguiam assegurar, mas sabe-se também que a introdução de novas tecnologias tem o potencial de aprofundar a desigualdade entre os seus utilizadores se tal efeito não for mitigado com contramedidas. A tecnologia da IA, e em concreto na sua aplicação ao ensino da língua, não é excepção. Tem o potencial de fazer avançar mais rápida e eficazmente a aprendizagem da língua, mas estudos recentes vêm mostrar que pode também levar os alunos a uma desvantagem, que é o facto de não conseguirem ultrapassar essas suas desvantagens se não existir a devida mediação pedagógica na exploração destas tecnologias.

Desta forma, que medidas devem as escolas adoptar para melhor se adaptarem a este salto evolutivo?

Guardadas as devidas distâncias, ainda assim pode ajudar a analogia com o que aconteceu há cerca de duas décadas atrás, com o advento das novas tecnologias digitais e da internet. Nessa altura, e desde então, uma medida das mais importantes tem sido dar formação aos professores para que melhor possam tirar partido da tecnologia. Com o recente advento da IA, um novo impulso de formação dos professores é imperativo.

Além do trabalho como investigador, é também director-geral da PORTULAN CLARIN. De que se trata concretamente?

É uma Infraestrutura de Investigação para a Ciência e Tecnologia da Linguagem e pertence ao Roteiro Nacional de Infraestruturas de Investigação de Relevância Estratégica, sendo o nó nacional [em Portugal] da infra-estrutura internacional CLARIN ERIC. A sua missão é apoiar investigadores e inovadores, mas também professores e estudantes da língua cujas actividades dependem de resultados da Ciência e Tecnologia da Linguagem através da distribuição de recursos científicos, do fornecimento de apoio tecnológico, da prestação de consultoria e da disseminação científica. Os serviços de processamento da língua, por exemplo o conjugador ou os analisadores sintáticos, são disponibilizados gratuitamente e podem ser facilmente experimentados online na bancada da infraestrutura. Assim, fazem parte do portfólio de novos instrumentos de apoio ao ensino e aprendizagem da língua.

Está em Macau para participar num colóquio focado no ensino de português como língua estrangeira. Poderia o território tornar-se numa zona experimental para o desenvolvimento deste tipo de plataformas digitais?

Macau beneficia do efeito combinado da sua herança histórica que lhe confere a vantagem de ser um território que promove o multilinguismo, bem como da sua integração na área da Grande Baía, que o coloca no epicentro da inovação tecnológica. Mais do que uma zona experimental, Macau poderá liderar o desenvolvimento e a exploração da nova tecnologia de IA, e em muito particular a sua aplicação à tecnologia e processamento da linguagem natural.

Acredita que livros e manuais escolares como hoje os conhecemos poderão desaparecer e dar lugar a e-books e conteúdos feitos por IA? Ou haverá espaço para complementaridade?

O passado recente, de exposição a novas tecnologias disruptivas, ensina-nos que devemos ser prudentes a vaticinar a extinção de anteriores formas e práticas sociais e culturais. Por exemplo, o livro em papel foi declarado em extinção acelerada, mas afinal continua connosco com grande vitalidade, em complementaridade com outros tipos de suporte e canais de disseminação. Estou inclinado a pensar que o mesmo se vá passar relativamente aos benefícios da aplicação da IA no ensino. Acima de tudo, o que precisamos urgentemente neste momento é de desenvolver novas formas de mediação pedagógica que ajudem os alunos a tirar o melhor partido possível deste benefício. A IA, por si própria, tal como um navegador da web, não é uma ferramenta pedagógica, também em si mesmo uma chatbot não é um instrumento pedagógico, mas nas mãos e com a orientação dos professores pode certamente transformar-se num dos mais importantes meios de aprendizagem da língua.

Há possibilidade de uma maior conexão dos modelos “Albertina” e “Gervásio” de linguagem IA generativa, sistema por si coordenado em Portugal, com as instituições de Macau e o seu sistema de ensino?

A possibilidade de os modelos de linguagem de IA generativa desenvolvidos pelo nosso grupo de investigação, o “Albertina” e o “Gervásio”, poderem reflectir a realidade linguística e cultural de Macau encontra-se a ser trabalhada. Com o apoio de instituições de Macau, assim como do IILP – Instituto Internacional da Língua Portuguesa, há um corpus de texto de Macau que está a ser recolhido. Esse é um primeiro passo para se poder afinar os modelos. Muito gostaria que este encontro desta semana em Macau sobre o ensino da língua portuguesa na Ásia, possibilitasse encontrar mais parceiros para passos seguintes.

Os modelos “Albertina” e “Gervásio”

Se falarmos do desenvolvimento da IA em Portugal, o nome de António Branco surge nas últimas tendências e projectos. No caso da IA generativa, o cientista é coordenador dos modelos “Albertina” e “Gervásio” que integram o ecossistema dos grandes modelos de linguagem IA generativa. No caso dos modelos “Albertina”, que são codificadores de linguagem, foi acrescentado o modelo “Albertina 1.5B”; enquanto que aos modelos “Gervásio”, descodificadores de linguagem, foi acrescentado o modelo 7B.

Segundo o website da Faculdade de Ciências da Universidade de Lisboa, António Branco considera que este ecossistema de modelos de linguagem IA generativa “é crucial para a tecnologia da língua portuguesa e esta expansão representa um passo da maior importância na preparação da língua portuguesa para a era da IA”. O cientista acrescentou ainda que “estas classes de modelos estão na base de toda a gama de aplicações de IA generativa, incluindo as mais mediáticas, como os chatbots ou os tradutores automáticos, e sendo maiores, estes novos modelos têm melhor desempenho”.

Ainda segundo o mesmo portal, este ecossistema “é líder mundial em termos de grandes modelos de linguagem desenvolvidos especificamente para a língua portuguesa que são totalmente abertos e documentados”, sendo que o primeiro modelo Albertina foi disponibilizado em Maio do ano passado. Este foi “um marco histórico na preparação tecnológica da língua portuguesa para a era digital, ao ser o primeiro grande modelo de linguagem aberto desenvolvido especificamente para o português, para ambas as variantes”.

António Branco irá falar hoje, a partir das 10h, de todo este universo na sessão inaugural do 9º Encontro, promovido pelo Instituto Português do Oriente (IPOR), e que decorre até amanhã no Auditório Dr. Stanley Ho do Consulado-geral de Portugal em Macau e Hong Kong. O investigador irá partilhar o auditório com João Laurentino Neves, ex-director do IPOR e actual director-executivo do Instituto Internacional da Língua Portuguesa, que irá discorrer sobre “Tecnologias da língua e língua de tecnologias – O IILP na era dos conteúdos e dos dados”.