'ChatGPT português' Amália tem um investimento previsto de 5,5ME
29 de nov. de 2024, 15:21
— Lusa/AO Online
"Esta iniciativa tem previsto
um investimento de 5,5 milhões de euros e um calendário de trabalho e
desenvolvimento de 18 meses, do qual resultará uma primeira versão
multimodal do Amália", lê-se no comunicado.A
este montante "acresce o vasto investimento já realizado em
infraestrutura de computação, projetos de desenvolvimento e recursos
humanos especializados que contribuirão em grande medida para o
desenvolvimento do LLM", sendo que "o financiamento necessário à
concretização do LLM português é assegurado no âmbito do Plano de
Recuperação e Resiliência (PRR) e será desenvolvido inteiramente por
entidades públicas", adianta o ministério. "O financiamento do projeto estará exclusivamente destinado às entidades públicas envolvidas no desenvolvimento do Amália".Na
sequência do anúncio do primeiro-ministro sobre o lançamento do
primeiro modelo de linguagem em grande escala de língua portuguesa de
Portugal, em 11 de novembro, realizou-se uma reunião
interministerial entre os dois ministros que coordenam a iniciativa – a
ministra da Juventude e Modernização e o ministro da Educação, Ciência e
Inovação."É uma prioridade do Governo
português o desenvolvimento e lançamento do primeiro LLM de língua
portuguesa de Portugal, o Amália, 'Assistente Multimodal Automático de
Linguagem com Inteligência Artificial'", uma iniciativa que "é a
primeira divulgada no âmbito da Agenda Nacional de Inteligência
Artificial que será apresentada de forma consolidada no primeiro
trimestre de 2025".Ao longo de ano e meio
(18 meses), "serão disponibilizadas diversas versões do Amália à medida
que forem desenvolvidas novas funcionalidades", refere. Assim, no final
de março será disponibilizada a versão beta do Amália, no terceiro
trimestre de 2025 uma versão bas e no segundo trimestre de 2026 será
disponibilizado um Amália versão multimodal."Numa
fase inicial, o Amália será criado através da conjugação dos esforços
realizados no desenvolvimento do EuroLLM, do GlórIA e do v-Glória, será
capaz de diferenciar as variantes da língua portuguesa e será treinado
com dados do Arquivo.pt previamente curados".Esta
versão beta do Amália conseguirá receber e interpretar instruções em
formato de texto e responder com base no conhecimento adquirido, também
em texto escrito em português de Portugal, adianta."Até
ao final do terceiro trimestre de 2025, serão curados novos dados sobre
a língua, a cultura e história de Portugal. Estes dados serão
provenientes de fontes como o Arquivo.pt, e serão utilizados para
treinar o Amália na sua versão base. Só nesta versão será possível gerar
respostas fiáveis e precisas sobre estas temáticas, bem como responder a
questões com total segurança e sem risco para o utilizador", refere. Nesta
altura, o Amália "já poderá ser integrado noutras aplicações externas e
utilizar dados dessas fontes para gerar respostas de texto".O
ministério da Juventude e Modernização salienta que "todas as versões
desenvolvidas serão disponibilizadas de forma gratuita e em 'open
source', para que seja utilizado por todos, incluindo Academia, centros
de investigação, entidades públicas, empresas e cidadãos". Além
das versões do LLM, "todos os dados que suportam o treino serão
disponibilizados em dados abertos, criando assim uma infraestrutura
nacional de Inteligência Artificial que potencia o ecossistema de
inovação da inteligência artificial em Portugal. O LLM português poderá
ser aplicado a diversos domínios de atividade, sendo necessário afiná-lo
e treiná-lo com dados específicos dos setores de atuação, como
educação, saúde, serviços públicos", entre outros, prossegue.No
final dos 18 meses do primeiro projeto de desenvolvimento, a versão
multimodal do Amália "já será capaz de interpretar diversos formatos de
dados", como texto, imagem e vídeo."Esta
versão final do LLM será diferenciadora na interpretação e geração de
texto de língua portuguesa, no conhecimento que tem da literatura,
cultura e história de Portugal. No entanto, o objetivo deste LLM não é
de responder a perguntas genéricas em que o foco é a realização de
raciocínios ou cálculos complexos, havendo outros LLM no mercado com bom
desempenho nessas tarefas", aponta.O
Amália estará disponível "para todos de forma aberta e gratuita, para
que possam utilizá-lo para concretizar os seus projetos". Nos
últimos anos tem havido iniciativas em vários países de desenvolver LLM
próprios, proficientes nas línguas dos países envolvidos, nomeadamente o
Alia, que fala castelhano, catalão, galego e basco, e o Viking 7B, que
fala dinamarquês, finlandês, norueguês, islandês e sueco, entre outros
exemplos, aponta o Governo.