O novo LLM (grande modelo de linguagem) da China foi desenvolvido com base nos textos oficiais fornecidos pela Administração do Ciberespaço da China (ACC), garantindo, segundo a revista do órgão, o profissionalismo do conteúdo gerado. Este modelo pode responder perguntas, criar relatórios, resumir informações e traduzir chinês e inglês.
Essa ação ocorre em um contexto em que os oficiais chineses buscam equilibrar os rígidos controles sobre a liberdade de expressão com o desenvolvimento da inteligência artificial e a competição com plataformas estrangeiras, como o ChatGPT da OpenAI. A disseminação das ideias de Xi sobre política, economia e cultura tem sido um objetivo do governo, que publicou mais de uma dúzia de livros em nome do presidente chinês e exigiu que as crianças estudem sua filosofia nos currículos escolares.
Além disso, a ACC estabeleceu regras para a inteligência artificial generativa, exigindo que os provedores incorporem valores socialistas centrais e proíbam qualquer conteúdo que possa subverter o poder do Estado. Os gigantes da tecnologia chinesa, como Baidu e Alibaba, têm se esforçado para controlar estritamente o conteúdo gerado pelas IA generativas, especialmente quando se trata de temas sensíveis.
Para auxiliar os desenvolvedores nesse desafio, a Associação de Segurança Cibernética da China lançou um banco de dados público com 100 milhões de entradas de dados de alta qualidade e confiáveis para o treinamento de modelos de inteligência artificial. Esse conjunto de dados baseia-se em regulamentações governamentais, documentos de políticas e publicações oficiais, com várias menções ao presidente Xi Jinping. A ênfase do governo chinês na disseminação das ideias de Xi Jinping reflete o controle rígido que o Partido Comunista mantém sobre a sociedade e a informação no país.