Un développeur amateur construisant des modèles de langue IA qui parlent l’anglais de l’ère victorienne « Just For Fun » a obtenu une leçon d’histoire inattendue cette semaine lorsque sa dernière création a mentionné de vraies protestations de 1834 Londres – épouse que le développeur ne savait pas que s’était réellement produit jusqu’à ce qu’il les Go Google.
« J’étais intéressé de voir si une manifestation avait réellement eu lieu en 1834 Londres et cela s’est vraiment produit », » a écrit L’utilisateur de Reddit Hayk Grigorian, qui est une informatique étudiant au Muhlenberg College en Pennsylvanie.
Depuis le mois, Grigorian a développé ce qu’il appelle Timecapsulellmun petit modèle de langue IA (comme un cousin éloigné de la taille d’une pinte à Chatgpt) qui a été entièrement formé sur des textes de 1800 à 1875 Londres. Grigorian veut capturer une voix victorienne authentique dans les sorties du modèle AI. En conséquence, le modèle d’IA finit par cracher du texte lourd avec des références bibliques et un excès de rhétorique adapté à la période.
Le projet de Grigorian rejoint un domaine croissant de chercheurs explorant ce que certains appellent « Modèles historiques de grande langue« (HLLMS) s’ils présentent un modèle de base plus grand que le petit Grigorian utilise. Des projets similaires incluent Monadgptqui a été formé sur 11 000 textes de 1400 à 1700 CE qui peuvent discuter des sujets en utilisant des cadres de connaissances du XVIIe siècle, et Xunziallmqui génère une poésie chinoise classique en suivant des règles formelles anciennes. Ces modèles offrent aux chercheurs une chance d’interagir avec les modèles linguistiques des époques passées.
Selon Grigorian, la sortie récente la plus intrigante de Timecapsulellm est sortie d’un simple test. Quand il l’a incité avec « c’était l’année de notre Seigneur 1834 », le modèle de l’IA – qui est formé pour continuer le texte de partout où un utilisateur s’arrête – a généré ce qui suit:
C’était l’année de notre Seigneur 1834 et les rues de Londres étaient remplies de protestations et de pétition. La cause, comme beaucoup de Reg l’ont compté, n’étaient pas liées à la manière du privé, mais ayant pris le même jour le jour de Lord Palmerston, le public recevra une brève déclaration des difficultés en vertu duquel le jour du droit nous est parvenue. Il regrette profondément que les événements actuels de l’histoire du monde soient clairs, et par conséquent seront connus. Il n’est pas vrai que les hommes mêmes qui se sont installés pour la première fois dans l’Évangile de Jérusalem devraient avoir un record si étendu et si intéressant de la prospérité et de la prospérité
Curieux de la précision, Grigorian a fait une vérification des faits. « La production a également évoqué Lord Palmerston », a-t-il écrit, « et après une recherche Google, j’ai appris que ses actions ont abouti aux manifestations de 1834. »