东京工业大学、富士通等使用超级计算机“富岳”开发的纯国产生成式AI模型

开发了大规模生成式人工智能语言模型“Fugaku-LLM”的东京工业大学教授横田里奥(左)等人(照片由 Naoko Murai 拍摄,东京,2024 年 5 月 10 日)


东京工业大学等利用 拥有世界最高计算能力的超级计算机Fugaku,成功开发了用于生成式AI(人工智能)的大规模语言模型(LLM) 。 10日公布的“富岳-LLM”据说是“第一个纯国内模式”(同一大学的横田里奥教授),从学习数据到发展关键的半导体,一应俱全。是在国内采购的。

 它是与东北大学、富士通、理化学研究所等共同开发的。 CyberAgent提供的学习数据中约有 60%是日语, CyberAgent 擅长基于日语语言和文化的对话。表明模型规模的“参数”数量为130亿个。主导开发的横田教授谈到纯国产模型的意义时表示:“因为我们从头开始收集数据集并在不依赖国外产品的情况下创建它,所以我们可以确保透明度和安全性。”