是我创造了首个 LLM:Kaggle 前首席科学家一句话引发 AI 学术圈考古行动

2025-04-09 15:21:10 鑫昌软件园

论如何在技术圈争论中一句话噎到对方:

哥们,是我创造了第一个大语言模型。

发言者 Jeremy Howard 为澳大利亚昆士兰大学名誉教授、曾任 Kaggle 创始总裁和首席科学家,现 answer.ai 与 fast.ai 创始人。

事情的起因是有人质疑他最近的项目 llms.txt 在帮助大模型爬取互联网信息上并没太大作用,从而引发了这段争论,迅速引起众人围观。

闻讯而来的“赛博考古学家们”一番考据之后,发现第一个大语言模型这个说法还真有理有据:

2018 年初,Jeremy Howard 发表的论文 ULMFiT,使用非监督预训练-微调范式达到当时 NLP 领域的 SOTA。

甚至 GPT-1 的一作 Alec Radford,在发表 GPT-1 时也公开承认过 ULMFiT 是灵感来源之一。

有人搬出综述论文,指出从“遗传学”视角看,ULMFiT 是所有现代大模型“最后的共同祖先”。

还有好事者软件工程师 Jonathon Belotti,专门写了一篇完整考据《谁才是第一个大语言模型》

大语言模型起源考据

首先来介绍一下 ULMFiT 这篇论文,入选 ACL 2018:

提出有效迁移学习方法,可应用于 NLP 领域的任何任务,并介绍了微调语言模型的关键技术,在六个文本分类任务上的表现明显优于当时的 SOTA 方法,在大多数数据集上将错误率降低了 18-24%。此外,仅使用 100 个带标签的示例,它的性能就与在 100 倍以上数据上从头开始训练的模型性能相当。

那么 ULMFit 算不算第一个大语言模型呢?Jonathon Belotti 考据遵循这样的思路:

首先找一个大家都公认肯定算大语言模型的成果,GPT-1 肯定符合这个标准。

再从 GPT-1 和后续 GPT-2、GPT-3 中提取一个模型成为成为大语言模型的标准:

人生轨迹模拟器免广告版
人生轨迹模拟器免广告版
休闲益智 / 86.7MB
2025-04-09
详情
说谎公主与盲眼王子免费版
说谎公主与盲眼王子免费版
休闲益智 / 32.77MB
2025-04-09
详情
神之亵渎手机版
神之亵渎手机版
休闲益智 / 723.12MB
2025-04-09
详情
AAG警车模拟器汉化版
AAG警车模拟器汉化版
休闲益智 / 60.99MB
2025-04-09
详情
模拟人生4乡间生活手机版
模拟人生4乡间生活手机版
休闲益智 / 48.40MB
2025-04-09
详情
樱桃视频直播官方版下载
樱桃视频直播官方版下载
新闻阅读 / 88.51MB
2025-01-28
详情
TFS飞行模拟器破解版
TFS飞行模拟器破解版
休闲益智 / 86.66MB
2025-02-14
详情
Poppy Playtime第五章正版
Poppy Playtime第五章正版
休闲益智 / 603MB
2025-01-15
详情
恐怖逃脱官方版
恐怖逃脱官方版
休闲益智 / 239.33MB
2025-02-01
详情

相关手游下载

樱桃视频直播官方版下载
樱桃视频直播官方版下载
新闻阅读 / 88.51MB
详情
TFS飞行模拟器破解版
TFS飞行模拟器破解版
休闲益智 / 86.66MB
详情
Poppy Playtime第五章正版
Poppy Playtime第五章正版
休闲益智 / 603MB
详情
恐怖逃脱官方版
恐怖逃脱官方版
休闲益智 / 239.33MB
详情

推荐鑫昌秘籍

最新鑫昌秘籍