开发者

Meta,新语言模型支持运行在单张显卡上,|ChatLLaMA,开源实现[ChatGPT]?

() 3月1日消息:Meta最近宣布推出了一款新的大型语言模型LLaMA-13B,该模型的参数规模虽然比OpenAI的GPT- 3 模型小,但表现更为出色,而且只需要单张显卡即可运行,这使得采用普通用户的硬件也有可能提供与ChatGPT相似的AI聊天机器人性能。

LLaMA语言模型的规模从 70 亿到 650 亿个参数,而OpenAI GPT- 3 模型有 1750 亿个参数。Meta使用了Common Crawl、Wikipedia和C4 等公共数据集来训练该模型,并有可能公开其源代码和权重。Meta表示LLaMA是其基础模型,将是该公司未来更先进模型的基础。

LLaMA-13B模型在BoolQ、PIQA、SIQA、HellaSwag、WinoGrande、ARC和OpenBookQA等标准测试中的表现超过了GPT-3。而GPT- 3 等后续模型需要数据中心规模的计算能力进行处理,而LLaMA-13B只需要单张显卡即可运行,为在消费者硬件上实现类似ChatGPT的性能打开了大门。

这一消息引起了广泛关注。现在,Nebuly AI就推出了基于人类反馈强化学习的LLaMA AI聊天机器人的首个开源实现ChatLLaMA(https://github.com/nebuly-ai/nebullvm/tree/main/apps/accelerate/chatllama)。

0

上一篇:

下一篇:

精彩评论

暂无评论...
验证码 换一张
取 消

最新问答

问答排行榜