排序
国内可用ChatGPT4.0网站 | 内附链接
chat:表示“聊天”。 GPT:则是Generative、Pre-trained、Transformer的缩写,表示“预训练语言模型”,可以理解成一个“会说话”的人工智能。 本质上是人工智能技术驱动的自然语言处理工具,...
前缀语言模型与因果语言模型:性能差异与理论解释
近期的研究结果表明,在上下文学习领域,基于Transformer结构的前缀语言模型(prefixLM)在表现上优于因果语言模型(causalLM)。然而,目前仍缺乏对这种性能差异的详细理论解释。本文通过理论...
微软发布性能超越GPT-3.5的轻量级代码生成模型
微软AI研究人员发布了一款轻量级代码生成模型 phi-1,性能超越了背后拥有120亿参数的大型语言模型 GPT-3.5。据了解,这款基于Transformer的模型仅含13亿参数,而 Codex 则拥有120亿参数。微软的...
谷歌 DeepMind 发布 Robotic Transformer2(RT-2):突破视觉-语言-动作模型的新里程碑
谷歌旗下的 DeepMind 公司近日发布了全新的视觉-语言-动作模型(VLA),命名为 Robotic Transformer2(RT-2)。该模型能够与机器人进行互动,通过学习网络和机器人数据,将知识转化为高效的指令...