语言模型-山海云端论坛-第2页

微软 Azure 与英伟达合作推动生成式 AI 技术进步

微软 Azure 宣布与英伟达整合其加速计算技术，为生成式 AI 应用的训练和部署带来显著进步。通过将 Azure ND H100v5 虚拟机（VM）与英伟达 H100 Tensor Core GPU 和 Quantum-2 InfiniBand 网络相...

凌风9个月前

0457

领先的人工智能研究组织 CarperAI 最近发布了开源库 OpenELM，预计将为进化搜索领域带来革命性的变革。OpenELM（ELM 代表大型模型进化）将强大的大型语言模型功能与进化算法相结合，能够生成多...

凌风9个月前

03613

匹兹堡卡内基梅隆大学的研究人员发现，在用户的输入后插入简短的文本可以轻松引导大型语言模型回答被禁止的查询。他们在7月27日发布在arXiv上的论文《统一语言模型的通用且可转移的对抗性攻击》...

凌风9个月前

05112

根据一份最新的研究论文，语言模型通过阅读工具和API文档来学习使用工具，并在某些情况下甚至能够创造性地提出新方法。与传统的演示训练方法相比，仅仅利用文档的模型在零样本任务上表现相当甚...

凌风9个月前

03710

斯坦福大学的研究团队最近推出了一款名为Sophia的全新优化器，能够将语言模型的预训练时间缩短了一半。与传统的Adam优化器相比，Sophia能够更快地解决语言模型所面临的问题。Sophia采用了一种轻...

凌风9个月前

03715

研究人员最近发现，可以使用自动构建的对抗性攻击来欺骗主要语言模型（LLM），如ChatGPT、Bard和Claude等，以生成出乎意料且潜在有害的内容。传统的攻击方法通常需要大量手动开发，且往往可以被...

凌风9个月前

04413

近期，研究人员提出了一项名为LEVER的技术，该技术旨在通过学习验证生成的程序与其执行结果之间的关系，从而改善自然语言到代码的转换过程。LEVER采用了自然语言描述、程序表面形式以及执行结果...

凌风9个月前

0319

快科技8月3日报道，阿里云宣布开源了通义千问70亿参数模型，其中包括通用模型Qwen-7B和对话模型Qwen-7B-Chat。这两款模型已经上线魔搭社区，并且可以免费使用，也可以用于商业用途。这次的开源...

凌风9个月前

0486