语言模型共22篇 第2页
微软 Azure 与英伟达合作推动生成式 AI 技术进步-山海云端论坛

微软 Azure 与英伟达合作推动生成式 AI 技术进步

微软 Azure 宣布与英伟达整合其加速计算技术,为生成式 AI 应用的训练和部署带来显著进步。通过将 Azure ND H100v5 虚拟机(VM)与英伟达 H100 Tensor Core GPU 和 Quantum-2 InfiniBand 网络相...
凌风的头像-山海云端论坛钻石会员凌风9个月前
0457
OpenELM:语言模型与进化搜索的重要里程碑-山海云端论坛

OpenELM:语言模型与进化搜索的重要里程碑

领先的人工智能研究组织 CarperAI 最近发布了开源库 OpenELM,预计将为进化搜索领域带来革命性的变革。OpenELM(ELM 代表大型模型进化)将强大的大型语言模型功能与进化算法相结合,能够生成多...
凌风的头像-山海云端论坛钻石会员凌风9个月前
03613
插入文本引导语言模型回答禁止查询-山海云端论坛

插入文本引导语言模型回答禁止查询

匹兹堡卡内基梅隆大学的研究人员发现,在用户的输入后插入简短的文本可以轻松引导大型语言模型回答被禁止的查询。他们在7月27日发布在arXiv上的论文《统一语言模型的通用且可转移的对抗性攻击》...
凌风的头像-山海云端论坛钻石会员凌风9个月前
05112
语言模型通过阅读文档学习工具使用,并具备创造性提出新方法的能力-山海云端论坛

语言模型通过阅读文档学习工具使用,并具备创造性提出新方法的能力

根据一份最新的研究论文,语言模型通过阅读工具和API文档来学习使用工具,并在某些情况下甚至能够创造性地提出新方法。与传统的演示训练方法相比,仅仅利用文档的模型在零样本任务上表现相当甚...
凌风的头像-山海云端论坛钻石会员凌风9个月前
03710
斯坦福研究:Sophia优化器加速语言模型预训练-山海云端论坛

斯坦福研究:Sophia优化器加速语言模型预训练

斯坦福大学的研究团队最近推出了一款名为Sophia的全新优化器,能够将语言模型的预训练时间缩短了一半。与传统的Adam优化器相比,Sophia能够更快地解决语言模型所面临的问题。Sophia采用了一种轻...
凌风的头像-山海云端论坛钻石会员凌风9个月前
03715
研究发现自动化对抗攻击可欺骗主要语言模型,产生潜在有害内容-山海云端论坛

研究发现自动化对抗攻击可欺骗主要语言模型,产生潜在有害内容

研究人员最近发现,可以使用自动构建的对抗性攻击来欺骗主要语言模型(LLM),如ChatGPT、Bard和Claude等,以生成出乎意料且潜在有害的内容。传统的攻击方法通常需要大量手动开发,且往往可以被...
凌风的头像-山海云端论坛钻石会员凌风9个月前
04413
LEVER技术:提升自然语言到代码生成的新方法-山海云端论坛

LEVER技术:提升自然语言到代码生成的新方法

近期,研究人员提出了一项名为LEVER的技术,该技术旨在通过学习验证生成的程序与其执行结果之间的关系,从而改善自然语言到代码的转换过程。LEVER采用了自然语言描述、程序表面形式以及执行结果...
凌风的头像-山海云端论坛钻石会员凌风9个月前
0319
阿里云开源通义千问70亿参数模型,成为国内首个大型科技企业加入大模型开源行列-山海云端论坛

阿里云开源通义千问70亿参数模型,成为国内首个大型科技企业加入大模型开源行列

快科技8月3日报道,阿里云宣布开源了通义千问70亿参数模型,其中包括通用模型Qwen-7B和对话模型Qwen-7B-Chat。这两款模型已经上线魔搭社区,并且可以免费使用,也可以用于商业用途。这次的开源...
凌风的头像-山海云端论坛钻石会员凌风9个月前
0486