此外,Orion-14B不仅仅超越了市面上许多更大参数的模型,尤其在日语和韩语方面表现出色,评测全球领 先。有关Orion-14B的详细信息可以在官网找到。
多项权威评测认可,日、韩语能力全球领 先
在拥有200亿参数以下的范围内,Orion-14B在各种评测平台上都获得了高分,包括MMLU、C-Eval、CMMLU、GAOKAO、BBH等第三方测试集,均为同级别模型的SOTA。这不仅证明了其强大的基座能力,也意味着其犯错的几率非常小。根据第三方机构OpenCompass的独立评测结果,Orion-14B在全球范围内日语和韩语方面的能力均超越了市面上许多更大参数的模型,位居全球领 先。
此外,Orion-14B在评测中展现了多语言能力,包括日文、韩文、中文和英文等,成为全球领 先*。具体而言,日文方面包括JNLI等8项评测集平均得分,韩文方面包括COPA等4项评测集平均得分,中文和英文方面则涵盖了OpenCompass对应语言评测集平均得分。
专注日语和韩语,支持猎户星空出海商用机器人应用
猎户星空董事长傅盛强调,Orion-14B在语料训练中特别强化了日语和韩语,旨在为猎户星空的出海商用机器人应用提供支持。这使得猎户星空机器人在日本和韩国不仅限于送餐服务,还能与用户进行流畅的交流。通过应用Orion-14B基座能力,猎户星空在递送方面展现了优 势,同时在语言交流方面也能轻松应对用户需求。
Orion-14B在全球排名领 先
根据第三方OpenCompass的综合测评总分,Orion-14B在700亿以下参数基座模型中文数据集中排名领 先。这进一步印证了Orion-14B在各方面表现。
超长文本支持和量化性能
Orion-14B支持长320K token的超长文本,可以一次性读入一本小说。在30万字的文本中,模型能够在任意位置随机隐藏关键信息,对模型提出问题,结果全部正确,实现了在长文本中的"大海捞针"。
此外,Orion-14B通过AWQ Q4量化技术,将模型大小减少了70%,推理速度提升了30%,性能几乎无损(损失小于1%)。在千元级显卡上也可以流畅运行,例如在NVIDIA RTX 3060显卡上实测,推理速度可达31 token/s,约相当于每秒50个汉字。
七大场景应用微调模型和大模型应用交钥匙解决方案
猎户星空还发布了七大场景应用微调模型和大模型应用交钥匙解决方案「聚言」,为用户提供更灵活、个性化的解决方案。
这一系列特性和性能表现使得Orion-14B成为当前全球的开源大模型之一,为各种应用场景提供了强大的语言处理能力。