近日,猎户星空突然连着出了两件“大”事。
首先是在国内,曾经势不两立的傅盛和周鸿祎,居然在1月21日猎户星空大模型发布会上共坐一堂,甚至聊得欢声笑语。
要知道,自从2008年彻底闹掰后,两人十几年势同水火,矛盾逐渐升级到了对簿公堂的地步。而这次,被称为“红衣教主”“红衣大炮”的周鸿祎,却表示“不是来怼的…而是抱着学习的态度”,场面和谐到让不少人纷纷表示“品出了世纪大和解的味道”。
随着1月21日猎户星空大模型Orion-14B系列正式发布,双方更是针对大模型再次“唇枪舌剑”,据了解,该模型具备140亿参数规模,涵盖了中文、英语、日语、韩语等多种语言,效果炸裂。凭借在多语言环境下一系列任务中所展现出的性能,模型一经发布便在海外迅速引发了热议。其实猎户星空大模型能以百亿参数达到千亿参数模型的效果,和猎户星空本身的路径走向有着密切的关系。
相比大模型开发商的身份,猎户星空更为人熟知的是智能机器人供应商。在日韩市场,猎户星空更是被认为只是一家送餐机器人供应商。这个角色,在很大程度上决定了猎户星空的做大模型的业务逻辑。
通常情况,平台都是先开发出大模型后,再开始寻找落地点。为了尽可能地覆盖更广泛的应用场景,模型就要做得足够大,成本自然居高不下,千亿级参数的大模型一年费用就能高达数千万。但大模型本身并不是即开即用的产品,企业需要的是能够结合业务流并解决自身痛点的大模型应用。
在傅盛看来,脱离市场的技术投入就是浪费资源。所以猎户星空刚好反着,先有了落地应用,然后通过AI赋能该产品,在此基础上再推出大模型,典型的先找痛点再针对性突破的思维模式。这样的好处是可以通过更少资源、更专业性能、更灵活配置,在具体应用场景中获得足以媲美更高参数、更全面性能、更大算力模型的效果。同时,在这个过程中,成本被大幅降低了。一个技术在落地场景中能够实现爆发,成本就是临门那一脚。
以前只有大企业才用得起的大模型,现在每个企业都用得起了。以前大公司需要依赖专业人员来构建和维护私域知识库,如今每个公司都可以自己利用Agent来构建定制化的私域知识库。
根据傅盛的构想,距离我们实现这样的场景并不遥远。
傅盛将刚刚过去的2023年称为奇迹年。这一年因为ChatGPT的出现,刷新了人类科技探索的高度,甚至会对人类底层生活产生重大影响。2023年作为导火索,点燃了大模型之火,而这把火将在接下来的一年彻底燎原。
2024年,将会是大模型的应用“大”年。
新闻中心