360正式发布自研大模型,周鸿祎:国产大模型追赶GPT4的速度远超想象 DATE: 2023-10-01 13:23:36
界面新闻记者 | 李彪
“我曾经说过,正式自研国产大模型与ChatGPT之间的发布差距是两年 ,现在我想收回这句话。大模大模的速度远”这是型周型追象360创始人周鸿祎针对当下备受关注的“百模大战”发表的最新言论 。他认为国产大模型在许多方面已经赶上GPT3.5,鸿祎追赶GPT4的国产赶速度也远超想象。
6月13日 ,超想三六零(601360.SH ,正式自研以下简称“360”)发布“360智脑”大模型应用并开放公众申请测试。发布个人用户可登陆360智脑官网申请内测。大模大模的速度远当日其股价收盘报15.38元,型周型追象上涨5.49%。鸿祎
从首次披露正在研发类ChatGPT技术的国产赶demo版产品算起,历时长达四个月的超想多轮预热后,360终于正式加入“百模大战”。正式自研
据周鸿祎介绍,“360智脑”是360自研的千亿级参数通用语言大模型,具有10项核心基础能力,分别是 :生成与创作 、多轮对话、代码能力、逻辑与推理 、知识问答、阅读理解 、文本分类 、翻译、文本改写 、多模态 。据悉,上述全部为信通院““可信AIGC大语言模型基础能力”评估的必选项目,360也是国内首家通过的公司。
在国内各大厂商纷纷“卷”大模型的参数规模 、追求通用智能泛化的潮流中 ,周鸿祎判断大模型的未来一定是场景化、垂直化 、专业化,专有化 。
“中国已经进入‘百模大战’,基础能力各家都差不多。特别是互联网公司,比如百度、腾讯 、头条、阿里、360都有自身固有的场景,真正比拼的还是应用落地的能力 。”他表示。据悉,360旗下全端产品已经接入“360智脑”,包括360安全卫士、360安全浏览器、360搜索。
在这次大模型的首秀中,周鸿祎重点介绍了多模态能力与数字人应用。
360通过录屏形式展现了大模型在输入输出上的多模态能力 ,包括文生图 、图生文、视频生文 、文生视频 。工作人员可以通过输入文字来要求大模型作画,还可以输入一张图片、一段视频来要求大模型用文字讲解图和视频中的内容 。
周鸿祎认为 ,ChatGPT聊天机器人为同行指明了大模型发展路径的同时,也引导各家在文字输入输出表现上的较量 ,主要通过微调来实现。而下一步竞争的焦点在于多模态 。目前GPT-4已经展现了这方面的部分能力,未来的GPT-5会全面支持多模态。
360此次推出的数字人广场的平台 ,内含有200多个角色,主要有两大类,一类是数字名人,一类是数字员工。
该数字人被360定义为在“360智脑”大模型的通用智能基础之上 、融合多模态能力的产物——传统的2D或3D数字人主要通过动作捕捉 、智能合成 ,再加上渲染生成虚拟人形象,但却不具备生成内容的能力。例如数字人主播只能按给定脚本“念稿” ,而基于大模型的数字人模仿人的思维有人设 、能对话、能互动 ,今后还会加入记忆功能,未来会是“有灵魂”的数字人。
周鸿祎将数字人视作大模型未来落地的一大关键应用场景,“未来人工智能的发展不仅仅只有大模型核心能力的增加,各种外部功能的包装、产品的定义会让人工智能跟我们每个人的工作、生活贴得更近 ,会让每个人更自如地使用人工智能 。”