“大模型”。
当这个词从专业领域“破圈”并频繁地被非专业领域的人们谈论时,说明它或已在撬动商业变革的一角。
通用人工智能的点星之光渐成火把,赋能了大批面向C端的应用,但“冰山”下还有高价值品——垂直深入特定行业和应用场景的大模型。
而垂直领域大模型的塑成和进化并非易事。
9月20日,在2023世界制造业大会开幕式上,“玄视——电力行业视觉大模型”首次面世,也意味着这项由合肥中科类脑智能技术有限公司与安徽明生恒卓科技有限公司联合研发的垂直领域大模型产品开始接受更多挑战。
9月22日,在2023世界制造业大会中国声谷大模型专场发布会上,中科类脑董事长刘海峰对“玄视”做了进一步的细致讲解。
“电网对能源安全的要求极高,对设备故障率和误检率也有着极致标准”,刘海峰以安徽电网为例,快速描述推动大模型产品研发的背景,“现在,安徽电网每天建设施工现场超过5000个,已建成设备在运总量超过250万台套,无人机、摄像头、机器人等智能监测设备广泛应用。由此生成的数据是海量的,而人工审核分析已远远不能满足业务的需要,人工智能应用需求迫切。基于传统卷积神经网络的视觉类专业模型,在应用于电网业务时,存在泛化能力差、迁移能力弱、落地周期长等问题。随着大模型技术的引爆,我们就开始思考,大模型可以为电力带来什么?可以为能源带来什么?”
业界认为,大模型则具有参数量大、精度高、泛化能力强等特点,在安监、设备、营销等专业场景已展现出明显的应用潜力。
“因此,我们以明生恒卓的海量电网数据资源为基础,结合中科类脑的人工智能技术能力和算力调度优势,从小模型深化应用到电网智能化联合开发,再升级大模型技术储备,最终形成垂直深入于电力行业的视觉大模型”,刘海峰围绕现场的产品演示录屏,细剖“玄视”几大亮点。
亮点一:6大领域、50+场景、4个特征
“玄视”通过学习文字与图像的语义对齐,将大语言模型的开放性能力植入到检测器中,不仅可以检测预先定义好的目标,还支持开放性的目标检测。
现在,“玄视”已具备电力业务能力相关的专业图像理解能力、逻辑推理能力、视频理解能力,可用于发、输、变、配、用以及安全监督六大领域,超过50个业务场景。举例来说,“玄视”能为海量电力设备健康状况做实时检测,保障及时消除缺陷,也可以实现各类施工作业现场实时安全监督提醒。这些能力的直观效果就是:用户停电更少、施工作业更规范、电网运行更安全,由此带来的经济和和社会效益巨大。
在实际应用中,“玄视”展现出“多、快、好、省”4大特点,即,可用于设备及环境状态监测、缺陷检测、安全作业监测等“多场景”;将垂直场景开发周期倍数级压缩、甚至可在1天内完成场景适配的“快能力”;将平均性能提升10%以上的“好效果”;较传统算法可节省约5倍推理算力的“省资源”。
亮点二:打通端边云协同能力,统筹差异化算力资源
作为行业大模型,“玄视”离不开行业数据和对业务的理解。
位于生产端的数据如何采集、处理、管理,业务专家如何将生产经验“传授”给模型,位于不同地理空间、不同架构的算力资源如何统一纳管、统一分配,都需要一个成熟的端边云平台来承载。最重要的是,在工程化方面,如何将数据、算力、模型、应用服务流程打通,在大规模数据、大规模算力、快速迭代训练的频度下完成自动化过程以提升效率,是平台系统的重点技术攻关内容。
“现在,我们已打通端边云协同能力,统筹差异化算力资源”,刘海峰强调,“在这样的创新优势支撑下,针对‘玄视’,我们计划于2023年底升级多轮次对话、于明年3月底提升多模态交互、于明年5月底扩展多场景应用”。
亮点三:化碎为整、强泛化、强扩展、“大”“专”协同
化碎为整,特指电力场景通用视觉大模型处理各类异常检测、环境设备状态监测、作业规范的能力,可覆盖发输变配用安监领域;强泛化能力,特指“玄视”从海量电力数据中提取模式和规律,自获强大的泛化能力;强扩展能力,特指“玄视”通过学习蕴含丰富的图像特征和知识表示,更容易迁移到新的任务;“大”“专”协同,特指大模型与专用模型的协同,即通过语言大模型理解用户意图,并将任务分配到“玄视”与各类专用模型,协作完成任务。
刘海峰认为,当海量的电力高质量数据与“玄视”大模型能力结合时,数据流和模型流的“双流飞轮”即成,这将进一步加速“玄视”的能力进化。
大模型的时代浪潮已起。“玄视”的问世带来了什么、还将带来什么,是一个开放式问题,需要长久的、合作式的、方向正确的坚持,才能拿到满意答案。
从技术中来,到应用中去。我们要做的,是变革电网安全巡视的智能化能力。