一、智慧能源——基于电力行业NLP大模型的设备运检知识助手示范应用


该应用由百度集团、国网智能电网研究院有限公司共同开发。

国家电网多年蝉联世界500强排名前3位、中国500强企业第1位,公司经营区域覆盖我国26个省(自治区、直辖市),供电范围占国土面积的88%,供电人口超过11亿,是世界上输电能力最强、新能源并网规模最大的电网。国网智能电网研究院作为国家电网的直属科研机构,在集团公司支持下,长期开展电力自然语言处理、知识图谱和电力专用大模型的研发,已形成电力分词、设备技术标准阅读理解、ICT客服问题识别与定位、设备缺陷定级等技术处理能力,持续推动人工智能技术与核心业务深度融合应用。

百度“文心”系列大模型涵盖自然语言处理、视觉、跨模态、生物计算及行业模型,在公开权威语义评测中斩获了十余项世界冠军。百度基于领先的深度学习和知识图谱增强技术,构建了千万级电力文本样本库和电力行业知识图谱,可实现海量异构数据的集成和智能化分析应用。

项目面向复杂电网专业场景智能化需求,基于“文心”大模型联合训练电力行业NLP大模型,已在电网设备、ICT客服实际业务场景进行试点验证。初步结果显示,相较于传统小模型技术,电力行业NLP大模型在电力专业分词任务上,F1指标提升9.27%,达到92.376;电力行业NLP大模型在电力营销敏感实体识别任务上,F1指标提升13.28%,达到94.947%。基于该项目成果,百度将联合国网智研院持续开展电力大模型共训,共同推进电力深层认知智能提升,助力构建清洁低碳、安全可控、灵活高效、开放互动、智能友好的新型电力系统。


二、智慧医疗——数字中医大模型示范应用


该应用由北京智谱华章科技有限公司、北京中医药大学东方医院共同开发。

当前中医领域存在名医数量少、传承断代、医疗资源不足等问题,名医经验的挖掘和整理是当前中医领域系统性、内涵复杂的一项工程。同时,人工智能技术的出现,使得“复刻”名老中医成为可能。北京中医药大学东方医院是国家中医药管理局直管单位、三级甲等中医医院、首批国家中医临床研究基地,积累了大量中医典籍、处方和中医临床数据。

智谱华章高精度千亿中英双语稠密模型“GLM-130B”于2022年8月发布并开源,在斯坦福大学大模型中心的全球30个主流大模型全方位测评中表现优异,其准确性等关键指标与OpenAI、谷歌大脑、微软和英伟达等公司的大模型接近或持平,全球已有70个国家1000余家机构申请使用。

项目面向中医领域名医经验挖掘整理需求,目标为基于智谱华章GLM-130B大模型,构建数字中医服务平台,“复刻”名老中医诊疗经验和学术思想,探索形成与名老中医高度匹配的高危肺结节人工智能临床诊疗解决方案,完成一定规模的临床评价研究,实现中医临床经验的智慧化复制新模式。截止目前已初步开发了医疗垂直领域的问答功能,支持对医疗、健康问题进行智能化知识问答;同时开发了根据症状生成中医诊方,并提供处方主治症候医学解释等辅助诊疗功能。


三、智慧城市——面向建筑领域多模态行业大模型示范应用


该应用由中国科学院自动化研究所、中铁建设集团有限公司共同开发。

中铁建设集团是世界500强中国铁建的房建旗舰企业,正在针对工程建造业务协同中数据多源异构、知识非结构化、管理工具滞后等问题,开展产业升级改造。集团在建项目600余个,在施面积超7000万平方米,有效整合政府监管、建设、施工、设计、监理、咨询等多源异构工程数据,积累建筑行业规范标准、法律文件、技术方案等电子文件超3万本,可拆分条文、技术点涵盖5000万条,覆盖建筑垂直领域超过10万个话题的海量专业优质中文语料库,为多模态大模型在建筑领域应用验证提供了良好的数据基础。

中科院自动化所“紫东太初”大模型是我国首个实现图像、文本、语音三模态数据间的统一表示与相互生成的千亿级多模态大模型,并实现全栈国产化开发和部署。2023年6月16日,自动化所发布“紫东太初”2.0全模态大模型,在语音、图像和文本数据的基础上,加入视频、信号、3D点云等模态数据,突破认知增强的多模态关联等关键技术,形成全模态理解、生成和关联能力。

项目面向建筑领域智能化需求,基于“紫东太初”多模态大模型和跨模态通用人工智能平台,联合研发建筑工程全闭环智能应用系统,形成项目地图索引、实时视频通话、风险快速传达、问题整改、自动回复等功能,赋能工程方案设计、技术文件审核等多个阶段全闭环场景,大大提升建筑行业智能化水平。


四、城市治理一一城市大脑大模型示范应用


该应用由中关村科学城城市大脑股份有限公司自主研发,由科大讯飞(北京)有限公司、中科大脑公司共同完成国产化改造。

中科大脑公司拥有近20年城市数字化建设经验,建成全国第一个全场景城市大脑,已形成 100多个物联网+城市治理应用,积累高质量城市治理语料库规模超 1000 万条发布30亿参数规模自研大模型“如如ChatTT”,在保证大模型基础能力的同时,可实现私有化部署,支持知识库插件框架,可与其他基础模型互联,提升基础模型领域知识的理解和生成能力。

科大讯飞在认知智能及大模型技术领域有深厚的积累,于2023年5月发布自研“星火”认知大模型,可通过自然对话方式理解与执行任务,从海量数据和大规模知识中持续进化,自研大模型分布式训练框架,同时积极与国内主流模型及国产GPU开展适配,已在办公、教育等领域实现应用。

项目面向城市治理领域智能化管理需求和国产化自主可控的安全需求,有效打通科大讯飞“星火”基础大模型和中科大脑公司“如如ChatTT”行业大模型,针对城市治理数据资源访问和应用受限、城市治理服务模型通用泛化能力弱以及人工智能时代下的信息安全等问题,在如如ChatTT基础上,完成城市治理大模型的国产化改造并示范应用,加速城市智能化建设,全面提升城市治理能力。


五、智慧医疗——基于山海大模型的门诊病历生成系统示范应用


该应用由云知声智能科技股份有限公司、北京友谊医院共同开发。

临床工作中面临着繁重的文书撰写工作,医护人员大量的精力花费在此项工作上。北京友谊医院长期探索应用信息化、智能化技术提升病历撰写和录入的效率,曾和云知声联合研发并实施了语音电子病历录入、超声助手等效率工具,积累了大量的数据和经验。

云知声长期开展医疗领域智能应用技术及产品研发,构建了大规模临床医学知识图谱,于2023年5月24日发布700亿参数规模的自研“山海”大模型,具有语言理解与生成、数理能力、代码能力、知识问答、逻辑推理、插件扩展等十大功能,可用于病历生成、临床决策支持、智能商保理赔等多个场景。

项目面向医疗领域文书撰写需求,基于云知声自研的“山海”大模型、以及前端声音信号处理、声纹识别、语音识别、语音合成等全栈式智能语音交互技术,联合研发门诊医患对话场景下的电子病历自动生成系统,实现诊室复杂环境下的降噪、医患角色区分、信息摘要及病历自动生成等功能。已建设投资2970万元,预计可提升医生的电子病历录入效率超过400%,节约单个患者问诊时间超过40%,提升医生门诊效率超过66%。


六、科学研究——覆盖元素周期表原子间势函数预训练模型示范应用


该应用由北京科学智能研究院、中国航发北京航空材料研究院共同开发。

中国航发北京航空材料研究院是我国航空装备关键材料的主要研发及制造单位。航空高性能合金随着性能的提升,逐渐走向多组元化,导致材料设计空间维度爆炸,难以通过传统的试错迭代开发新材料,亟需利用预训练模型揭示多组元相互作用,突破多组元设计关键技术,提高研发效率。

科学智能研究院在微观科学计算领域处于国际领先地位,于2022年12月发布全球首个覆盖元素周期表近70种元素的深度势能原子间势函数预训练模型DPA-1,该模型雏形曾获2020年全球高性能计算应用领域最高奖——戈登贝尔奖,可模拟原子规模高至100亿,大幅提高模型迁移能力和元素容量,显著减少建模开销,缩短研发周期,降低研发成本,已在高性能合金、半导体材料设计等应用场景中实现应用。

项目面向高性能航空关键新材料研发需求,基于原子间势函数预训练模型DPA-1,在元素覆盖范围、计算速度与精度、下游应用验证等方面开展联合研发,大幅提升模型的可迁移性、通用性和高效性,在航空高性能合金材料设计场景中降低模型训练所需数据量及训练成本,提高模型预测精度。


七、智慧金融——多模态智慧金融大模型示范应用


该应用由第四范式(北京)技术有限公司、北京中关村银行股份有限公司共同开发。

金融领域面临着研发、生产、供应链、销售系统、服务系统复杂,数据信息模态繁多且流转受限,缺乏具有一定专业性的智能辅助决策手段等问题。中关村银行是北京市首家获中国银监会批复筹建的民营银行,也是全国首家专注服务科技创新的银行,拥有大量的客服反馈问答文本信息,以及各类监管机构、行业协会法规和银行内部规章制度,为大模型在金融领域的应用部署提供良好的数据基础。

第四范式是以平台为中心的企业级人工智能领域的领军企业,针对企业智能化转型中面临的效率、成本、价值、辅助决策等问题,形成了成熟的系列产品和解决方案,已广泛应用于金融、零售、制造、能源与电力、电信及医疗保健等领域,在中国所有决策型企业级AI市场中排名第一。公司于2023年2月23日发布的百亿参数大模型“式说”,在生成式对话能力基础上,加入了文本、语音、图像、表格、视频等多模态输入及输出,可对接金融领域内部语料库、应用插件库等,实现对知识问答的快捷生成及溯源。

项目面向金融领域智能化需求,以第四范式百亿参数大模型式说为技术基础,联合开展金融多模态智慧金融平台研发及私有化部署,在行内规章制度及人员信息查询、行业术语通俗化解释、客户经理信贷管理、人工客服问答推荐、理财业务办理、AI应用快速研发等多个环节形成大模型能力,大幅降低客服管理成本,提升客服人员效率及客户满意度。


八、自动驾驶——自动驾驶大模型DriveGPT示范应用


该应用由毫末智行科技有限公司、长城汽车股份有限公司共同开发。

长城汽车是国内著名的主机厂,汽车年销量超过100万辆,目前已经出口到欧洲等地。目前长城旗下20多款车型已装载毫末智行研发的高阶辅助驾驶系统,自动驾驶里程超过6000万公里,覆盖全国各类道路和交通场景。由于量产车开放的驾驶场景,给自动驾驶算法带来了巨大的挑战,传统的小数据小模型模式无法处理如此复杂的环境,只有依靠大模型大数据。

作为国内最早开展自动驾驶大模型研发的公司,针对自动驾驶的业务特点,毫末智行建立了通用感知大模型,通过统一的大模型同时完成图片纹理、三维重建、图片语义和实例分割任务,在业界属于首创。毫末智行又提出并训练了业界首个自动驾驶生成式预训练大模型DriveGPT,包含自然语言对话式多模态数据筛选、自动标注、数据生成、数据仿真等功能。

项目面向长城汽车对于高阶辅助驾驶实时分析海量数据的技术需求,基于毫末智行自研“DriveGPT”大模型,提供问题场景的快速发现能力、场景数据的快速筛选能力、场景数据的自动标注能力、罕见场景的数据生成能力,以及云端仿真测评能力。基于大模型的这些能力,毫末智行能有效节省90%的标注成本,将算法对于模糊车道线的识别能力从40%左右提升到90%以上,对驾驶轨迹的预测误差降低近3倍。


九、智慧生活——面向消费领域的品商大模型示范应用


该应用由北京衔远有限公司、北京一轻科技集团有限公司共同开发。

一轻集团在大众消费产业板块拥有食品、饮料、乐器等多个品类,普遍存在客户反馈周期长、反馈渠道不清晰的现状,随着产品的多样化和更新迭代,对利用人工智能技术进一步挖掘消费需求、及时跟踪市场变化、加速研发新型产品、精准开展市场营销等方面都提出了迫切的需求。

衔远科技是专业从事消费制造业数字化服务的人工智能创新企业,创始团队在多模态内容理解与生成、知识表征与推理、人机对话、可信赖AI等人工智能基础理论和前沿技术的研究方面提出了一系列原创理论,并在互联网与产业数智化方面实现了规模化应用。公司自研的品商大模型是由大规模语言模型、多模态理解模型和图像生成模型组成的通用大模型,参数规模在百亿至千亿之间,融合消费、营销等领域专属中英文数据,具有消费者洞察与商品洞察、营销内容的标签化与智能生成等功能,已签约蒙牛、京东等客户,形成合同订单。

项目面向消费制造业数字化升级需求,基于衔远科技品商大模型及ProductGPT等应用,联合研发形成商品智能反向定制、预测性生产、智能调度、智能营销等服务功能,并在一轻集团旗下的10 个产品品类示范应用,赋能企业商业模式创新,实现从商机发现到产品交付的全链路数智化转型。


十、智能问答——智能问答大模型示范应用


该应用由北京面壁智能科技有限责任公司、智者四海(北京)技术有限公司共同开发。

作为中国最大问答式在线社区,知乎拥有累计超过5亿条的中文互联网讨论与问答内容、覆盖超过1000多个垂直领域和超过60万个话题的海量专业优质中文语料库资源,以及超过1亿的月活高知用户群体,在海量信息检索与快速精准聚合、提高用户获取信息效率等方面具有明确的技术需求,是大模型在智能问答领域的天然应用场景。

面壁智能技术来源于清华大学计算机系自然语言处理与社会人文计算实验室,已形成基础架构、算法开发、基础设施等全链条大模型技术研发能力,2023年1月发布自研大模型“CPM-Bee”,当月登顶中文零样本评测榜单ZeroClue,具备对话生成、自动问答、机器翻译、自动摘要等十余种能力。

项目面向知乎中文知识问答技术需求,基于面壁智能自研“CPM-Bee”大模型,联合开发“知海图AI”智能问答大模型,可归纳总结热榜观点并生成摘要,生成准确率超过80%,通过多模态、生成式、可解释及对话式的搜索方式,提升搜索结果的质量和用户体验,满足用户多样化的搜索需求,已于2023年4月在知乎实现应用部署。