【聚焦两会】邵志清:建议加快大模型基础设施和创新应用生态建设

慧聪工程机械网   2024-03-08 09:28   来源:上海致公

数字经济与大模型成为今年全国两会热议的话题之一。21世纪经济报道记者获悉,全国政协委员、上海市政协副主席、致公党上海市委主委邵志清带来3份提案与2份建议,围绕信息化建设和数字化转型,邵志清在提案中建议“建设国家高水平数据开放平台”“建设数据资产创新应用体系”“加强数字身份和电子认证国际合作、加快发展数字贸易”,此外,他建议“加快大模型基础设施和创新应用生态建设”“加强长三角地区集成电路产业协同发展”。

在加快大模型基础设施和创新应用生态建设方面,邵志清指出目前国产大模型发展面临的四个问题与四个发展建议。

邵志清指出,人工智能是新一轮科技革命和产业变革的重要驱动力量,加快发展新一代人工智能是一项需要长期坚持的战略性任务。当前,大模型技术引领着人工智能领域迈入新发展高度,在世界范围内受到广泛关注。随着大模型技术不断迭代升级,模型能力不断加强,已逐渐形成从底层算力、模型开发到行业应用的全新智能化产业。大模型正在引发新一轮行业变革甚至新一次工业革命,已经上升为国家战略成为大国科技竞争的核心。近期,Open AI继ChatGPT之后发布首个文生视频大模型SORA,我国大模型技术与美国还存在较大差距。

他认为,发展国产大模型面临的主要挑战包括:超大规模算力需求、超大规模数据需求、全新模型训练算法与框架,以及大模型的应用生态。

首先,算力资源供应短期内仍然紧张。在基础大模型研发的几个关键要素中,算力是基础,算力紧缺所带来的限制作用尤为明显。一方面是当前市场上算力需求剧增,加之受美国制裁影响,英伟达高端GPU芯片无法购买。另一方面是国产芯片受限于性能和生态环境问题,迟迟无法大规模商用,短期内无法形成国产化替代。随着多模态模型的发展以及越来越大的模型参数量,大模型对算力的需求正在快速增长。

第二,高质量数据成为严重掣肘。精准、专业且高质量的数据,对于大模型进一步发展至关重要。目前国际主流大模型的参数数据集主要以英文为主,中文数据仅占英文的1/10。中文语料库还存在数据不完整、标注不一致、数据重复、数据更新等问题,严重掣肘行业大模型研发和应用落地。此外,行业大模型对特定行业数据则提出了更高要求,政务、医疗、智慧城市等领域数据获取难度大,隐私性高,阻碍了大模型应用落地的进程。上海成立了大模型语料数据联盟,打造多知识、多模态、标准化的高质量语料数据,链接模型训练、数据供给、学术研究、第三方服务等多方面机构,为大模型发展提供了有力数据支撑。

第三,大模型训练的工程化有短板。即便解决了算力供应和数据集的问题,大模型训练仍面临计算效率问题。构建大模型训练系统不是算力的简单堆砌,而是一个复杂的软硬件系统工程,需要在底层资源、集群架构、网络规划、故障恢复等各个方面进行优化以提升整个系统的计算效率,这通常是大模型的开发者所不具备的。目前在建的动辄千卡万卡的集群,如果不进行工程优化,其算力资源将有很大程度的浪费。

第四,应用方向同质化。当前大模型的开发存在同质化现象,较多集中在面向知识检索、文字生成等方面,其落地效果及实际业务收益有待进一步提升。大模型厂商需与企业用户深度对接需求,找到高价值、差异化的大模型应用刚需。另一方面,已有一部分大模型已经聚焦到垂类领域应用,但垂类大模型的难点在于除了要深入理解客户的业务,还需要涵盖特定领域的数据、专业知识。

针对国产大模型发展的上述问题,邵志清提出了四点对应的解法。

首先是加快算力基础设施建设。统筹构建公共算力基础设施,加快建设基于国产GPU芯片的大型智算中心。在认证评估、市场推广、政府采购方面给予扶持,引导国内模型企业优先使用国产算力平台,加快国产芯片规模应用和技术迭代。选取3至5个企业不同型号的国产芯片进行测试验证,在形成良性竞争的同时避免市场单一依赖。通过公共算力服务平台,为用户提供按需使用的低成本算力,降低大模型训练门槛,让更多的中小企业和创新创业主体能够参与到大模型的开发应用过程中,为大模型的创新发展提供扎实的基础。

其次是加强数据语料供给,提升大模型研发支撑能力。由政府牵头、产业链各环节龙头企业参与,共同推动高水平语料数据要素建设。通过区块链、多方安全计算等技术,保障各参与单位的数据安全与用户隐私。保障语料库建设的公共属性,服务于大模型应用,杜绝数据垄断。加强监管,从训练数据集的源头保障大模型应用符合法律法规要求和伦理道德规范。

第三是强化工程实施能力,提升资源利用率。将理论研究和工程实践高度结合,提升训练效率,降低资源闲置。鼓励应用创新,保持算力平台的高效率。倡导绿色节能,结合国家“东数西算”工程,将非实时的训练工作转移到西部能源资源充沛的地区,做到“东数西训”,提升大模型产业发展的能耗水平,保障国家“双碳”战略的实施。建设行业标准,提高大模型开发的效率和质量,促进大模型应用的广泛性和普适性。

第四是加快创新应用场景建设,牵引成果落地应用。建立常态化机制,重点在智能制造、生物医药、集成电路、智能化教育教学、科技金融、设计创意、自动驾驶、机器人、数字政府等领域构建示范应用场景,打造标杆性大模型产品和服务。引导行业用户向大模型厂商开放有价值的核心业务场景,进一步整合并开放行业数据,开展大模型应用试点,推动大模型在应用中不断提升能力。鼓励大模型团队找准行业或场景数据优势错位发展,探索大模型商业化模式和产业化发展路径。

免责声明:转载此文是出于传递更多信息之目的,并不代表本网赞同其观点和对其真实性负责。若有来源标注错误或侵犯了您的合法权益,请作者持权属证明与本网联系,我们将及时更正、删除,同时本网原创文章,欢迎您转载并标明出处,谢谢!

热门产品(点击查询产品底价)

整机专区

  • 挖掘机械
  • 铲土运输
  • 起重机械
  • 混凝土
  • 压实机械
  • 路面机械
  • 桩工机械
  • 工业车辆
  • 高空作业
  • 凿岩机械
  • 掘进机械
  • 农业机械

工程机械内幕
实时掌控行业大事小情

机主邦
机主邦 帮机主 让机主不孤单

慧聪商情电子刊
直达商家商机无限

工程机械品牌关注榜



// (function(){ var bp = document.createElement("script"); var curProtocol = window.location.protocol.split(":")[0]; if (curProtocol ==="https"){ bp.src = "https://zz.bdstatic.com/linksubmit/push.js"; } else{ bp.src = "http://push.zhanzhang.baidu.com/push.js"; } var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(bp, s); })();