文化大数据政策及新闻简报(3.14)
最新政策
1
证监会:关于政协十四届全国委员会第二次会议第01589号(经济发展类108号)提案答复的函
《关于建设数据资产创新应用体系的提案》收悉。经认真研究,现就涉及我会职责范围的问题答复如下:
长期以来,中国证监会高度重视《中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》等数据要素国家战略,积极发挥资本市场的资源配置与价值引导功能,深度挖掘数据要素市场价值,助力数据产业发展。截至2024年4月30日,我会指导中证指数公司、深证信息公司共编制数据产业相关指数10条,挂钩基金产品16只,产品规模合计82亿元。同时,2024年5月,我会会同国家数据局等共15个部委,联合举办2024年“数据要素×”大赛。
针对提案中提到的“制定数据资产作价入股和数据资产证券化等路径体系”、“鼓励成立数据券商等专营机构”等建议,考虑到目前数据资产创新应用相关法律法规与制度体系仍在探索中,现阶段,设立专门数据券商开展数据资产证券化的法律、市场基础尚不具备。
下一步,中国证监会将在有关部门关于数据资产证券化相关规则制定过程中,配合研究证券公司参与数据资产证券化的可行路径。同时,我会将丰富完善数据产业相关指数及产品,持续引导市场资金流入数据产业,积极释放资本市场助力数据要素市场发展的动能,充分发挥数据要素乘数效应,赋能经济社会发展。
感谢对资本市场发展的关心和支持,欢迎继续提出意见和建议。
中国证监会
2024年5月23日
(摘自:中国证券监督管理委员会)
2
2025年中央一号文件《中共中央、国务院关于进一步深化农村改革扎实推进乡村全面振兴的意见》
(《意见》详见附件)
(摘自:中国政府网)
3
浙江发布《发关于推动经济高质量发展若干政策(2025年版)》
(《政策》详见附件)
(摘自:浙江省人民政府)
展开全文
4
苏州发布《关于促进数据产业高质量发展的实施意见》
(《意见》详见附件)
(摘自:苏州市人民政府)
5
烟台市发布《烟台市“数据要素×”2025年行动计划》
(《计划》详见附件)
(摘自:烟台市大数据局)
行业动态(协会/联盟)
1
公共数据“超市”来了事关医保、交通、金融等
今天(1日),国家公共数据资源登记平台上线运行。各领域、各层级的公共数据将加快流动。公共数据为什么要进行登记?如何通过登记加快流动?记 者对国家数据局相关负责人进行了独家采访。
像登记土地一样登记数据
从日常生活中的煤气水电数据,到医疗数据、教育数据、气象数据等等,公共数据无处不在。
今年年初,我国公共数据资源开发利用政策体系初步形成。在做好数据共享、数据开放的同时,针对部分敏感的高价值数据,可引入专业化力量,对公共数据进行治理、加工,从而形成相应的数据产品和服务,这种创新模式有个新名词,叫作“公共数据授权运营”。在这种模式下,直接持有或管理公共数据资源的党政机关和事业单位,要像登记土地等要素资源一样对公共数据进行登记。
国家数据局党组成员、副局长陈荣辉介绍,凡是已经授权、计划授权运营的公共数据资源产品,都必须到这个平台上来进行登记。就像图书馆要对藏书进行编目,数据资源登记也是对全国公共数据资源逐步进行编目的过程,最终形成公共数据资源的“全国一本账”。
登记除了可以摸清全国公共数据资源的“家底”,同时还能加快公共数据资源的开发利用。
国家数据专家咨询委员会委员张向宏表示,随着平台登记规模不断扩大以后,一定会向公共数据应用、公共数据安全治理等方面迅速地扩展,整个普遍的公共数据它都会得到进一步的价值释放。
“邻居部门”牵手超220亿条医保数据率先“入库”
今天,随着国家公共数据资源登记平台上线运行,国家医保局成为首家在平台上登记的中央部门。
记者在国家医保局看到,本次被登记的这些医保数据都是医保药品的追溯数据,通过药品生产、流通、销售的追溯数据,就可以了解每一盒药品的“前世今生”。而当这些数据来到平台后,首先会形成一份公共数据资源目录。
国家数据发展研究院(筹)院长胡坚波表示,数据,其实也像我们的一种产品。我们为这个产品提供了一个公共数据的“超市编目”,各类数据的提供方可以把数据的名称、种类这些信息都反映到我们的登记平台上来,这样大家就能在“超市货架”上找到自己想要的数据。
国家数据局党组成员、副局长陈荣辉介绍,这个平台不仅是公共数字资源的管理 系统,也是信息披露和资源发现的窗口,全社会都可以来这里找数据、找产品。
拿本次登记的医保药品追溯数据来举例,一旦有需要的机构通过平台获取到这些数据,就能在不同应用场景里释放这些数据的价值。
比如,监管部门可以利用医保药品追溯数据,更高效地发现回流药、串换药、假药等不法行为。
再比如,医药企业通过利用好医保药品追溯数据,能够更好地促进新药研发,同时进一步优化销售策略。
未来将有更多种类公共数据进行登记
记者从国家数据局了解到,平台上线首日,除国家医保局外,来登记的政府部门、事业单位和相关企业都较为活跃。北京市大数据中心等地方机构也在平台上登记了一系列涉及社保、不动产、专利、政府采购等方面的公共数据。
国家数据发展研究院(筹)院长胡坚波介绍,目前,我们国家平台上已经有医保、气象、自然资源等多种国家级的数据,还有来自中央企业供给的一些公共数据。未来,还会有更多种类、更大范围的公共数据在平台上进行登记,为公共数据的开发利用提供更好的支持。
城市治理等领域应用多“时空类”数据开发潜力大
开展公共数据资源登记,是我国加大力度开发利用好公共数据的一项制度创新。眼下,公共数据的应用正在不断加速,与此同时,需求也在迅猛增长。
公共数据+城市交通,通过整合交通公共数据来优化信号灯配置,让城市拥堵率有所下降;公共数据+家政服务,通过汇集人社、卫健等部门的数据,可以让消费者对家政人员的社保、体检等信息进行核实;公共数据+金融服务,通过调用市场监管、税务等部门的数据,为金融机构提供企业信息查询和风险评估工具,助力金融机构“敢贷、愿贷、能贷、会贷”。
数据显示,目前,我国在城市治理、金融服务等领域开放的有效数据集较多,其次是交通运输、现代农业等领域。
此外,数据显示,公交站点、路线、时刻表数据,人口与经济指标数据,学校(幼儿园、小学、初中等)基本信息数据,企业/个体户注册登记信息数据等数据集,下载量均处于前列,说明这些方面的数据需求较为旺盛。
专家认为,在未来一段时间里,道路交通、气象等领域的一些公共数据将 会进一步释放潜力。
国家数据专家咨询委员会委员张向宏介绍,这些跟时间和空间相关的这些数据,可能会在低空经济、智能驾驶这些大的现象级场景应用方面大放异彩,所以这类数据可能是开发利用潜力比较大的。
(摘自:“国家数据局”公众号)
2
国家公共数据资源登记平台正式上线运行
今天(3月1日),国家公共数据资源登记平台()正式上线运行,登记工作全面展开,这标志着数据要素市场化配置改革迈出重要一步。
同期,山西、江苏、浙江、安徽、福建、江西、湖北等7个省级平台同步上线,并与国家平台实现互联互通。
开展公共数据资源登记,是贯彻落实《中共中央办公厅、国务院办公厅关于加快公共数据资源开发利用的意见》的重要举措。国家发展改革委、国家数据局联合印发《公共数据资源登记管理暂行办法》《公共数据资源授权运营实施规范》《关于建立公共数据资源授权运营价格形成机制的通知》后,国家信息中心积极搭建技术平台,地方、部门和相关企事业单位主动对接落实资源登记工作,为平台如期上线创造了条件,也为逐步形成公共数据资源全国“一本账”,促进供需对接和公共数据规范化、透明化应用奠定基础。
公共数据资源登记平台是开展登记工作的信息化载体,实行“一个标准、两级架构”。
今天上线的国家公共数据资源登记平台,主要负责办理中央和国家机关及其直属机构、中央企业的登记业务,同时暂时代为受理部分未完成平台建设省份的登记申请。
登记首日,国家登记平台已有医保、气象、自然资源等多类国家级公共数据上线,北京、天津、河北、内蒙古、辽宁、上海、广东、海南、四川、陕西、宁夏、新疆生产建设兵团等地依托国家平台开展了登记工作。
此外,山西、江苏、浙江、安徽、福建、江西、湖北等7个省级平台今天 同步上线运行,并与国家平台实现互联互通。
国家登记平台与省级登记平台依托国家电子政务外网实现统一赋码、互联互通,将逐步构建起职责明确、分工负责、运转有序的全国公共数据资源登记体系。
据国家数据局介绍,该平台不仅是一个数据资源管理系统,更是全社会获取数据、发现资源的重要窗口。
国家数据局相关负责人表示,未来将持续优化平台功能,提升登记服务质量,更好地满足用数主体的多元化用数需求,加快释放公共数据资源价值。
国家公共数据资源登记平台地址为:
平台显示,目前进行公共数据资源登记的流程大致有5步,登记申请--登记受理--登记审查--登记公示--确认单发放。
Q:什么情况下需要登记数据资源?
A:直接持有或管理公共数据资源的党政机关和事业单位,应对纳入授权运营范围的公共数据资源进行登记,鼓励对未纳入授权运营范围的公共数据资源进行登记。
Q:什么是登记主体?
A:登记主体,是指根据工作职责直接持有或管理公共数据资源的单位,以及依法依规对授权范围的公共数据资源进行开发运营的法人组织。
Q:什么是登记机构?
A:登记机构,是指由国家和地方数据管理部门设立或指定的、提供公共数据资源登记服务的事业单位。
Q:首次登记需要哪些材料?
A:首次登记时,登记主体应按规定提交主体信息、数据合法合规性来源、数据资源情况、存证情况、产品和服务信息、应用场景信息、数据安全风险评估等申请材料。
Q:登记结果的有效期是多长时间?
A:登记结果有效期原则上为三年,自赋码之日起计算。对授权运营范围内的公共数据产品和服务登记,根据授权协议运营期限不超过三年的,登记结果有效期以实际运营期限为准。
早在2月18日国家数据局新闻发布会上,国家数据局副局长陈荣辉就对国家公共数据资源登记平台进行了介绍。
陈荣辉介绍,在登记平台建设方面,全国登记平台体系建设按照“一个标准,两级平台”的思路开展。国家数据局制订统一的登记技术和业务标准,负责建设国家登记平台,确保与各省级平台对接,实现登记信息互联互通和统一赋码。各省级数据管理部门牵头建设省级登记平台。
陈荣辉表示,登记平台上线运行后,将发挥两个方面的作用:
一个是服务性功能,供数单位可以通过登记平台发布数据资源和产品信息,用数单位可以来这里查找数据资源,未来还可以发布数据需求,从而更好地实现供需对接,为降低全社会用数成本、促进数据资源价值释放创造条件。
一个是管理功能,通过登记工作,掌握全国公共数据资源底帐,加强授权运营信息披露,促进授权运营规范化、透明化。
(摘自:“国家数据局”公众号)
3
国家自然科学基金“数据市场制度设计与关键技术”宏观调控专项项目启动
2月26日,国家自然科学基金委员会“数据市场制度设计与关键技术”宏观调控专项项目启动会在湖北省武汉市召开。国家数据局党组成员、副局长沈竹林、国家自然科学基金委员会管理科学部主任丁烈云院士、武汉大学校长张平文院士出席会议并致辞。
为落实党中央、国务院关于完善数据基础制度、培育全国一体化数据市场等部署,国家数据局、国家自然科学基金委共同推动设立了“数据市场制度设计与关键技术”宏观调控专项,围绕数据市场基础理论、制度设计与支撑技术等开展专项研究资助,旨在探索解决数据要素市场培育和数据价值释放过程中的基础性理论性问题,为相关政策制定和实践探索提供科学理论与技术支撑。会上,沈竹林对获得专项资助的课题研究提出了三点要求:一是要坚持正确方向,深入学习贯彻党中央决策部署,将数据作为生产要素是习近平新时代中国特色社会主义思想的重大理论创新,要深刻领会和把握党中央战略意图,紧扣数据领域的重要战略需求,聚焦关键基础问题,在正确的方向上不断前进。二是要把握时代机遇, 加快构建数据基础理论体系,力争在数据特性及其作用机理、数据要素赋能新质生产力等方面为全球数据治理规则建设做出更大贡献。三是要坚持实事求是,注重研究成果在实践中的应用,着力解决实践难题,将数据领域各类试点试验和应用场景作为研究的观察点和试验田,努力将研究成果转化为具体的政策举措,实现理论和实践的相互促进。本次会议上,13个课题承担团队分别开展汇报,相关专家和国家自然科学基金委、国家数据局有关同志对课题开展质询和指导。国家数据局政策和规划司负责同志,国家自然基金委管理学部、信息学部负责同志,有关专项专家等参加会议。
(摘自:“数据要素社”公众号)
4
刘烈宏到中国司法大数据研究院调研
2月26日上午,国家数据局党组书记、局长刘烈宏到中国司法大数据研究院,调研司法数据赋能数字法院建设、开展授权运营工作情况,并就释放司法数据要素价值、服务经济社会发展等方面进行了交流。刘烈宏提出,希望中国司法大数据研究院把握人工智能发展机遇,加快高质量数据集建设,推动行业大模型应用,进一步提高司法数据资源开发利用水平,在推动数据要素市场化配置改革,加快数字中国建设方面发挥更大作用。国家数据局党组成员、副局长陈荣辉,有关司负责同志参加调研。
(摘自:“国家数据局”公众号)
5
上海市召开2025年数据赋能高质量发展工作会议
2月28日,上海市召开2025年数据赋能高质量发展工作会议。会议全面贯彻落实党的二十届三中全会以及中央经济工作会议精神,深入贯彻落实习近平总书记考察上海重要讲话精神,认真落实全国数据工作会议和十二届上海市委五次、六次全会部署要求,总结2024年工作,深化认识当前工作形势,部署2025年重点工作。副市长刘多出席会议并讲话,市数据局党组书记、局长邵军作工作报告。会议指出,2024年,在国家数据局关心指导和市委、市政府坚强领导下,全市 数据系统团结一心,一手抓机构改革落地,一手抓业务攻坚,取得积极成效。市、区数据局相继成立,统筹数据领域各项管理职责,工作体系基本成型,有力支撑全市数据工作继往开来,推动新型数字基础设施底座、适数化制度规则、开拓共赢数字生态三个创新探索,实现数据资源开发利用、数字经济和数字产业发展、全域全维度数字治理三个提效增能。会议强调,2025年是“十四五”规划收官之年,也是“十五五”规划谋划之年。要坚持党对数据工作的总体领导,全面落实国家和本市对数据工作的部署要求,继续抢抓数字化、智能化、绿色化发展机遇,全面推进“数字上海”建设,打造国家数字经济创新发展试验区。要把握“数据高效流通,释放要素价值”一条工作主线,夯实数据流通制度和底座两个支撑,加快推动数字经济和数字治理迭代升级,统筹好数据要素的便捷流通与安全治理,扎实推动各项任务举措落地。会议要求,做好2025年数据工作,要围绕中心、服务大局,牢牢把握新时期数据工作的使命定位;坚定信心、干字当头,全力抓好全年数据工作重点任务;增强本领、锤炼作风,锻造适应数据工作新要求的干部队伍,为数据赋能高质量发展作出新贡献。相关市级部门、各区主管负责人,各区数据局主要负责人,相关央(市)属企业负责人参加会议。
(摘自:“国家数据局”公众号)
6
国家数据局沈竹林一行调研联投湖北数据集团
2月28日,国家数据局党组成员、副局长沈竹林一行莅临联投湖北数据集团调研指导,深入了解数据集团在数据要素领域的技术创新与成果。湖北省数据局党组书记、局长周森锋,党组成员、副局长艾青松,湖北联投党委委员、副总经理雷宗江等陪同调研。
调研组实地察看了湖北数据集团中部流通服务驾驶舱、“数据要素×”体验空间等核心区域,详细了解了湖北省公共数据授权运营平台、中部数据流通综合服务平台的建设与运营情况,并听取了数据集团在数据资源开发利用、数据产权探索等方面的工作汇报。
沈竹林表示,湖北数据集团作为数据要素全场景综合服务商,在湖北省数据资源开发利用、公共数据授权运营、数据流通服务等方面作出了积极探索。他鼓励湖北数据集团继续深化数据治理,拓展各领域数据应用场景,加速场景孵化和 产品开发,深化“数据要素×”行动,为数据要素综合试验区建设贡献更多经验。湖北数据集团将以此次调研为契机,进一步提升数据服务能力,全面落实国家数据局的指导意见,在省数据局指导下,按照全省数据工作会议要求,为推动湖北省加快建成中部地区崛起重要战略支点贡献数据力量。
国家数据局政策和规划司、湖北省数据局、联投湖北数据集团相关负责同志陪同调研。
(摘自:“湖北数据集团”公众号)
7
黑龙江省数据工作会议在哈召开
26日,黑龙江省数据工作会议在哈尔滨召开。会议总结2024年全省数据工作,分析面临形势,安排部署2025年重点任务,扎实推动全省数据工作取得新突破新进展。
会议指出,2024年以来,全省数据系统在省委、省政府的坚强领导下,坚持以习近平新时代中国特色社会主义思想为指导,深入贯彻落实党中央、国务院决策部署,推动全省数据事业取得了新进展新成效。过去一年,数据基础制度体系持续构建,数据要素价值潜力加快释放,数字经济发展提质增效,数据基础设施建设更加夯实。
会议强调,2025年是“十四五”规划的收官之年,是“十五五”规划谋篇布局之年,也是国家数据局明确的“改革攻坚年”。要坚持以数据要素市场化配置改革为主线,统筹数字龙江、数字经济、数字社会规划和建设,以推进数据资源开发利用为抓手,以促进数据产业发展为重点,加强统筹谋划,完善制度机制,因地制宜、突出重点,协同创新、合力攻坚,重点突破制约数据要素价值作用发挥的难点问题,努力开创龙江数据工作发展新局面。
会议要求,做好2025年数据工作,要着力从以下6个方面加快推进。
一是协同推动数字经济和数字社会高质量发展。强化数据赋能和价值驱动,加快构建以数据为关键要素的数字经济,打造一批示范应用场景和区域数字产业集群,以数字经济高质量发展培育新质生产力,积极推进数字社会建设。二是持续完善数据规划政策体系。持续强化制度供给,有效统筹与国家层面制度体系和内容衔 接,推动各项制度措施协同发力和落地见效。三是助力构建全国一体化数据市场。从制度、生态、场所和治理等方面入手,加快数据市场建设,融入国家发展大局,探索数据要素价值释放路径。四是纵深推进数据资源价值释放。强化政策保障,积极拓展数据资源开发利用的深度和广度,加快释放公共数据要素价值。五是系统布局数据基础设施建设。优化全省算力设施建设总体布局,促进数据标注产业规模化发展,推进数据领域重大科技攻关和人才支撑体系建设。六是深入推进党建和业务融合发展。加强党对数据工作的全面领导,深化能力作风建设,以高质量党建引领数据工作高质量发展。
(摘自:“国家数据局”公众号)
8
山西省召开2025年数据工作会议
2月23日,山西省数据工作会议在太原召开。会议以习近平新时代中国特色社会主义思想为指导,全面贯彻党的二十届三中全会精神,深入贯彻习近平总书记关于数据发展和安全的重要论述,认真落实全国数据工作会议、省委十二届九次全体会议暨省委经济工作会议部署要求,总结2024年数据工作,安排部署2025年重点工作。省委常委、常务副省长卢东亮对会议作出批示,省发展改革委党组书记、主任陈磊出席并讲话,省发展改革委党组成员、副主任,省数据局党组书记、局长闫中立作工作报告。会议指出,2024年以来,省数据局坚决落实省委、省政府决策部署,在省发展和改革委党组的指导下,高效率衔接职责任务,高起点谋划数据工作,高标准推进任务落实,全省数据工作从夯基垒台到积厚成势,从发展起步到不断壮大,取得了一系列突破性进展和标志性成果。2025年是“十四五”规划的收官之年,也是数据工作改革攻坚之年,更是全省数据系统迈步新征程的重要一年,要坚定做好数据工作的信心和决心,坚持全面推进和点状突破相结合,坚持开拓创新与安全有序相结合,以敢闯敢试、攻坚克难的奋斗精神,奋力推动数据工作取得新突破。会议强调,做好2025年数据工作,要着力从6个方面取得突破。一是完善数据基础制度。紧跟国家政策和发展需要,按照“急用先行”原则,研究制定相关配套政策,启动编制“十五五”规划,构建数据标准体系。二是夯实数据基础设施。坚持以“算力提质、流通增效”为目标,不断推动算力扩规升级,适度超前部署数据流通基础设施。三是推进数据资源开发利用。围绕“聚-供-通-用-安”等环节,以更大力度推动公共数据归集、公共数据共享开放、公共数据授权运营,不断提升全省公共数据资源开发利用水平。四是培育壮大数字经济规模。锚定年度工作目标,细化举措,压实责任,重点在提升产业能级、实施“数乘智改”、强化项目建设、加强监测调度等方面持续发力,推动我省数字经济发展不断取得新进展新成效。五是推动公共服务数字提升。着力夯实城市数字底座,打造一批群众可感可及的典型应用场景,加快推动公共服务与数字技术深度融合。六是厚植数据创新生态。加快形成主体多元、竞争有序、协同创新、繁荣活跃的数据生态,为经济社会高质量发展提供数据支撑。会议期间还举行了数据局局长座谈会,围绕谋划和推动数字经济领域重点项目开展交流研讨。省直有关单位、各地市数据部门负责人,部分企业代表参加会议。
(摘自:“国家数据局”公众号)
9
贵州省公共数据服务平台上线运行
2月28日,“贵州省公共数据服务平台”上线运行。该平台作为全省统一的公共数据资源管理及授权运营的总枢纽和服务总门户,通过规范化管理、场景化开发与全链条监管,打造安全可控开发利用环境,深化数据要素市场化配置改革路径,为全国提供可复制推广的“贵州模式”。
据悉,贵州省公共数据服务平台以“省级主导、省市共建”为原则,首批归集住建、人社、医保、市场监管、文旅等9个重点领域 数据资源2012.33万条,形成62个初级数据产品。
据了解,该平台具备数据资源汇聚、数据场景申请、数据授权监管、运营成效分析四大核心功能。平台在确保数据使用的合法性和安全性情况下,集中管理和整合各类公共数据资源,确保数据的全面性、准确性,同时支持不同部门和企业根据需求申请特定的数据应用场景,推动数据在各领域的创新应用,通过实时监控和评估数据授权运营的效果,持续优化数据运营服务。
值得一提的是,平台全面接入国产大模型,推出智能问答机器人,面向社会公众和开发利用机构提供7×24小时在线服务。用户通过自然语言交互即可快速 完成数据要素、授权运营等政策解读,后续还将增加公共数据资源检索、平台功能使用咨询等能力,打造公共数据要素供需直达通道。企业可以通过平台获取更多高质量的公共数据资源,融合多源数据,再开发形成具有商业价值的数据产品和服务。
此外,平台构建的“汇聚-治理-授权-开发-应用-监管”全链条闭环体系,不仅破解了公共数据资源分散、数据流通不畅、数据价值难以充分发挥等问题,还实现了数据有序流通及规范化管理,显著提升我省公共数据资源开发利用活跃度和创新能力。
贵州省大数据发展管理局负责人表示:“平台上线标志着我省公共数据从‘资源化’向‘价值化’迈出关键一步,为数字经济高质量发展注入新动能”。下一步,贵州省大数据发展管理局也将在公共数据服务平台上持续发布可授权运营的公共数据资源,诚邀全国企业共同创新公共数据场景应用,打造开放、协同、共享的公共数据资源开发利用生态。
(摘自:“贵州省大数据发展管理局”公众号)
10
全国首个专为数据流通交易立法城市,杭州数据工作下一步这么做...
3月1日,《杭州市数据流通交易促进条例》(以下简称《条例》)将正式实施。作为全国首个专为促进数据流通交易开展地方立法的城市,杭州于27日召开了新闻发布会,系统介绍《条例》的主要内容和特色亮点,并就公共数据授权运营、数据权益、“中国数谷”建设、“国家数据基础设施建设(先行先试)任务”等方面的下一步工作进行了详细介绍。
杭州,有“互联网之都”“数字经济第一城”等美誉。近年来,杭州以“数字中国”“数字浙江”建设为指引,推出一系列具体举措和实践,努力开创杭州数据工作新局面。杭州先后入选国家数据基础设施建设试点城市,向平台企业开放信用监管数据试点城市;6个项目入选国家数据局全国优秀案例;在国家信息中心联合复旦大学发布的《中国地方公共数据开放利用报告》,杭州连续2年位居第一;2024年“数据要素×”大赛全国总决赛中,杭州获得二等奖1个、三等奖3个、单项奖3个,总获奖数排名全国前列。同时,杭州集聚了阿里巴巴、 网易等一批数据产业龙头平台企业,以及每日互动、火石创造、安恒信息等领军型数商,打造了“中国数谷”“中国视谷”“中国云谷”等产业地标。活跃的数据流通交易,也推动了以深度求索(DeepSeek)等“杭州六小龙”为代表的人工智能产业的蓬勃发展。
《条例》主要内容
《杭州市数据流通交易促进条例》是在2024年12月19日,由浙江省第十四届人民代表大会常务委员会第十四次会议批准,将自2025年3月1日起施行。
《条例》共计6章37条,从数据权益、数据开放与授权、数据要素市场培育、保障措施等方面作出了规定,进行立法创新探索。
主要内容有:
(一)明确数据主体和权益。“数据二十条”提出建立数据资源持有权、数据加工使用权、数据产品经营权等分置的产权运行机制。条例第八条至第十二条根据“数据二十条”有关内容和数据交易实践中广受认可的规则,明确提出“本市依法保护自然人、法人和非法人组织在数据流通交易活动中享有的数据持有、使用、经营等合法权益。”并具体规定了两类主体的不同权益和受托处理特殊情形下的权益归属:
一是“数据来源者”享有获取或者复制转移由其促成产生数据的权益;
二是“数据处理者”因合法处理行为实际控制数据的,其对该数据的自主管控状态依法受到保护;“数据处理者”对处理生成的数据和数据产品享有持有、使用、经营的权益;“数据处理者”可以对依法收集的已合法公开的数据进行处理;
三是受托处理的,数据处理者对受托处理的原始数据、处理过程中产生的中 间数据和结果数据不享有使用、经营的权益。
立法具体明确数据权益归属,回应了市场对数据权益确认的迫切需求。
(二)开展数据权益登记和规范化交易。“数据二十条”提出研究数据产权登记新方式。条例第十三条对数据权益登记的范围和效力等作出规定, 一是鼓励自然人、法人和非法人组织在依法设立的登记机构对数据的持有、使用、经营等权益进行登记。
二是规定有效的数据权益登记凭证可以作为数据流通交易、数据资产入账入表、数据要素型企业认定、融资担保等活动的证明。条例第二十一条、第二十二条还对数据交易机构、数据商、第三方机构等作出规定。鼓励市场主体通过场内、场外合法流通交易数据,但不强制进场交易,保障市场开放和公平竞争。鼓励数据商和其他专业服务机构发展,共同构建数据流通交易的生态体系。
(三)完善数据授权运营机制,探索收益分配方案。条例第三章将我市公共数据开放和授权运营经验固化为法规规定,鼓励企业数据开放和授权运营,防止数据垄断。规定个人信息数据授权机制和探索个人数据代理模式。在收益分配上,既强调健全数据要素由市场评价贡献、按贡献决定报酬机制,又要求更好发挥政府引导调节作用,建立体现效率、促进公平的数据要素收益分配制度。
(四)构建全面、包容的制度体系,支持产业生态构建和创新发展。为促进数据产业高质量发展,条例第四章从“三数一链”数据基础设施、数据资产入表、统计监测、标准建设等方面培育产业生态引导产业发展,第五章在场景应用、政策支持、交流合作、人才保障等方面提出一系列具体措施,并明确支持沙盒监管等创新试点,为“中国数谷”等促进数据流通交易的创新性工作提供立法支持。
《条例》落实工作
《条例》的出台实施,是杭州数据要素市场化工作迈上新台阶的一个重要标志。
杭州市数据资源局相关负责人表示,下一步,杭州将从以下三方面贯彻落实《条例》的措施:
一是创建“数据要素综合试验区”城市范例,贯彻落实《条例》。
落地数据产权制度,制定《杭州市数据产权登记实施细则》,编制数据产权登记审查指南、技术标准,开展数据产权登记,推广数据产权登记凭证应用。推进重点行业和领域数据要素价值释放,探索金融、文旅、交通、化工、医疗、低碳等行业可信数据空间。开展个人信息匿名化实践探索,建立《数据安全合规服务指南》,探索数据流通安全审计机制。
二是打造“数字经济创新发展试验区”城市范例,贯彻落实《条例》。
围绕数据产业和企业数据资源开发利用,研究制定《杭州市数据产业高质量发展实施意见》,打造数据产业杭州品牌,发布数据产业图谱,推动数据产业发 展。全力推进国家数据基础设施枢纽试点建设,打造不少于30个示范性强、带动性广的典型数据流通利用场景,接入不少于1000个数据生态主体,上架不少于2000个数据产品,产生显著经济社会效益。
三是探索数据市场化价值化实现路径,贯彻落实《条例》。
开展数据资产全过程管理试点,形成《数据资产管理全过程工作指引》,打造数据资产应用标杆和典型案例,探索建立公共数据资产政府指导定价机制。持续推进向平台企业开放信用监管数据试点,向移动支付平台开放信用监管数据,便利境外来华人员移动支付,推动高水平对外开放。优化公共数据授权运营,根据国家数据局印发的《公共数据资源授权运营实施规范(试行)》文件精神,修订《杭州市公共数据授权运营实施方案》,优化依场景授权流程,通过减时间、减环节,提升公共数据授权运营“供数”质效。
在提问环节,杭州市数据资源局相关负责人具体就公共数据授权运营、数据权益、“中国数谷”建设、“国家数据基础设施建设(先行先试)任务”等下一步数据工作进行了详细介绍。
公共数据授权运营
2023年9月1日,杭州率先在全国印发《杭州市公共数据授权运营实施方案(试行)》,构建公共数据授权运营管理体系,形成“1+7”的体制机制,建成全国首个公共数据授权运营平台。
2023年9月28日,正式面向全国征集金融、医疗健康和交通运输领域等3个领域的公共数据授权运营主体。一年多来,杭州市、区两级已发布征求17个授权运营领域,由48家企业申请公共数据授权运营,其中非杭州本地企业9家,共签订11个授权运营协议,按照“原始数据不出域、数据可用不可见”的要求,向企业授权18个部门109项数据,我市公共数据授权运营取得初步成效。
下一步,杭州将从三个方面推进公共数据授权运营。
一是进一步优化授权运营机制。按照中共中央办公厅、国务院办公厅印发的《关于加快公共数据资源开发利用的意见》文件精神,结合一年多来实践经验,分析授权运营各环节的堵点难点,优化依场景授权流程,通过减时间、减环节,提升公共数据授权运营“供数”质效。
二是进一步扩大授权范围。2025年,杭州将进一步挖掘市场需求大、数据资 源多的行业和领域,新增5个授权运营领域。通过金融、文旅等可信数据空间建设,实现公共数据与企业数据的融合应用。支持人工智能政务服务大模型开发、训练和应用,提高公共服务和社会治理智能化水平。
三是探索构建价格形成机制。按照“用于公共治理、公益事业的,免费提供;用于产业发展、行业发展的,可收取公共数据运营服务费”的原则,会同价格主管部门,指导运营机构建立各类应用场景下可提供的数据产品和服务项目清单,制定试行公共数据运营服务费标准。
数据权益
数据产权缺失构成了当今数字经济发展的一大堵点、痛点和难点。党的二十届三中全会《决定》要求,“加快建立数据产权归属认定、市场交易、权益分配、利益保护机制”。杭州在条例里,用一个章节六个条款,明确了数据来源者、数据处理者的有关权益。
为推动数据产权制度细化规则落地,今年,杭州将重点探索推进以下三项工作:一是探索完善权益登记制度。研究出台数据产权登记管理办法。进一步明晰数据采集生成过程的产权配置,组织数据资源企业,结合行业特征,探索不同行业、场景下,平台用户获取数据的细则、自动化程序收集公开数据的合法边界、衍生数据认定标准等一批可操作、可推广的指南、标准、案例等。二是探索开展数据产权登记。建设高效便捷的数据产权登记服务平台,发布数据产权登记审查指南。探索通过备案等模式,健全数据产权登记机构管理,支持市场主体结合自身领域优势,提供数据产权登记服务。鼓励权利人基于自愿原则申请数据产权登记,提供首次登记、许可登记、转移登记、变更登记、注销登记等产权登记服务。三是探索推动数据产权凭证广泛应用。鼓励将数据产权凭证作为权利人开展或参与数据要素流通交易、数据资产入账入表、数据要素型企业认定、融资担保等活动的证明。发布一批具有代表性的数据产权登记证书,形成一批数据产权登记证书应用的典型案例。
“中国数谷”建设
2024年,杭州印发了《杭州市关于高标准建设“中国数谷”促进数据要素流通的实施意见》,围绕“中国数谷”高质量发展,设立了促进数据要素流通(中国数谷)专项资金,提出了8项支持政策,分别是: 对通过杭州数据开放平台向社会开放训练、验证、测试、语料等优秀数据集的企业,最高给予100万元奖励。对参与杭州市公共数据授权运营的企业,最高给予100万元算力补贴。对通过杭州数据交易所进行首次登记挂牌数据产品和服务的企业,最高给予10万元奖励。对通过杭州数据交易所进行数据交易的企业,最高给予50万元奖励。对通过杭州数据交易所进行数据交易服务的企业,最高给予20万元奖励。评选市级数据要素标杆产业园,最高给予100万元运营经费补助。评选市级数据要素产业公共服务示范平台,最高给予100万元运营经费支持。评选“数据要素×”标杆型示范项目,最高给予100万元补助。上述八项政策,将于今年上半年明确具体政策实施细则。同时,今年,杭州市将研究制定推进数据企业高质量发展的政策文件,紧紧围绕数据产业、数据企业关切诉求和市场期盼,推出更多增量政策,推进“强产兴市”“利企用数”“促进发展”。
国家数据基础设施建设先行先试
为贯彻落实党的二十届三中全会关于“建设和运营国家数据基础设施,促进数据共享”的改革任务要求,2024年10月,国家数据局明确将包括杭州在内的18个城市列为“国家数据基础设施建设(先行先试)任务”试点城市,部署探索数据基础设施数据流通利用技术路线,杭州具体承担数场、数联网、区块链、隐私计算和可信数据空间等5项可信流通技术研发和应用推广任务,形成一套可推广可复制的技术方案、建设标准、工程规范,为全国提供可操作、可复制、可推广的经验做法,培育一批具有国际竞争力的数据基础设施企业。作为“全国数字经济第一城”,杭州在数据资源、数据关键核心技术、数据服务和应用、数据安全和数据基础设施等方面,培育、集聚了一批在全球具有竞争力的数据企业,在数据安全可信交换、高效流通利用领域,突破了一些关键核心技术。此次先行先试任务,杭州按照“政府引导、市场主导、主体多元”原则,采用“统一标准、统分结合”的方式,由杭州市数据资源局总体牵头,杭州市数据集团作为实施牵头主体协同其他市场主体配合完成试点工作。各市场主体按照“自愿加入、自负盈亏”的原则,参加先行先试工作。目前,已有包括杭州市数据集团、中国电信、中国移动、中国联通、蚂蚁密算等21家企业协同承担杭州试点任务。在接下来的两年内,杭州将按照国家数据局、浙江省数据局统一部署,围绕金融、医疗健康、文旅、物流、建材、绿色低碳、低空、交通、通信、视觉等重点行业领域, 基于这一套国家数据基础设施,构建至少30个行业数据空间,赋能行业发展,每个行业数据空间打造至少1个示范性强、带动性广的典型数据流通利用应用场景,构建政府引导、市场主导、主体多元的数据流通市场秩序和生态氛围,接入不少于1000个数据供方、数据需方、数据经纪、算法开发等各类数据流通利用主体,上架不少于2000个数据产品,繁荣数据生态,产生显著经济社会效益。期待更多数据企业参与杭州试点。
(摘自:“数据要素社”公众号)
11
辽宁省数据流通利用基础设施建设现场会在大连召开
2月26日,辽宁省数据流通利用基础设施建设现场会议在大连召开。国家数据局数字科技和基础设施建设司三级调研员黄亮,国家数据专家咨询委员会委员、北京交通大学教授张向宏受邀出席会议。省数据局(省营商局)党组书记、局长艾红锷出席会议并讲话。大连市副市长冷雪峰出席会议并致辞。
会议由大连市政府副秘书长周延主持,主要内容是总结我省国家隐私保护计算试点建设阶段性成果,部署下一步重点任务。
会上,黄亮和张向宏分别介绍了国家数据流通利用基础设施建设有关情况。黄亮在发言中指出,辽宁省在数字经济转型中展现出了巨大的潜力与创新能力,要抓住建设国家级试点的发展机遇,深入贯彻落实好试点工作任务。国家数据局将继续加强顶层设计,完善相关标准规范体系,为顺利推动试点工作提供有力支撑。随后,大连市数据局负责同志汇报了数据流通利用基础设施试点工作开展情况。
艾红锷在讲话中指出,要充分发挥数据要素对经济社会发展的赋能作用,推动传统产业数字化转型,助力经济结构优化,培育新质生产力,带动新兴产业蓬勃发展。国家数据局确定辽宁为东北地区唯一的数据基础设施试点,将辽宁纳入全国一体化数据流通利用基础设施布局,是对辽宁工作基础和工作成绩的肯定。要全面贯彻落实好国家重要战略部署,全力以赴打好打赢三年行动决胜之年决胜之战,奋力实现首季数据系统“开门红”。
他强调,要始终坚持问题导向、需求导向,切实将试点建设各项工作任务落 实落细。大连市要按照试点任务“三统一”要求,高标准开展基础平台建设,高质量构建数据要素互联互通体系,探索推进东北数据要素市场一体化协同发展。各地区要夯实数据工作基础,培育数据市场生态,挖掘打造数据场景,开发优质数据产品,形成合力,确保完成国家试点任务的运营指标。
他提出,要集全省数据系统之力,高位推动,统筹调度,真抓实干,组织专门力量,建立工作机制,采取有力举措,工程化、项目化、清单化抓好工作落实,扎实推进数据要素市场化配置改革不断取得新突破新进展,为辽宁数字经济发展提供重要战略支撑。
冷雪峰在致辞中指出,大连市要按照省数据局(省营商局)工作要求,抓住机遇,乘势而上,加快打造东北数据流通利用枢纽节点,高标准完成国家数据流通利用基础设施试点任务,为构建辽宁乃至全国一体化数据要素市场发展新格局贡献大连力量。
会议期间,大连市数据局与青岛市大数据发展管理局签署数据要素领域战略合作协议,两市将共同推动数据资源开发利用,建设跨区域数据流通利用基础设施。
与会人员还实地调研了大连数谷产业园区、大连市数据产业有限公司等数字企业,观摩了数字产业的最新技术和应用场景。
省数据局(省营商局)党组成员、副局长曲华锋,各市数据局主要负责同志及分管负责同志,大连市数据产业有限公司负责人,省数据局(省营商局)、大连市数据局相关处室负责人参加会议。
(摘自:“辽宁数据营商”公众号)
12
青岛市大数据工作会议召开
2月17日,青岛市大数据工作会议召开。会议以习近平新时代中国特色社会主义思想为指导,全面贯彻党的二十大和二十届二中、三中全会精神,认真落实全国数据工作会议、全省大数据工作会议和全市“以高质量项目建设推动高质量发展”动员大会精神,总结去年工作,分析面临形势,部署今年任务。青岛市大数据发展管理局党组书记、局长张艳出席会议并讲话。
会议指出,2024年是新一轮机构改革后全市大数据系统全面履职的第一年,在全市大数据事业发展史上具有重要里程碑意义。全市大数据系统坚持以数据要素市场化配置改革为工作主线,在统筹数字青岛、数字政府、数字经济、数字社会建设上稳步向前,传统优势更加巩固,创新突破更加强劲,数据活力更加充沛,
(摘自:“国家数据局”公众号)
各类活动动态
1
国家数据局副局长沈竹林主持召开“十五五”数字中国规划座谈会
为高质量做好“十五五”数字中国规划编制工作,2月27日上午,国家数据局党组成员、副局长沈竹林在湖北省武汉市主持召开规划编制座谈会,听取地方相关行业主管部门、专家学者和企业代表对数字中国建设目标和任务的意见建议。
与会代表结合本行业本领域发展情况,分别从数字产业、数据基础设施、数字农业、智能制造、数字安全、数字人才、数字文化、数字生态文明等角度,对“十五五”时期面临的形势和存在困难做了深入分析。企业负责人立足生产经营实际,对“十五五”时期发展任务和政策提出了具体建议。沈竹林认真听取了社会各界的意见建议,与大家就共同关心的问题进行了交流研讨,并鼓励大家继续在实践中积极探索,为数字中国建设贡献更多湖北智慧。沈竹林表示,科学编制“十五五”数字中国规划,对于推动数字中国建设和我国数据工作高质量发展具有重要意义。要确保始终沿着习近平总书记和党中央确定的方向前进,提高谋篇布局规划工作的站位,将数字中国建设摆在经济社会发展全局中予以推进。下一步,国家数据局将深入学习贯彻习近平总书记关于数据发展和安全的重要论述,把加强顶层设计和坚持问计于民统一起来,扎实做好“十五五”数字中国规划编制工作,为以中国式现代化全面推进强国建设、民族复兴伟业注入数字动力。湖 北省数据局主要负责同志、国家数据局政策和规划司负责同志,湖北省有关部门、相关企业代表参加了会议。
(摘自:“数据资产最前线”公众号)
2
国家数据局举办《全国数据资源统计调查制度》线上培训会
为加快推进全国数据资源统计调查工作、提高统计调查数据质量,2月27日—28日上午,国家数据局数据资源司举办《全国数据资源统计调查制度》线上培训会。培训会上,国家数据局数据资源司有关同志介绍了《关于防范和惩治数据资源统计调查造假弄虚作假责任制规定(试行)》,并就做好今年数据资源统计调查工作提出要求。全国数据资源统计调查工作组按照统计调查制度要求,围绕重点指标、填报流程、平台操作、数据质量控制等方面,面向调查对象开展专题培训。各省、自治区、直辖市及计划单列市、新疆生产建设兵团数据管理部门,部分地级市数据管理部门,以及参与统计调查的重点机构等工作人员共5.14万人次线上参加培训。
(摘自:“国家数据局”公众号)
3
长沙市国家数据标注基地建设成果发布暨2025年全省数据标注供需对接大会成功举办
2月26日,长沙市国家数据标注基地建设成果发布暨2025年全省数据标注供需对接大会在湖南大数据交易所成功举办。省数据局党组成员、副局长周述东出席会议并致辞。各市州数据部门负责人,省内外高校、科研机构、人工智能企业、数据标注供应商等200余家单位260名代表参加会议。
大会发布了总值达4.6亿元的数据标注及数据集订单、共计10200人次的数据人才需求,搭建了数据标注产业供需双方深入对接、交流合作的平台,为湖南省数字经济高质量发展注入新动能。铁塔视频数据标注赋能多领域智慧监测、文物数字化多模态数据智能标注、人类白细胞抗原(HLA)数据集等15个案例入选全省首批数据标注优秀案例。会议还发布了长沙市数据标注产业图谱、长沙市数据标注基地建设首批70个“合伙人”名单、行业高质量数据集建设领军企业及 标准制定企业名单。同时,湖南5G应用生态产业园被授予“长沙AI数据人才公共实训基地”称号,将建成全国领先的教育教学数据标注基地,培养一批高素质AI数据人才。
周述东在致辞中表示,本次大会既是成果展示的平台,更是协同创新的起点,也是落实国家部署的务实行动。面对数据标注产业发展的美好前景,全省各地要抢抓机遇,乘势而上。他提出三点具体建议:一是培土育苗,激发各类主体的活力,推进龙头企业与创新型中小企业协同发展,构建多元产业生态;二是链式集群,畅通数据标注产业链,推动上游数据供给、中游技术服务、下游配套支撑全链协同,提升数据要素价值;三是典型带动,发挥好示范引领作用,聚焦技术创新、行业赋能、生态培育、标准应用、人才就业、数据安全等六个方面,强化示范引领效应。湖南将以此次大会为契机,以“数据+标注”双轮驱动,深化供需对接与协同创新,加快推动形成全省数据标注产业链与国家人工智能重大生产力协同发展的新格局,打造创新活跃、应用广泛、要素集聚的全国人工智能产业发展新高地。
(摘自:“湖南省数据局”公众号)
跨境动态
1
香港首个人工智能大模型面世!
InnoHK香港生成式人工智能研发中心(HKGAI)今天(2月25日)举行HKGAIV1大模型全球首发发布会。这个人工智能大模型是全国首个基于DeepSeek全参数微调,并持续训练产生的大模型。
香港特区政府创新科技及工业局局长孙东致辞时表示,政府组织了香港的专家教授、科研团队召开了多次座谈会,探讨如何在香港开辟生成式人工智能发展的新赛道。研发中心由香港科技大学领军,还有其他四所大学和海外的科研机构共同参与,为香港研制自身大语言模型。
他指出,在不到一年的时间里,研发中心就开发出第一个大语言模型的版本“港文通”,并从去年年中开始,在政府部门开始试用及训练,至今有超过70个政府部门参与,充分体现了香港特区政府对这项工作的鼎力支持。今年年初,研发中心团队迅速将DeepSeek的底座模型架构与HKGAI模型的数据处理功能结 合,充分体现了在香港“一国两制”的价值观,也成就了HKGAIV1的推出。
孙东也表示,香港特区政府积极应对人工智能所引领的新一轮技术革命和产业变革,先后建设了人工智能超算中心,并推出了30亿港元人工智能资助计划,目前仅在香港科学园和数码港就汇聚了超过800家人工智能企业,香港没有缺席这波以人工智能为代表的科技浪潮。他希望香港研发的大语言模型能尽快服务大众,同时日后能服务数以千万的海外华人。
(摘自:“香港特区政府驻京办”公众号)
2
国家互联网信息办公室举办欧盟在华企业数据跨境流动政策座谈会
2月25日,国家互联网信息办公室在京举办欧盟在华企业数据跨境流动政策座谈会。国家互联网信息办公室相关局负责同志介绍中国数据跨境流动政策法规及中欧数据跨境流动交流机制有关情况,回答欧盟在华企业关于数据跨境流动的有关问题,商务部、工业和信息化部、自然资源部、国家卫生健康委员会、国家金融监督管理总局、北京网信办、上海网信办等部门相关负责同志介绍有关政策并参与交流。参会欧盟在华企业感谢国家互联网信息办公室举办本次座谈会,积极评价中方关于促进和规范数据跨境流动的政策举措,表示愿为中欧经贸合作作出更多贡献。23家欧盟在华企业和中国欧盟商会相关负责人参加座谈。
(摘自:“网信中国”公众号)
行业技术发展
1
腾讯推出快思考模型:API成本只有deepseek不到一半
最近,腾讯元宝可以说是「杀疯了」,先是多款产品接入deepseek,推出自研混元T1模型,又是猛推流,一度超越字节「豆包」登上中国区AppStore免费榜第二,又是入驻微信生活服务「九宫格」。
在各家大模型纷纷推出深度思考模型的同时,腾讯混元又「反常」地推了一个快思考模型TurboS。2月27日,腾讯混元自研的快思考模型TurboS正式发布,目前已在腾讯云和元宝上线。区别于DeepseekR1、混元T1等需要「想一下再回复」的慢思考模型,混元TurboS能够实现「秒回」,吐字速度提升 一倍,首字时延降低44%,同时在知识、数理、创作等方面也有突出表现。通过模型架构创新,TurboS部署成本也大幅下降,持续推动大模型应用门槛降低。有研究表明,人类约90%—95%的日常决策依赖直觉,快思考正如人的「直觉」,为大模型提供了通用场景下的快速响应能力,而慢思考更像理性思维,通过分析逻辑提供解决问题思路。快思考和慢思考的结合和补充,可以让大模型更智能、更高效地解决问题。据介绍,通过长短思维链融合,腾讯混元TurboS在保持文科类问题快思考体验的同时,基于自研混元T1慢思考模型合成的长思维链数据,显著改进了理科推理能力,实现模型整体效果提升。作为旗舰模型,TurboS未来将成为腾讯混元系列衍生模型的核心基座,为推理、长文、代码等衍生模型提供基础能力。基于TurboS,通过引入长思维链、检索增强和强化学习等技术,腾讯自研了推理模型T1,该模型已在腾讯元宝上线,用户可以选择DeepseekR1或腾讯混元T1模型进行回答,具体操作上,在元宝中选择Hunyuan模型,点亮T1即为深度思考,不点亮则为TurboS。开发者和企业用户已经可以在腾讯云上通过API调用腾讯混元TurboS,即日起一周内免费试用。定价上,TurboS输入价格为0.8元/百万tokens,输出价格为2元/百万tokens,相比前代混元Turbo模型价格下降数倍,是deepseekAPI成本的1/2-1/4,团队称「比大模型界的拼多多还便宜」。另外,混元满血T1将在3月初发布。在3月2日腾讯混元的直播里,腾讯混元专家团队对这次推出的快思考模型做出了详解,极客公园整理重点如下:
01 为什么要做「快思考」?
团队通过分析和观察发现,用户约90%的请求都可以依靠大模型的「直觉」(即快思考模型),无需深度思考就能精准简洁地给出答案,所以针对这些请求需要模型能更快、更准地回应。对于剩下的约10%的请求,需要模型能进行深度思考甚至反思,从而给出更精准的答案。同时,快思考模型不仅成本更低,还具备强大的数据融合能力,能够融入MySQL模型或Max模型中的优质数据。TurboS借鉴了腾讯的慢思考模型HunyuanT1的数据,该模型使用一种称为长思维链合成的技术进行训练。这有助于TurboS在保持其速度优势的同时,通过多步骤问题进行推理,使得对于其余10%需要反复反思思考的问题也能得到较精准答 案。
02 技术解析:模型架构/工程优化
在业界通用的多个公开Benchmark上,腾讯混元TurboS在知识、数学、推理等多个领域展现出对标DeepSeekV3、GPT4o、Claude3.5等业界领先模型的效果表现。
架构方面,通过创新性地采用了Hybrid-Mamba-Transformer融合模式,混元TurboS有效降低了传统Transformer结构的计算复杂度,减少了KV-Cache缓存占用,实现训练和推理成本的下降。传统Transformer架构存在以下缺陷:计算复杂度高,序列维度呈平方级关系,在训练和推理时复杂度高;推理时需要KV-Cache,且随着序列长度增加线性增加,部署成本高;预测时时间成本高,每步预测因叠加KV-Cache与序列长度呈线性关系,越往后生成越慢,尤其对比Mamba线性Attention机制,每步预测都是o(1)复杂度,所以需要做更高效的attention或甚至linear的attention,目前行业内已有一些相关探索方案如windowattention、mobile、NSA等,都是通过不同方式压缩计算复杂度。Hybrid-Mamba-Transformer融合架构是混元TurboS中的一项突破性架构创新,通过融合两种强大的架构,平衡效率和上下文推理能力:Mamba是一种状态空间模型(SSM),专为高效处理长序列而设计,在内存使用上比Transformer更为节省。与Transformer不同,后者在处理长文本时会遇到KV-cache内存的平方级扩展问题,而Mamba可以在不产生过多计算开销的情况下处理更长的文本,更适合阅读、总结和生成长文档的回答(例如法律文本、研究论文等)。尽管Mamba高效,但它在捕捉复杂的上下文关系方面不如Transformer。Transformer擅长理解复杂的模式和依赖关系,特别适合推理密集型任务,如数学运算、逻辑推理和问题解决,适用于多步骤推理、代码生成和深度上下文理解。混元TurboS首次将Mamba应用于超大规模MoE模型MoE(专家混合模型)通过每次查询激活一部分参数,从而提高计算效率,在保持精度的同时充分利用了Mamba的高效性,同时也保留了Transformer在推理任务中的优势。这一突破不仅降低了训练和推理成本,还提升了速度和智能水平。
算法做到了哪些不一样的工作?
长短思维链的融合。通过长短思维链融合,对于需反复推理反思的问题也能得到更精准答案,T1模型可得到相对长链数据,将长链数据和短链数据融合训练后采样,采样依据正确性和长度正确性,采用规则方法和滤波modelcase,从而提升模型整体能力,尤其在数学、代码、逻辑等强推理任务上表现更好,且短链模型能很好地融合长链能力,体验更佳。即短链模型其实体验更佳,通过融合长链也能有很好的推理能力。
04 scalinglaw还没结束
GPT-4.5是短链模型天花板的一个存在,但API的成本非常高,以百万tokens计算约为150美元,约是TurboS成本500倍,且据推测,GPT-4.5的激活参数量达万亿级别。因此,TurboS等快思考模型的出现,正是为了在保证响应速度的同时,降低成本并保持较好的性能。
不管是模型size的scaling还是训练数据的scaling,目前scalinglaw远未结束,现在中文互联网上可获取数据量各家差不多,谁能通过获取或合成方式获得更多数据量对模型performance来说是关键。
标注数据方面,更专业标注团队对模型表现影响大,如小说创作、医疗方向等,拥有更专业标注团队和数据的模型表现会更好,整体来看,在数据、算法、算力工程优化等方面对scaling的探索都远未结束。
(摘自:“极客公园”公众号)
2
DeepSeek开源周收官,亮点“五连发”!阿里、腾讯、OpenAI也有大动作……
2月28日,DeepSeek连续五天的“开源周”迎来收官日,带来了Fire-FlyerFileSystem(Fire-Flyer文件系统,简称3FS)和基于3FS的数据处理框架Smallpond。
DeepSeek大模型对3FS的解释是一个高性能并行文件系统,专为现代固态硬盘(SSD)和远程直接内存访问(RDMA)网络设计,旨在解决AI训练和推理工作负载中的存储瓶颈问题。
同日,OpenAI发布了GPT-4.5的研究预览版。OpenAI官方介绍称,这是其 迄今为止最大、知识最丰富的模型;并且,GPT-4.5能够更好地理解人类的意思,以更细致入微的“情商”来解读微妙的暗示或隐含的期望。
国内科技巨头也在不断创新,推动全球AI竞赛升温。本周二,阿里旗下通义千问(Qwen)团队发布了新推理模型——深度思考(QwQ)预览版;周四,腾讯混元发布了自研快思考模型TurboS,区别于DeepseekR1的慢思考模型,特点是任务处理能力更快。
DeepSeek开源了什么?
从2月24日开始,在持续五天的“开源周”期间,DeepSeek每天开源一个核心技术项目,覆盖AI模型训练、文件系统优化等多个领域。
第一天被开源的是FlashMLA,这是一个针对英伟达HopperGPU进行优化的高效MLA解码内核,专为处理可变长度序列设计,适用于高性能AI任务。根据官方介绍,使用FlashMLA之后,在H800GPU上可以实现3000GB/s的内存带宽和580TFLOPS的计算性能。
第二天被开源的是DeepEP,这是首个用于MoE(混合专家)模型训练和推理的开源EP(expertparallelism,专家并行)通信库,主要适用于大模型训练,特别是需要EP的集群训练。
DeepEP的特点包括:高效且优化的全对全(all-to-all)通信;节点内和节点间支持NVLink和RDMA;用于训练和推理预填充的高吞吐量内核;用于推理解码的低延迟内核;原生FP8调度支持;实现计算通信重叠的灵活GPU资源控制。
第三天,DeepSeek开源了DeepGEMM,这也是“开源周”期间的一大亮点。GEMM(GeneralMatrixMultiply,通用矩阵乘法)是深度学习和高性能计算中非常重要的计算操作,根据官方介绍,DeepGEMM是一个高效的FP8GEMM库,支持传统稠密模型和MoE模型的GEMM运算;在英伟达HopperGPU上可以实现1350+TFLOPS的FP8性能;关键是其核心逻辑约300行,但在大多数矩阵大小上均优于专家调整的内核。
第四天,DeepSeek一口气开源了三个项目:用于V3/R1训练中计算通信重叠的双向流水线并行算法DualPipe,适用于V3/R1的专家并行负载平衡器EPLB,以及公开分享了来自DeepSeek的训练和推理框架的分析数据,目的是帮助社区更好地了解通信计算重叠策略和底层实现细节。
最后一天,DeepSeek开源的3FS是一个高性能并行文件系统,专为AI训练和推理工作负载设计,特点是支持强一致性和高吞吐量(180节点集群中实现6.6TiB/s的聚合读取吞吐量);支持多样化工作负载,包括数据准备、数据加载、检查点保存和推理KVCache;结合现代SSD和RDMA网络,简化分布式应用程序开发。
这些开源项目不仅展示了DeepSeek在硬件优化、算法设计和分布式计算方面的深厚积累,也为AI开发者提供了强大的工具和基础设施。
值得一提的是,在“开源周”期间,DeepSeek开放平台推出错峰优惠活动。北京时间每日00:30至8:30的夜间空闲时段,API调用价格被大幅下调:DeepSeek-V3降至原价的50%,DeepSeek-R1价格更低至原价的25%。
DeepSeek官方表示,鼓励用户充分利用这一时段,享受更经济更流畅的服务体验。
AI巨头动作不断
在DeepSeek“开源周”收官日,OpenAI终于发布了GPT-4.5的研究预览版,宣称是其迄今为止最大、知识最丰富的模型。
GPT-4.5受外界关注的一大特点是“更通人性”。根据官方介绍,早期测试表明,与GPT-4.5交互感觉更自然,它的知识库更广泛,跟踪用户意图的能力更强,而且“情商”更高,这让它在提高写作、编程和解决实际问题等任务上非常有用。
从OpenAI官网展示的使用案例来看,当被询问“帮助度过困难时期”时,GPT-4o给出了一系列解决方案,而GPT-4.5虽然回答内容字数更短,但表现出更高的“情商”,“AI味”或者“人机味”降低了不少,更像一个现实中的朋友。
值得注意的是 ,GPT-4.5是OpenAI最后一款“非链式思维(non-chain-of-thought)”模型。此后,OpenAI将致力于融合o系列与GPT系列,推出整合多项新功能的GPT-5。
与这种趋势相对的是,2月27日,腾讯混元推出了一款区别DeepseekR1等需要“想一下再回复”的慢思考模型、可以“秒回”的快思考模型TurboS混元。
腾讯表示,慢思考模型在深度思考和推理能力上表现出色,但相应地,推理所需时间也更长。就像人类90%以上的决策依赖直觉,大模型除了拆解逻辑、理性推理的慢思考,同样需要「即时响应、流畅生成」的快思考。快、慢思考的结合和补充,可以让大模型智能且高效地解决问题。
混元TurboS主打更快的任务处理能力——吐字速度提升1倍,首字时延降低44%,并通过架构优化大幅降低部署成本,帮助更多企业与开发者以更低门槛使用高效AI大模型。
目前,TurboS已在腾讯云官网正式上线,API定价输入为0.8元/百万tokens,输出为2元/百万tokens,相比前代混元Turbo模型价格下降数倍。同时,腾讯元宝也将逐步开启TurboS的灰度上线。
另一科技巨头阿里旗下通义千问(Qwen)团队则在本周发布了最新推理模型深度思考(QwQ)预览版。
深度思考(QwQ)是在QWQ-MAX-PREVIEW支持下基于Qwen2.5-Max的推理模型,擅长数学理解、编程、AI智能体等,展示出更强大、更全面的推理和解决问题的能力。
据路透社报道,知情人士称,由于对DeepSeek低成本人工智能模型的需求激增,中国企业正在增加英伟达H20人工智能芯片的订单。报道提到,自DeepSeek上个月进入全球公众视野以来,腾讯、阿里巴巴和字节跳动对H20的订单“大幅增加”。
本周,英伟达在市场瞩目下披露了2025财年业绩,营收中有53%来自美国以外的地区。在美国出口管制下,英伟达向中国客户只能供应性能缩水的芯片,英 伟达CEO黄仁勋在电话会上表示,在第四财季,中国业务的营收和之前大致相同,约为出口管制实施前的一半。
最近,DeepSeek的“朋友圈”极速扩容。本周起,广东深圳市基于政务云环境面向全市各区各部门,正式提供DeepSeek模型应用服务;在深圳市福田区,70名政务AI“数智员工”已正式上岗。
不仅是深圳,内蒙古呼和浩特、江苏无锡、江西赣州等地也陆续宣布完成政务环境DeepSeek系列大模型部署。这些“AI数智员工”到底有多能干?人工智能应用于政务服务,又将如何持续助力政府服务提质升级?
(摘自:“国际金融报”公众号)
机构动态
揭牌!中央广播电视总台人工智能大楼启用
2月28日,中央广播电视总台人工智能大楼揭牌活动在京举行。中宣部副部长、中央广播电视总台台长慎海雄,国家发展和改革委员会副主任赵辰昕致辞,并为总台人工智能大楼揭牌。中宣部副部长洪大用、中央广播电视总台副台长王晓真与嘉宾一同启动“央视听媒体大模型2.0”上线。中央广播电视总台副台长邢博,哈尔滨工业大学校长、中国科学院院士韩杰才等出席活动。《中央广播电视总台人工智能发展白皮书(2025版)》同日发布。
慎海雄在致辞中表示,习近平总书记指出,“人工智能是新一轮科技革命和产业变革的重要驱动力量”。党的十八大以来,我国科技事业取得历史性成就、发生历史性变革,人工智能等前沿技术“井喷式”爆发,重塑了全球科技竞争格局。中央广播电视总台是这一非凡历程的亲历者、记录者,也是参与者、推动者,总台以“5G+4K/8K+AI”赋能融合创新,媒体科技实力达到“国内最好、国际领先”,实现从跟跑到领跑的跨越。慎海雄说,作为全国首座以“人工智能”命名的媒体大楼,中央广播电视总台人工智能大楼的启用,是总台落实习近平总书记对科技发展和对总台工作的一系列重要指示精神、服务党和国家工作大局的一项有力举措。总台将构筑高质量中文语料库,重塑世界对中华文化的认知;建设行业领先的AIGC媒体应用平台,加快发展媒体领域新质生产力;打造AI创新实践标杆,让“思想+艺术+技术”合力生光,让更多“从0到1”的突破在这里诞生, 为全球媒体产业升级提供可借鉴的“中国标杆”“中国范式”,让人工智能成为推动高质量发展的“国之利器”,为中国式现代化注入强大动能。赵辰昕在致辞中表示,习近平总书记创造性提出发展新质生产力这一重要论述以来,我国创新动能加速蓬勃发展,特别是以人工智能为代表的创新技术飞速发展、日新月异,正在引领新一轮科技革命和产业变革。总台积极对接国家重大战略,充分发挥资源禀赋优势,将数据资源开发与人工智能应用有机结合,将服务国家重大战略和推动媒体系统性变革有机融合,充分体现了国家级媒体平台的重大责任担当。相信随着总台人工智能领域建设工作的深入推进,特别是在与各高校、科研院所、市场机构的通力合作之下,将加快建成具有中国文化认知的语料库,加快开发生成式人工智能技术在新闻传播领域的创新应用,为唱响主旋律、提振精气神提供更加强有力的支撑。
活动上发布《中央广播电视总台人工智能发展白皮书(2025版)》,以积极推动应用等原则为基本纲领,围绕人工智能技术在赋能总台媒体生产、引领传播模式创新方面取得的最新进展,重点阐述总台推进人工智能媒体应用的整体思路,为推动媒体行业与人工智能的融合走深向实提供借鉴与参考,为全球媒体智能化转型提供“总台方案”。
现场启动上线的中央广播电视总台央视听媒体大模型2.0,对原有的1.0版本进行全面升级,以总台高质量的综艺、影视剧、动画、体育等多领域垂类语料为核心,以丰富的制播应用场景为导向,遵循媒体业务需求,深化设计文本、图像、视音频环节交互流程,打造多模态协同的智媒体应用,以分步生成方式强化过程把控,提高生成效果专业性,切实满足节目创作需要,解决媒体生产实际问题。
活动现场,中央广播电视总台与北京大学、清华大学、上海交通大学、浙江大学、武汉大学、哈尔滨工业大学等高校分别签署合作协议,共同探索人工智能在媒体传播中的应用,培养具备创新能力和实践能力的高素质人才,为媒体行业的数字化转型提供有力的人才支撑和技术保障。
中央广播电视总台与国家信息中心、合肥综合性国家科学中心数据空间研究院等智库单位分别签署合作协议,共同探索媒体数据共享的新模式,为媒体行业的人工智能发展提供更加丰富的数据资源,推动人工智能技术在媒体领域的广泛 应用。
中央广播电视总台与上海人工智能实验室、华为、腾讯、阿里云、科大讯飞、火山引擎、百度、智谱华章、阶跃星辰、稀宇科技、月之暗面等大模型研发机构分别签署合作协议,共同促进高质量语料汇聚和生态创新发展,加快基础模型和各垂类模型的训练与应用落地,推动我国生成式人工智能快速发展。
揭牌活动开始前,与会嘉宾参观了位于总台人工智能大楼一层的“CMG人工智能创新技术应用展”。展览多角度呈现总台“中国红”8K转播车、AI赛事技战术分析、2025蛇年春晚创新技术、央视频大小屏融合传播、AI修复增强、多语种播报智能转换、央视听媒体大模型等人工智能技术成果。
作为未来中央广播电视总台在人工智能领域的重要基地,总台人工智能大楼汇聚了总台在人工智能领域的前沿技术与创新成果,将为总台的内容生产、传播模式创新等方面提供强有力的技术支撑和服务保障,推动国家高质量语料库、总台人工智能媒体应用平台与数据中心建设,加快网络系统、存储系统、算力平台与云平台部署,立足总台服务全国媒体行业,为内容生产和传播提供全面的大模型处理能力,为媒体行业高质量发展注入澎湃动能。
中央广播电视总台编务会议成员姜文波、周振红,总台总会计师董为民,国家发展和改革委员会政策研究室主任蒋毅,国家信息中心主任徐强,北京市石景山区委书记常卫,区委副书记、区长万隆,北京大学副校长任羽中,清华大学党委常务副书记向波涛,上海交通大学副校长蒋兴浩,浙江大学副校长吴健,武汉大学党委副书记楚龙强,哈尔滨工业大学副校长刘挺等出席活动。国家发展和改革委员会、科学技术部、工业和信息化部、中央广播电视总台相关部门负责同志,相关高校、智库、大模型研发机构代表等参加活动。
(摘自:“总台之声”公众号)
免责声明:文章素材来源于网络,如有侵权,请联系删除。
评论