探讨RAG技术、AI代理及AI伦理挑战
张妮
ZHANG Ni
摘 要:数据作为关键性生产要素,其价值和重要性日益凸显,成为赋能我国新质生产力发展的关键引擎。数据在“资源化—资产化—资本化”的价值实现链条上,通过场景化使用,从低质量、碎片化的原始数据转变为进入社会化生产流通的数据要素,便能完成价值的动态增殖,实现从资源到资产、从资产到资本的转化。当前社会实践中,将数据要素资源的价值充分发挥出来,推进数据要素价值化链条的顺利实现,首先需要解决数据产权确权、数据流通与交易、数据资产价值评估、数据保护等重难点问题,可通过颁布清晰明确的连续性政策,解决数据价值化的重要基础问题,加快建立交易前价值评估与价格形成机制,探索形成数据融合应用体系等加快推进数据要素价值化进程。
关键词:数据要素;数据要素价值;数据资源;数据资产;数据资本中图分类号:F49 文章编号:10074074(2024)05005208
基金项目:国家社会科学基金重大项目(20&ZD161)
作者简介:张 妮,女,中国人民大学信息资源管理学院博士生,中国人民大学书报资料中心副编审。
在当今的数字经济环境中,数据已成为一个重要的生产要素,深入到生产、消费、交换、分配和社会服务等各个方面,对生产、生活和社会治理方式产生了深刻的影响。数据作为国家重要战略资源,其价值得到广泛认可,成为赋能新质生产力发展的关键引擎。从理论上说,数据通过场景化使用,从未经加工过的低质量、碎片化原始数据转变为可进入社会化生产流通的数据要素,完成价值的动态增殖,实现从资源到资产再到资本的转化[1],数据要素的价值在这一进程中不断被创造, 并最终得以实现。
近五年来,我国密集出台推动数据要素价值化实现的政策措施。2019年,党的十九届四中全会明确将数据列为生产要素。2020年4月,中共中央、国务院印发了《关于构建更加完善的要素市场化配置体制机制的意见》,成为第一份关于数据要素市场化配 置的文件。2022年底,《关于构建数据基础制度更好发挥数据要素作用的意见》发布,这是我国第一个以数据要素为核心的基础性
文件。2024年初,国家数据局等17个部门印发《“数据要素×”三年行动计划(2024—2026年)》,
计划施行多样化、可持续数据要素价值释放的重点行动。从政策需求层面说,国家对“充分释放数据要素价值,激活数据要素潜能”的需求强烈而紧迫,但国内外围绕数据要素价值化实现的理论研究刚起步,诸多数据要素价值化实现链条上的难点与问题有待突破。如何平稳顺畅地实现数据价值的提升与转化,是进程中的重难点问题。
目前,尽管新闻媒介中充斥着大量宣传与推介数据要素价值的文章,但实际上人们对如何利用并实现数据要素的价值知之甚少。对于数据为何能产生及如何产生价值的,国内外早已有许多研究。
(一)数据价值的提炼第一条思路着眼于数据自身的生产管理过程。这一思路有两种不同的理论基础:一是以知识管理框架DIKW模型(Data-InformationKnowledge-Wisdom Model)为基础,认为数据本
身是无意义的事实记录,只有经过主体使用、分析和提炼,才会产生对人类有用的、具有特定功能的信息[2]。此后,基于DIKW模型提出的“数据— 信息—知识—决策”数据金字塔,将其与数据价值链(即数据生产过程)相连 [3]。 二是以信息生命周期管理理论(InformationLifeCycle)为基础,提出信息“产生—采集—组织—存储和检索—利用—清理”的周期过程,该模型认为每个阶段都可能使信息得到增值[4],提 供 了最早的链式价值实现思路。之后MichaelE.Porter的价值链概念
为基础,构建出从数据发现、集成到开发的整个价值链框架[5],并将大数据系统分解为数据生成、获取、存储和分析四个模块[6]。
数据价值链基于获取、存储、处理和共享大数据的连续步骤,将附加值转化为现金[7]。依托数据采集、集成、分析和决策的大数据分析4A框架,大数据价值的产生还归因于大数据分析[8],从大数据的范围、速度等“10Vs”方面产生价值,能构建出更适配大数据需求的价值链。大数据价值链可将有价值的内容和见解货币化[9],大数据货币化是组织通过一系列步骤处理内部和外部数据源中的数据,将其转化成有用信息,或产生有用洞察和见解,从中产生新的收入的能力[10]。
第二条思路着眼于数据价值实现的微观主体———企业或组织。相比于由严谨数据主导的领域,大数据在由直觉主导的领域中表现出更为明显的积极作用[11]。几乎所有企业都可以从各种来源收集大量数据,并将物质、人力和组织资源进行融合来创造竞争优势,且根据不断变化的市场条件重新配置资源[12]。基于企业资源基础观和动态能力观,识别大数据分析的主要关涉领域,增强其动态能力介导,对营销和技术能力产生积极影响,从而建立企业竞争优势[1314]。
在上述价值讨论的基础上,更为具体地分析数据对企业供应链管理、营销管理及人力资源管理等方面的价值与作用。首先,对供应链管理的研究主要集中在采购、制造和物流方面。从价值发现、创造和捕获的维度及嵌入式结构提供大数据供应链管理框架[15],也有提出“维度—途径— 收益”概念框架,帮助理解和研究大数据采用的各种要素,以及在供应链流程能力和竞争优势方面可能影响采用前意图和采用后满意度的能力[16]。其次,大数据可以为产品创新和营销策略的制定流程提供信息,并保护品牌免受新风险的影响。营销部门会经历大数据分析实施的五个阶段:萌芽、认可、承诺、文化转变和数据驱动营销,每个阶段都会有关键特征和需要避免的潜在陷阱[17]。最后,大数据为人力资源管理带来新机遇,但也带来技术、方法和道德层面的重大挑战[18]。
第三条思路从更具宏观视野的社会经济角度研究,探讨如何能动发挥与体现出国家战略层面的数据价值,如数据货币化策略、跨境数据流推动全球经济的作用、衡量数据经济价值的有效途径等[19];数据作为经济资产存在潜在社会福利价值,而不仅仅是对拥有特定数据集的组织具有私人价值。这种价值也越来越多地体现在更为广泛的数据战略相关国际政策和治理中[20];讨论数据的价值估计以确定适当的投资水平,以便更好地了解数据如何为经济贡献价值,以及如何管理不同类型数据的使用[21]。
在我国,数据要素作为国家层面提出的新型生产要素,其价值化实现承载着我国拉动经济增长、赋能经济社会发展的重要使命。数据要素是指在社会生产和经营活动中,为用户或所有者创造经济效益的、以电子形式记载的数据资源。清华大学金融科技研究院的研究者认为,数据成为数据要素需具备两大必要条件:一是把原始数据加工成机器可读的,具备投入生产使用条件的生产数据;二是通过流通使数据进入社会化大生产, 如同其他资源一样可进行社会化配置利用,数据要素化的本质在于流通。数据要素的价值化需要经历“数据资源—数据资产(产品)—数据商品— 数据资本”形态演进过程[2223]。数据从战略资源升级为生产要素,数据要素化的过程包含资源化、资产化和资本化三个阶段[2425]。
第四条思路从数字经济框架下产业数字化与数字产业化的角度研究数据价值。在数字产业化与产业数字化的进程中,二者都有数据收集、分析、管理、存储和使用等价值实现的环节。要想准确区分二者,还需从数据价值的演化历程出发,深度剖析二者的协同发展。产业数字化以数据产生为基本特征,它包含了传统行业的数字升级及其与传统行业的深度融合。在此过程中,大量的数据资源通过确权和价值评估等方式转化为数据资产。随着数字化转型的不断深化,所积累的数据资产也在不断地增加,企业试图把它们转化为经济利益。其中,数据要素交易市场作为数字产业化的核心环节,其有效运行离不开云计算、大数据、区块链等技术支撑。为此,必须将其嵌入到更广阔的数字产业化领域中,才能实现数据资产增殖与形态转换。数字产业化以数据利用为核心特征,既包含了由数字技术本身构成的产业,也包含了对数据、信息和知识加工处理而成的产业。数字产业化在对数据进行加工、处理、流通的全过程中,构成了“数据资源—数据资产—数据商品—数据资本”完整的价值链。
产业数字化与数字产业化协同发展过程蕴含了数据资产向数据商品跳跃和数据商品向数据资本演进两个价值实现过程[26]。一方面,数据要素赋能传统产业向数字化、网络化和智能化方向转型升级,可以通过搭建产业“数据空间”及扶持“数据链主”推进产业数据上下游交易[27]。对此过程的研究目前还主要集中于定性研究,实证研究还有待突破。另一方面,数据产业中数商的快速涌现,数据公司、企业数据部门、各场景应用中数据产品的不断丰富,都为数据产业规模、结构、集群发展等研究提供了现实素材。
当前,我国数字经济整体战略中面临数据要素供需对接不畅、流通与交易存在梗阻、应用效益无法明显体现等问题。不解决这些核心问题,就无法发挥出数据作为要素在社会生产经营活动中应有的作用。
数据的权属确立是数据资产化的前置基础, 但由于数据的非竞争性、非排他性、非稀缺性和非耗竭性等特性,使得界定数据资产的权属成为难点,也是交叉学科讨论的热点。从法律角度看,数据主要涉及人身权与财产权问题,讨论主要集中于什么样的数据要素是适宜开发利用的,如何进行数据确权及制度安排[2830]。依照传统的“所有权”,其难以对数据进行清晰的确权。也有学者提出,数字市场培育和数据要素确权是两个不同问题,数据确权可以不作为发展数据要素的前置条件,有效市场运行不一定需要严格意义上的数据确权[31]。这种提法先回避掉了数据所有权的确定,将市场运行起来作为首要目标,基于数据的事实控制开启数据流通之门[32],之后在实践发展中寻求权属的进一步界定。国家《数据二十条》提出构建一个具有中国特色的“三权分置”的产权运行机制———数据资源持有权、数据加工使用权、数据产品经营权分置。这一思路就是淡化数据所有权,凸显对数据流通、使用与价值实现的重视。从经济视角看数据产权问题,根据科斯定理,产权界定是市场资源有效配置的动力与重要前提,如针对数据采集和使用过程中可能造成的社会负外部性为出发点,设置相应产权,以此为基础达成数据交易合约,逐步形成数据要素市场。信息不对称和垄断势力都会影响数据确权效果[33]。
数据流通是实现数据价值的必要条件。无论规模和质量如何,如果数据无法在社会化大生产中广泛流通,都只能是自有资源,无法实现作为生产要素的价值。数据交易是数据流通的重要方式之一,根据2023年底全球数商大会发布的数据, 2022年,我国数据交易行业市场规模达876.8亿元,占全球总规模的13.4%。这个数量级已经非常可观,但相对于我国庞大的数据生产规模与存储规模而言,数据资源开发利用程度还比较低, 2023年全国存储数据总量中,约四成数据一年中并未再次被使用,大量数据被存储后便不再被使用。此外,除个别突出的行业企业能够对多生产要素协同、多业务场景使用、多模态数据融合利用有所实践,多数行业企业还只限于自有业务场景下的数据应用,其余大量的市场主体对数据的开发利用还处于空白状态。因此,优质的数据产品供给量远远不足。
一方面,我国还没有形成一个统一的数据要素交易市场。首先,由于缺乏统一的标准,无法实现数据资源的共享与流通。其次,数据具有外部性、异构性及价值稀疏性等特点,使得数据的权属和价值评估变得非常困难。最后,我国缺乏一个包容、谨慎的政策环境,也缺少对数据产品和交易主体的评价机制、信用流通机制等,未建立起有利于数据交易流通的市场环境。另一方面,与此相配套的数据流通和交易体系建设亦存在难点:一是难以解决合规可信问题。不同于普通物品流通,数据流通存在法律确权未解问题和流通安全风险。数据控制主体所拥有的技术优势和数据支配主导权力,使其在数据中的贡献与权益并不对等,从而“不愿意”“不放心”将所涉数据通过数据控制主体流通[34]。二是交易标准和机制难以厘清。目前最为普遍的数据交易模式包括直接交易与交易所交易,这两种模式下的交易标准与流通
机制由于基础问题未解,目前都无法确立与完善。
OECD在“走向数字化工具包”倡议的“补充说明”[35]中,声明了估算数据价值的重要性,并总结了数据估值的各种案例研究。它将内容和情境定义为数据价值的两个重要组成部分。该注释侧重于基于成本的方法,包括国民经济核算体系框架内的方法,这些方法目前正是国家统计局采用的方法。然而,基于国家层面成本的方法依赖于在微观层面拥有良好分级分类管理的数据基础。但目前来说,分级分类管理的落地实现本身就存在极大的困难和障碍。
数据的价值评估方法与技术研究主要集中于数据资产计量、价值评估及分配问题等,但这些方法离广泛落地应用实施尚远。新古典经济学方法无法有效解决数据价格问题,数据价值具有不确定性且价值密度较低,因此难以进行有效的实证研究。在此基础上,多数学者从理论层面提出不同的定价方法,如收益法、成本法等传统会计学的定价方法。也有部分学者借鉴信息商品、信息服务等无形资产定价的理论,提出如基于信息熵的估值定价方法。值得强调的是,围绕数据质量对数据价值影响的探索越来越受到重视。数据质量作为数据资产估值和定价的核心要素,其变化贯穿于数据资产的全寿命周期,并直接影响到其内在价值[36]。自此之后,在数据质量度量,数据准确性、及时性、完整性、冗余程度等多维度上进行了大量的研究,并构建了数据质量评价体系,但从理论层面提出的数据质量定价方法尚未在数据质量评价系统中得到广泛应用。一方面,数据质量的复杂体系在数据价值的实际量化过程与路径中尚不明确;另一方面,如果撇开数据所处的情境、数据所依托的业务功能与流程及数据使用方,只针对数据本身的质量进行评估,是无法准确衡量数据资源的优劣性,进而确定其价值的。目前,结合业务场景的数据质量价值评估,从数据消费者效用衡量出发的质量价值评估等还处于发展阶段。
由于顶层设计不足、数据标准不统一,各部门和各层级都不敢、不愿公开数据,“数据烟囱”、“信息孤岛”、重复冗余等已成为限制数据要素流动和数据红利释放的重要问题。首先,各省(市、区)大数据管理局的功能主要是以信息化建设为主,缺少相应的管理权限,除了“一网通办”等政府平台协调和组织建设之外,在数据汇聚、治理和协同等领域还缺乏明确的监督权限。一些地区还形成了由经济和信息化委员会、网络安全和信息化委员会办公室、大数据管理局等多个部门共同参与的 “共治”局面,使得当涉及数据要素纠纷时,监管主体难以界定。其次,由于不同数据的源平台数据格式不一致,各自制订的规范存在潜在的盲区与误解,系统规模庞大,收集、复制、存储和转换过程繁琐,导致数据信息共享不充分、质量参差不齐、范围界限不清,易造成“数据碎片”和“数据孤岛” 等问题。最后,我国尚未对数据要素价值化进行专门的立法,在数据的确权、共享和利用等方面也缺乏明晰的立法依据。随着数字经济的蓬勃发展,数据元素的全生命周期进程日趋复杂多元,亟须在相关法规、行业标准和市场规范等领域取得突破性进展。
我国数据要素产业生态体系的构建仍处于初级阶段,在产学研用结合方面,存在数据和创新链联系较为松散、数据的开放共享进程较缓慢等问题。随着数据交易中的采集、传输和汇聚等行为的日益增多,亟须建立以监管机构和社会团体为代表,相关法律法规和技术规范不断完善,并对数据元素的全生命周期进行管理的生态体系。从微观主体来看,企业的数据管理能力较薄弱,人才培育也未跟上现实的需要,尤其是缺乏对行业业务较了解且掌握相关数据核心技术的复合型人才。三、推进我国数据要素价值化进程的对策建议
作为关键性生产要素,数据对经济社会的放大、叠加和倍增作用日益凸显。国家已对此作出相应规划,领军企业也进行了前沿探索,需要多方共同努力,应围绕数据要素价值化存在的难点,保障市场化发展、增强数据可交易性、捋顺交易逻辑、加强数据安全监管。
从国家第一份确定数据为生产要素的文件开始,就明确了要开展市场化配置体制机制。后续出台的文件,也始终强调要推动数据要素市场化发展,以此保障数据要素价值的持续释放。虽然在数据要素市场化配置的进程中,存在诸多发展难题与挑战,但市场在数据要素资源配置中发挥决定性作用的前提需要坚持一以贯之。目前国内共有超过50个数据交易场所,然而《数据二十条》明确提出要严控交易场所数量,交易场所是否会成为各地流通障碍是需要注意的问题。此外,在推进数据要素市场化进程中所遇到的问题与挑战,大多是领域发展的创新问题,政策层面应把重心置于为数据要素市场化进程营造创新驱动环境。在各类“示范性强、显示度高、带动性广的”典型应用场景及案例中,应考虑捕捉明显能够得到市场化配置认可的创新做法,从政策上研制能有效发挥其示范效应的办法与措施。或是从一些市场自发的创新应用实践中寻求突破。例如,金融领域对数据资产入表开展抵押贷款或作价入股的尝试,从数据价值化链条的后端环节推进数据利用。
一要推进数据产权制度改革,建立一个公平、开放和透明的数据交易体系,旨在构建一套科学的数据资产评估模型和体系,加快对数据资产合理价值的发掘,并通过市场这只“无形的手”来指导数据资产的定价。二要推动数据确权机制的构建,构建数据确认的基础架构,明晰数据的权利种类和权利主体。国家应组织企业、科研院所和行业组织等开展数据产权认定和价值评估的基础理论研究,建立统一的数据产权体系和数据资产评估模型。在此基础上,推动优势产业的上、下游企业进行数据开放,加强合作,建立安全、可信的产业数据空间,建立互利共赢的共享机制。三要推进以区块链为代表的数据流通,为数据的安全有序流通提供新的技术途径,加强市场监管和行业自律,以科学合理的法规体系作基础保障,使数据市场的活力得到最大程度的发挥,促进市场数据要素合理配置。
和传统生产要素相比,数据要素在可交易性问题上是相对复杂的,如果一些能够推进数据可交易性的关键基础性问题获得解决,数据流通与交易各场景下的价值化演进就能同时实现“积跬步”式的进展。一方面,对度量单位的进一步研究和确定。土地、资本、劳动力等传统生产要素都有明确的度量单位,对于数据要素而言,目前还没有统一的利于交易的度量单位。例如,梅宏院士提出构建使用DOA(Digital Object Architecture)
体系的想法,探讨将DOA作为现实物理数字对象之后,能否将其作为数字孪生的度量单元。另一方面,对数据分类分级进一步落地实施。当前在数据分类分级实践中很难见到比较好的案例, 数据资源目录不是其中的难点,难点在于分类分级数据的场景化应用。可以考虑“先静再动,先简后繁”的路径,先梳理静态主题数据库,再根据场景动态关联;先借助已有行业标准、国家标准、政策指导、分类分级工具等,实现易于完成的事项, 再根据场景化特点细化与深化。
一方面,探索以成本定价与收益定价、一次性定价与长期定价为基础的数据资源流通定价机制,营造一个利于数据要素流通的市场环境,促进数据交易市场机制的构建,并在此基础上,构建数据交易撮合、交易监管、资产定价、争议仲裁等全流程的数据要素流通平台,完善数据的市场准入和登记体系。另一方面,数据流通与交易体系涉及数据生产要素定价、管理和交易场所等重大问题。在价格方面,应该从三个层次进行:一是构建科学的评价指标体系,二是构建多层次数据交易市场,三是构建数据要素的监督和调控机制。在监管方面,要从基础制度、规则制定、数据垄断治理部门间合作与国际合作等方面来加强对数据垄断的规制。在交易场所方面,应明确数据交易平台的法律地位,构建信用等级制度,对其进行严格的风险识别。
单纯对数据资产进行价值评估,已经有许多主流方法,包括成本法、市场法、收益法、实物期权法、博弈分析法、层次分析法等。这些方法中,有的从市场供给端出发,有的从市场需求端出发,还有的从市场均衡价格的形成行为过程出发,解决数据资产的价值如何评估问题。但如果从数据交易与流通的视域下谈价值评估,出发点要偏重考虑如何构建能够帮助双方在交易前明晰数据价值与价格的机制。一方面要在先进前沿的计算技术方面下功夫。跨平台数据流通与交易的过程中, 需要平衡效用与安全,可以大力发展包括数据脱敏、联邦学习、安全多方计算、差分隐私、可信执行环境等新技术。另一方面要勇于尝试一些创新的事前评估模式。利用模式创新,尽力减小数据供需双方之间的信息不对称,形成价格共识。
为解决“不愿用”和“不敢用”问题,可培育“数据驱动”新模式和新业态。加速大数据在社会治理中的运用,支撑政府精准施策、精准治理。在供应方面,促进产学研用结合,为中小企业提供大数据服务,通过提供数据服务,培育应用生态,降低企业的数据风险。在需求方面,要举办大数据应
用示范和大数据竞赛等方式,指导企业在整个过程中加速使用数据。供求两端共同发力,协同推进数据的充分深入利用,加速数字经济的资产化。
加强数据安全技术研究,着重研究数据的安全监视、加密传输、访问控制和数据脱敏等关键技术。首先,要加大关键技术的研发力度,集中力量在核心领域技术上进行突破,强化核心技术与产品创新生态体系的构建,加快芯片、操作系统和技术软件国产化的进程。其次,要健全相关法律法规,强化对个人信息及数据跨境流动的管制,确保重要资讯基础设施与数据的安全。加强对数据安全的监管,通过平台实时监测基础设施层、数据层和应用层,实现安全防护和预警、安全监控分析、事件响应和处理。最后,选择数据资源丰富、需求迫切的区域进行试点,探索形成行之有效的经验和模式,加快推进应用进程。通过组建行业联盟和行业协会等中介组织,加强行业资料搜集、制定行业标准、推动技术成果交流,形成产业发展合力。
政府通过设立专项企业扶持基金,引导金融机构改善相关融资服务,加大对中小企业的扶持力度。企业应加强内部数据资源的整合和标准化,积极推进与传统行业的数据结合,加快建设一个集约、开放、共享的大数据平台,提升数据服务水平。另外,加大人才培育和引进力度。一方面, 人才链要围绕产业链进行布局,为产业链赋能。企业在人才培养、引进、使用、评价、激励五个方面下功夫,落实住房、户籍办理、子女入学、医疗保障等相关配套政策,吸引复合型人才入驻,并坚持人才培育和引进并重的方针,吸纳多类型人才,为产学研结合发展提供人才支持。另一方面,依托当地的科研优势,建立一支专业的数据安全保护队伍,并定期进行培训,将培育人才的实际能力和理论知识结合起来,从而提升他们的综合素质和专业能力。
(中国人民大学 信息资源管理学院,北京 100872)
出版日期:
2024-09-01 发布日期:
2024-09-10作者简介:
张妮,女,中国人民大学信息资源管理学院博士生,中国人民大学书报资料中心副编审。关注公众号
立刻获取最新消息及人工咨询