李雄一1,熊 励2,孙文灿2,王 锟2
(1.海通证券上海崮山路营业部,上海 2000135;2.上海大学 管理学院,上海 200444)
摘要:针对平台视角下的数据交易供需双边匹配问题,基于双边匹配理论,提出了考虑模糊语言评价信息、区间数评价信息和0-1评价信息的混合型多属性匹配决策方法并定义了属性匹配满意度函数。以供需主体最大匹配满意度为目标,构建了数据交易供需双边匹配的多目标优化模型,并设计模型求解算法,将多目标化模型转化为单目标线性规划模型进行求解,以获取匹配结果。结果表明,通过对供需双方需求信息的详细分析,双边匹配结果能在最大程度上满足双方需求,同时,优化模型具有合理性及有效性。
关键词:大数据;数据交易;双边市场;匹配方法;科技金融
数据交易是指买卖双方对原始或处理后的数据及数据服务进行互通有无的商业行为,是基于平台经济和双边市场理论的数字交易形式,是金融科技(FinTech)的重要发展方向。目前世界各国或地区都在积极发展数据交易,中国拥有庞大的数据交易市场,并明确提出要充分抓住数据大国向数据强国转变的新机遇,培育大数据交易市场,推动金融科技发展。然而在数据交易过程中,数据类型日益多元、数据体量日益增大,需求方很难在短时间内寻找到自己所需的数据。鉴于数据交易中心不活跃,甚至出现数据交易中心无数据可交易现象,数据交易已经成为金融科技领域的研究新热点[1]。
数据交易中心不同于传统意义上的商品交易中心和金融交易中心,它是借助互联网对数据本身进行有限价值交换的平台[2]。数据交易平台是数据交易活动的重要载体,具有会员注册信息审核、去身份化元数据规制、ID标识匹配等平台功能,实现商用数据衍生产品的在线连续聚合流通。数据交易系统通过交易网络获得一种具象结构,交易主体根据各自不同的信息集进行决策,其基本逻辑内核是每个交易主体都按照自己设定的收益目标以及掌握的信息选择收益最大化的交易。
国内外有关大数据交易的研究主要集中在数据交易机制[3]、数据交易发展路径[4]、数据交易产权[5]、数据交易法律问题[6]以及数据交易商业模式[7]等方面。骆品亮等[8]结合我国的B2C网络购物平台,对基于商家、消费者双边定价的必要性和策略进行了深入分析;A Arnold[9]等考虑了买卖双方的信息特征、风险估值和价格歧视等因素,建立搜索模型探索大数据买家在不完全信息市场条件下参与交易价格的制定过程;Ming、Xu和Wang[10]等设计了一个关于移动终端数据流量交易的系统框架;Getson[11]和Park[12]分析了金融市场交易中的大数据研究现状;Wang和Yang[13]研究了知识交易信息系统外包过程中的双边匹配问题,考虑了6个可供双方评价的属性,构建了多属性决策模型来获取匹配结果;陈希和樊治平[14]研究了知识交易供需双边匹配决策问题,提出用一种基于语言Choquet积分算子的多属性决策模型来获得匹配主体满意度的方法;贾璐[15]等构建了知识交易供需双边匹配决策模型,基于双方评价信息设计了知识供需双方满意度计算公式,并以满意度和平台中介利益最大化为目标,将多目标优化模型转化为单目标优化模型并进行求解。
综上所述,数据交易属于一个供需不匹配的金融科技市场。在此情况下,平台采用适宜的匹配决策方法为供需群体提供最优匹配显得尤为重要。本文针对数据交易平台上的供需双边匹配问题,考虑到带有模糊信息的多种评价指标,通过定义供需匹配满意度函数,构建平台视角下数据交易供需双边匹配的多属性多目标优化模型,具有一定创新性。通过设计模型求解方案与算例实证分析,制定实现数据交易双边匹配的决策方法,对促进金融科技发展具有重要理论价值和现实意义。
数据交易匹配是指中介平台为提高交易效率,撮合供需双方达成最优交易协议而进行的最优匹配运算后的数据需求吻合程度。大数据作为一种特殊商品,其在平台上的交易方式与传统商品有着很大差别:数据采集者替代了传统商品交易价值链上的生产者,数据价值的体现需经过一系列处理,如数据萃取、数据集成、数据加工、数据分析等。在数据交易平台上,供需双边企业各自进行会员注册,从而成为平台使用者。大数据供给方注册为会员后可以在平台上发布数据进行求购,大数据需求方注册为会员后可以在平台上发布需求进行购买,平台根据供需双方的需求进行双边匹配,将相关数据提供给合适的需求方。在数据交易过程中最重要的是获取双边群体的需求信息,中介平台的交易匹配决策往往是采用双边群体互评形式进行。在现有大数据交易平台上,数据供应方和需求方各自发布供需信息,平台根据双方信息进行双边匹配,如果发现合适的交易对象,则进行大数据交易。考虑到数据作为一种虚拟产品,具有不确定性和复杂性,本文结合以上情形,综合主体评价信息和数据属性信息,进行一对一双边匹配,数据交易双边匹配问题描述如下:
存在一个数据交易平台P及平台的双边群体S和B。S={S1,S2,S3,...,Sn}构成了平台上n个数据供给商集合,其中,Si表示第i个供给商主体,i=1,2,3,...,n;B={B1,B2,B3,...,Bm}构成了平台上m个数据需求商集合,其中,Bj表示第j个需求商主体,j=1,2,3,...,m。定义数据的属性集合为C={C1,C2,C3,...,Cl},其中,Ch为第h个数据属性,h=1,2,3,...,l。对应于属性集合C的属性权重向量为wC=(wC1,wC2,wC3,...,wCl),其中,wCh代表属性Ch的权重,0wCh
1。
在数据交易过程中,需求方根据自身情况提出数据要求信息,供给方提供数据的实际信息,平台根据供需双方需求进行双边匹配。基于数据交易的特殊性,这种平台交易必须依靠供需双方之外的第三方进行交易匹配最优化并采用交易撮合方式,以降低数据交易风险。其中,交易匹配的优化过程是交易撮合的关键所在。
定义需求方对供给方的评价指标集为R={R1,R2,R3,...,Ro},其中,Rk为第k个评价指标,k=1,2,3,...,o。对应于指标集合R的权重向量为wR=(wR1,wR2,wR3,...,wRo),其中,wRk代表Rk的权重,0≤wRk≤1,满足与此同时,数据供给方除提供数据的实际属性信息之外,还对数据需求方进行评价。定义供给方对需求方的评价指标集为Q={Q1,Q2,Q3,...,Qp},其中,Qs为第s个评价指标,s=1,2,3,...,p。对应于指标集合Q的权重向量为wQ=(wQ1,wQ2,wQ3,...,wQp),其中,wQs代表Qs的权重,0≤wQs≤1,满足
进一步定义需求方的评价矩阵为X=(Xjr)m×(l+o),其中,Xjr表示需求主体Bj关于评价指标集V中第r个属性的评价值,j=1,2,3,...,m,r=1,2,3,...,l+o;定义供给方的评价矩阵为Y=(Yit)n×(l+p),其中,Yit表示供给主体Si关于评价指标集W中第t个属性的评价值,i=1,2,3,...,n,t=1,2,3,...,l+p。数据交易平台根据双边主体的评价矩阵及属性权重进行满意度计算,并匹配最佳方案,具体如图1所示。
图1数据交易双边匹配问题描述
在数据交易双边匹配过程中,双方评价信息和数据属性信息按类型可分为数值评价信息、语言评价信息、0-1信息等。考虑到数据交易信息的模糊性和客观事物的复杂性,采用多种形式信息对评价属性进行描述,如多粒度语言评价信息、区间数评价信息、0-1评价信息等匹配决策方法。
本文基于相关文献资料对大数据特征进行分析,提炼出数据的特殊属性,然后将数据与传统商品进行对比分析,提取数据作为商品需要考虑的指标,再根据知识交易中的主体评价指标,结合数据交易特性,形成数据交易匹配决策供需双方评价指标体系,如表1所示。
表1供需双方评价指标体系
语言评价信息能较为直观地描述对事物的看法。首先从一个预先定义好的语言评价集S中选择一个元素作为语言评价值。S={S0,S1,S2,...,ST}是由奇数个元素构成的有序语言短语集合,其中,Si表示第i个语言短语,i=0,1,2,...,T,T+1表示S的粒度[16]。对语言评价信息进行量化,本文采取精度较高的七粒度语言评价集,即S={S0=AP(非常不好/非常低),S1=VP(很不好/很低),S2=P(不好/低),S3=M(一般/中等),S4=G(好/高),S5=VG(很好/很高),S6=AG(非常好/非常高)}。
在定义语言评价集的基础上,将语言评价信息转化为模糊数信息。模糊数的常见表现形式有三角模糊数和梯形模糊数。将语言评价信息转化为三角模糊数并记为其公式如下[17]:
(1)
根据量化的模糊数可以计算出数据需求主体Bj针对属性集C中属性Ch对数据供给主体Si的匹配度αjih。其中,对于效益型属性:
(2)
对于成本型属性:
(3)
对于目标型属性:
(4)
与此同时,可以计算出数据需求主体Bj针对属性集R中属性Rk对供给主体Si的匹配度αjik。其中,对于效益型属性:
(5)
对于成本型属性:
(6)
同样,可以计算出数据供给主体Si针对属性集Q中属性Qs对需求主体Bj的匹配度βijs。
区间数作为一种数值评价信息,是由精确数评价信息衍生出来的。区间数同样可以描述交易过程中供需双方评价信息的不确定性。本文将区间数的数学形式记为其中,
表示区间下限,
表示区间上限。可以计算出数据需求方Bj针对属性集C中属性Ch对数据供给方Si的匹配度αjih。其中,对于效益型属性:
(7)
对于成本型属性:
(8)
同样,可以计算出数据供给方Si针对属性集C中Ch对数据需求方Bj的匹配度βijh。
“0-1”评价信息也是由数值评价信息衍生出来的特殊评价信息形式。“0-1”通常用来描述某个属性满足或不满足情况。本文将“0-1”评价信息的数学形式记为γi,γi的取值非0即1。因此,可以计算出数据需求主体Bj针对属性集R中属性Rk对数据供给主体Si的匹配度αjik。其中,对于效益型属性:
(9)
对于成本型属性:
(10)
同样,可以计算出数据供给方Si针对属性集Q中属性Qs对数据需求方Bj的匹配度βijs。
在求得双边主体在各自属性上对对方的匹配度之后,可以计算出双边总体匹配度。数据需求主体Bj对数据供给主体Si的匹配度计算公式为:
(11)
其中,wCh表示属性集C中属性Ch的权重,wRk表示属性集R中属性Rk的权重。同样,数据供给主体Si对数据需求主体Bj的匹配度计算公式:
(12)
其中,wCh表示属性集C中属性Ch的权重,wQs表示属性集Q中属性Qs的权重。
在获得数据交易平台双边总体匹配度αji和βij后,可以构建基于数据匹配度的多目标优化模型。本文只考虑数据需求方对供给方匹配度最高和数据供给方对需求方匹配度最高两种情况,数学模型如下:
(13)
(14)
(15)
(16)
xij=0或xij=1,i=1,2,...,n;j=1,2,...,m.
(17)
该模型中,式(13)和式(14)为目标函数,分别表示尽可能使需求主体对供给主体的匹配度最高和供给主体对需求主体的匹配度最高。式(15)和式(16)为约束条件,其中,式(15)表示一个需求主体最多与一个供给主体形成匹配,式(16)表示一个供给主体最多与一个需求主体形成匹配。
式(17)中的xij为决策变量,表示当Bj和Si形成匹配时,xij=1,否则xij=0。
对于多目标优化模型的求解,传统思路是将其转化为单目标优化模型。本文采用隶属度函数思想,首先将目标函数转化为基于隶属度的函数形式[18],再采用线性加权将优化模型转化为单目标形式,进而针对单目标优化模型求解。设和
为单独考虑目标z1时得到的单目标最大值和最优解,
和
为单独考虑目标z2时得到的单目标最大值和最优解;然后,设
为单目标最优解对应的单目标z1最小值,
为单目标最优解对应的单目标z2最小值,
和
的计算公式如下:
(18)
(19)
于是,目标z1和目标z2对应的隶属度函数μz1与μz2可以定义为:
(20)
(21)
其中,0≤μz1≤1,0≤μz2≤1。设ω1和ω2分别表示优化目标z1与z2对于匹配决策的权重,0≤ω1≤1,0≤ω2≤1,且ω1+ω2=1,则多目标优化模型(15)-(19)可以转化为以下单目标优化模型:
maxz=ω1·μz1+ω2·μz2
(22)
(23)
(24)
xij=0或xij=1,i=1,2,...,n;j=1,2,...,m.
(25)
在上述优化模型中,ω1和ω2的大小反映了双方主体在匹配决策中的重要程度。若ω1>ω2,则表明平台在匹配决策中更偏向于考虑需求方的匹配吻合程度;若ω1<ω2,则表明平台更偏向于考虑供给方的匹配吻合程度。由于单目标优化模型中的目标函数和约束条件均为线性,因此采用Lingo11.0软件进行求解,以获取最优匹配方案。
某数据交易中心设计了一款数据交易产品,为金融科技需求提供服务支持。该数据交易中心为企业会员提供各种类型的数据交易服务,并根据供需方情况进行双边匹配以及撮合交易。现有9家企业(B1,B2,B3,B4,B5,B6,B7,B8,B9)就某类型数据发布购买需求,同时,对供给方资质提出相关要求,具体包含企业规模(R1)、专业技术能力(R2)、平台认证与否(R3)和提供后续服务与否(R4)4类评价指标;在该平台上有6家企业(S1,S2,S3,S4,S5,S6)可以提供该类数据,数据属性包括数据价格(C1)、数据体量(C2)、数据安全性(C3)、数据复杂性(C4)、数据可行性(C5)以及预期效益(C7)6类指标,同时,对需求方资质提出相关要求,具体包含企业规模(Q1)、专业技术能力(Q2)、平台认证与否(Q3)和企业市场信誉情况(Q4)4类评价指标。数据交易中心就供给企业提供的数据实际信息与需求商发布的数据期望信息以及双边企业的互评信息进行匹配决策,撮合双方交易。各数据需求方和数据供给方期望的数据信息与实际信息描述如表2、表3所示。
需求方和供给方除了给出数据属性的期望信息与实际信息外,还需给出对对方的评价信息,如表4、表5所示。
表2数据需求方期望的数据信息
表3数据供给方给予的数据实际信息
表4数据需求方对数据供给方的评价值
在表4中,每个需求方针对评价指标集R中的指标,分别对每个数据供给方进行评价。其中,评价值AG表示匹配最高,VG其次;AP表示匹配最低,VP其次,其余以此类推。“0-1”属性中的“0”表示该企业不具备某项条件,“1”表示该企业具备某项条件。例如数据供给企业S1具有提供后续服务的条件,数据需求企业B1对其的评价值为1,而数据供给企业S3不具备提供后续服务的条件,B1对其的评价值为0。同样,在表4中,每个数据供给方针对评价集Q中的指标对数据需求方进行评价。
考虑到不同主体对不同指标的认同度不同,本文给出9个需求主体和6个供给主体对于各自评价指标的权重值,如表6、表7所示。
从表6可以看出,不同需求方对数据的要求不同,表现为属性权重不同。有的较为关注数据价格,有的较为关注数据安全,还有的较为关注数据价值。
表5数据交易供给方对需求方的评价值
表6交易需求方对供给方数据的评价指标权重
表7交易供给方对需求方数据的评价指标权重
在表7中,对于供给方而言,除价格外,其它数据的属性权重值均为0,表明对于供给方而言,大部分数据属性为客观属性。
根据式(3)-式(12) ,可求出双边主体在指标集各属性下对对方主体的匹配度,经过标准化处理,再根据式(13)、式(14),可得到如表8和表9所示的双边总体匹配程度。
表8交易需求方对供应方的数据匹配度
得到双边总体数据的交易匹配度之后,首先求出单目标z1下的最大值和最小值分别为单目标z2下的最大值和最小值为
根据式(22)-式(24),可将优化模型的目标函数转化为如下形式:
(26)
考虑到平台决策中对匹配过程中双边群体的重要度有不同判断,故设置ω1=0.3、ω2=0.7与ω1=0.7、ω2=0.3 两种情形进行计算,它们分别表示平台在匹配决策中倾向供给方和倾向需求方,得到的双边匹配结果如表10所示。
双边匹配结果显示,当平台在匹配决策中倾向供给方时,S1和B3形成匹配,S2和B8形成匹配,S3和B9形成匹配,S4和B5形成匹配,S5和B4形成匹配,S6和B7形成匹配,B1、B2和B6没有匹配到合适的供给方。当平台在决策中倾向需求方时,S1和B2形成匹配,S2和B7形成匹配,S3和B4形成匹配,S4和B5形成匹配,S5和B8形成匹配,S6和B1形成匹配,B3、B6和B9没有匹配到合适的供给方。通过对供需双方需求信息的分析,双边匹配结果能在最大程度上满足双方需求,表明本文提出的优化模型具有合理性及有效性。
表9交易供给方对需求方的数据匹配度
表10双边匹配结果
大数据环境下的数据交易存在双边交易主体间的信息匹配困难。针对该问题,本文在双边匹配理论基础上,构建了以匹配主体满意度最大化为目标的数据交易供需匹配决策多目标优化模型,探讨了数据交易平台上数据交易供需匹配问题的解决方法。通过以模糊语言评价信息、区间数评价信息和0-1评价信息对属性进行模糊化度量并以此计算双边主体匹配满意度,再结合数据交易主体的主观性和数据交易对象的客观性,充分考虑数据交易的虚拟性和复杂性特征,对优化模型进行求解和实证算例分析,得出以下结论:
(1)大数据环境下的数据交易存在不确定性和复杂性,买卖双方交易信息不对称,需综合数据特征及属性进行双边匹配,通过将以平台为核心要素的金融交易决策方法引入数据交易领域,使双方在数据交易中具有准确的决策依据。
(2)本文基于平台视角提出的数据交易双边匹配优化模型和决策方法具有可行性、有效性。考虑到大数据环境下数据交易的虚拟性、复杂化等特征因素,构建了以双边总体满意度最大化为目标的数据交易双边匹配多目标优化模型,有助于在实际交易过程中准确匹配交易信息并作出正确决策。
(3)在数据交易过程中,最为关键的因素是双边匹配主体对彼此交易的满意度。通过构建数据交易供需匹配的多属性多目标优化模型、求解方案、算例实证分析等,实现数据交易双边匹配中金融属性和科技属性的决策方法,提升双边交易匹配的总体满意度,有效促进数据交易和金融科技发展。
参考文献:
[1] P GOMBER,JA KOCH,M SIERING.Digital finance and fintech:current research and future research directions [J].Journal of Business Economics, 2017(9):1-44.
[2] 王振营.交易经济学原理[M].北京:中国金融出版社,2016:7.
[3] 吴江.数据交易机制初探——新制度经济学的视角[J].天津商业大学学报, 2015, 35(3):3-8.
[4] 唐斯斯,刘叶婷.我国大数据交易亟待突破[J].中国发展观察,2016(13):19-21.
[5] 徐虹.市场化进程、产权配置与上市公司资产剥离业绩——基于同属管辖交易视角的研究[J].南开管理评论,2012 (3):110-121.
[6] 张敏.交易安全视域下我国大数据交易的法律监管[J].情报杂志,2017 (2):127-133.
[7] 李文莲, 夏健明.基于 “大数据” 的商业模式创新[J].中国工业经济, 2013(5):83-95.
[8] 骆品亮,傅联英.零售企业平台化转型及其双边定价策略研究[J].管理科学学报,2014 (10):1-12.
[9] MICHAEL A ARNOLD, STEVEN A LIPPMAN.Posted prices versus bargaining in markets with asymmetric information[J].Economic Inquiry ,2007,36 (3):450-457.
[10] MING Z, XU M, WANG N, et al.Tafta:a truthful auction framework for user data allowance trading in mobile networks[A].Distributed Computing Systems (ICDCS), 2015 IEEE 35th International Conference[C].IEEE, 2015:804-805.
[11] GETSON H M, VALLIE S, PETERSON A, et al.Systems and methods for allocating capital to trading strategies for big data trading in financial markets:U.S[S].2015-9-10.
[12] PARK B K, JUNG W W, JANG J.Integrated financial trading system based on distributed in-memory database[A].Proceedings of the 2014 Conference on Research in Adaptive and Convergent Systems[C].ACM, 2014:86-87.
[13] WANG J J, YANG D L.Using a hybrid multi-criteria decision aid method for information systems outsourcing [J].Computers & Operations Research, 2007, 34(12):3691-3700.
[14] 陈希, 樊治平.知识服务中基于语言关联性信息的双边匹配决策方法 [J].系统工程, 2012, 30(5):68-74.
[15] 贾璐, 樊治平, 沈凯, 等.知识服务中的供需双边匹配模型[J].东北大学学报:自然科学版, 2011, 32(2):297-301.
[16] 陈希, 樊治平, 李玉花.IT 服务供需双边匹配的模糊多目标决策方法[J].管理学报, 2011, 8(7):1097-1101.
[17] 万树平, 李登峰.具有不同类型信息的风险投资商与投资企业多指标双边匹配决策方法[J].中国管理科学, 2014, 22(2):40-47.
[18] CHEN Y W, WANG C H, LIN S J.A multi-objective geographic information system for route selection of nuclear waste transport [J].Omega, 2008, 36(3):363-372.
Li Xiongyi1, Xiong Li2, Sun Wencan2, Wang Kun2
(1.Shanghai Gushan Road Business Department, Haitong Securities,Shanghai 2000135, China; 2.School of Management, Shanghai University, Shanghai 200444, China)
Abstract:Aiming at the two-sided matching problem between suppliers and demanders in data trading under the perspective of platform is described.To solve the problem, a hybrid multiple attribute decision making method considering the fuzzy linguistic assessment information, interval number assessment information and 0-1assessment information based on two-sided matching theory is proposed and the attribute matching satisfaction function is defined.On this basis, to maximize the matching degree of satisfaction of suppliers and demanders, a multi-objective optimization model for the supply and demand matching in data trading is constructed and the model is designed by converting the multi-objective optimization model into a single-objective linear programming model with the use of algorithm.The results show that by analyzing the demand information given form suppliers and demanders in detail, two-side demand can be met in the maximum extent by the result of two-side matching , and the optimization model is feasible and available.
KeyWords:Big Data;Data Trade;Two-sided Market;Matching Method;Financial Technology
文章编号:1001-7348(2018)19-0023-08
文献标识码:A
中图分类号:F492
DOI:10.6049/kjjbydc.2017100033
作者简介:李雄一(1989-),男,湖北十堰人,海通证券上海崮山路营业部职员,研究方向为交易市场与金融科技;熊励(1966-),女,湖北武汉人,博士,上海大学管理学院教授、博士生导师,研究方向为信息管理与电子商务;孙文灿(1992-),男,湖北黄冈人,上海大学管理学院硕士研究生,研究方向为数据交易与信息系统。
基金项目:上海市软科学研究重点项目(16692103100)
收稿日期:2018-01-17
(责任编辑:胡俊健)