为实现城市可持续发展这一国家战略目标,智慧城市建设已成为当今城市发展不可逆转的历史潮流。智能建筑作为推动智慧城市建设的重要抓手,是建筑行业的终极发展目标。要实现建筑智能化,充分利用大数据是关键。国家“十三五”规划纲要明确指出,产业转型升级及社会治理创新,应依托大数据这一重要的基础性战略资源。由此可见,大数据对各行业发展都有举足轻重的作用。
我国每年投建大量建设项目,每个项目在全生命周期内产生的海量数据会影响建筑项目本身乃至整个建筑行业。在大数据盛行、大数据技术为各行业带来效率提升的大趋势下,其并未在建筑行业显现出优势特点,即高速性、真实性,并且保存方面漏洞百出,因数据丢失、数据被盗造成损失、引起纠纷时有发生,给工作带来了极大不便与困扰。因此,在数据引领创新、数据驱动发展的共识之下,加强对建筑行业的大数据智能化管理迫在眉睫,亟待引入新的大数据管理技术。
计算机技术被广泛应用于建筑工程设计、规划、造价、施工技术、管理及房地产开发和科研等领域,加快了建筑行业现代化进程,为行业带来了变革。虽然计算机技术的应用,简化、优化了传统建筑行业纸质数据管理方式,但仍存在大量问题。
(1)数据种类多、不易存储。在信息化时代,建筑行业的生产、设计环节均会产生大量数据,如建筑设计师使用各种大型设计软件、造价师使用计价软件、建模师利用各建模软件等都会产生大量文档图纸、模型数据、财务报表等数据文件。此外,基于建筑工程安全和质量需要[1],每年国家对建筑行业开展不同等级的项目执业资格考试,也会产生大量职业资格注册及从业人员数据。种类繁多的数据增加了储存管理难度,行业对数据智能化管理的需求不容忽视。
(2)数据安全性低。建筑业是一个融合了多个专业的行业,从业人员背景不一,故项目数据可能历经多人手、多个环节,再加上项目生命周期长,极易造成数据文件丢失或被篡改,数据储存存在安全隐患。由于项目数据量庞大,因数据安全性欠缺导致数据不完整的可能性极大,进而带来无法估计的损失。事实上,每年发生数据丢失导致损失惨重的事件时有发生。
(3)数据易盗且真实性不高。建筑行业是一个持续时间长,资源消耗高的行业[2]。在资源投入与利益分配等方面极易引起纠纷,而这些纠纷通常发生在企业之间、企业与个人之间或者个人之间。其中,因资料造假、资格伪造及版权被盗引致的纠纷案例不计其数。例如,某些建筑公司为谋利,盗用其它公司资质,接收自身能力范围之外的项目,不仅严重危害了社会安全,更是违反建筑诚信,损害了他人利益。数据的私密性及被盗难度低助长了盗窃数据、霸占他人成果的行为。因此,加强数据管理,提高数据防盗性是有效避免纠纷的重要途径。
(4)数据检索效率低。由于数据量庞大,种类繁多,储存地点不一,导致数据检索较为困难。现有的检索方式无法实现快速查询、实时查询,项目常因资料不到位而被迫延缓工期,严重阻碍了项目实施进度及建筑行业发展。因此,探索新的高效的检索方式迫在眉睫。
数字水印是一种嵌入认证信息的概念,能提供一种有效的可见或不可见的标记信息,在不影响原载体使用价值的前提下,直接嵌入数字载体(包括多媒体、文档、软件等)中或通过修改特定区域结构间接表示。通常来说,不易被探知和再次修改,但在数字载体传输前后都能有效地被生产方识别并提取,这是提高信息安全性,实现内容认证、防伪溯源、版权保护的有效办法[3]。图1为数字水印系统应用流程,系统包含两个部分,即水印嵌入及水印提取[4]。
图1 数字水印系统应用流程
数字指纹技术是指在原产品中嵌入与用户相关的信息。通过追寻该信息,产品提供者能对非法用户进行跟踪,其作为一种模式识别用户(和/或电子设备)的技术,正在以惊人的速度向前发展[5]。通常来说,发行商通过对指纹进行编码(编码算法及跟踪算法),赋予每个物体以独特的指纹编码,进而简化指纹使用过程(指纹的合谋容忍编码)。因此,数字指纹对提高数据安全性和检索效率具有重要作用。
哈夫曼编码是一种可变字长的编码,依据字符出现概率进行构造异字头平均长度最短的码字,即为最佳编码,这是因为码长决定了检索速度。因此,哈夫曼编码是提高检索效率的有力工具。
面对越发庞大、复杂的数据资料,数据管理平台是数据管理的主要阵地,高效、多能的平台对数据最大化利用具有决定性作用。国内外数据管理平台分为两类:①具备数据管理与保存功能的平台;②具备收集和管理不同数据功能的平台[6]。在信息化时代,数据管理平台的重要性日益凸显。但目前建筑行业缺乏一套完善的平台管理办法,不利于数据管理平台效用的发挥,因此建筑行业数据管理平台相关问题亟待深入研究与探索。
对于现阶段建筑行业存在的数据管理问题,需从技术层面加以解决。建筑行业数据形式多样,包括文档、图片及视频等,数字水印及数字指纹均可应用于以上各种数据形式,并且其具有的信息安全保障和防伪造功能有助于提高数据安全性。因此,可利用指纹技术提高数据查找效率,利用哈夫曼编码方法提高检索效率,进而优化平台、实现数据管理智能化。
针对现阶段大数据管理的缺陷,基于发展较为成熟的数字指纹水印技术,本文提出包括数据收集、数据保存与数据应用的全过程智能管理平台,以解决数据不易储存、安全性真实性低及检索率低等问题,进而减少建筑纠纷。
该管理平台总共分为3部分:数据提取、数据处理与信息提取(见图2)。
(1)数据提取是平台运行的基础。建筑项目相关方将数据资料上传至统一信息库,同时拷贝一份完整信息到数据备份库。
(2)数据处理由3个系统组成,包括指纹系统、水印嵌入系统及特征分析系统。在指纹系统中,对原数据或数据载体文件进行指纹提取操作,得到每项数据的唯一指纹编码并与位置索引组成数据对,以实现数据快捷获取;水印嵌入系统。将水印并嵌入数据有助于数据验证,并且能对篡改与盗取数据的非法分子进行追踪。该系统是水印提取系统的基础;在特征分析系统中,对数据进行编码,提取编码特征并分类储存,如工程项目数据库、建筑市场企业数据、职业资格注册及从业人员数据库、诚信信息数据库等,精确分类有助于数据查找。
(3)数据提取。通过指纹编码进行数据检索时,会得到相同或相似的数据资料,从中查找所需的数据资料。对数据进行验证时,将提取到的被验数据指纹与数据库指纹对比,若有偏差,则需进一步检验其真实性。同样地,可以通过水印提取系统提取被验数据的水印,通过水印鉴定、追踪溯源。
数字水印、指纹技术已较为成熟,并在公共安全视频、信息保护领域得到广泛应用,可为平台建设提供可靠的技术支撑。现从不同阶段、不同应用系统的角度论证利用该技术建设平台的可行性。
图2 基于数字指纹水印技术的建筑大数据智能化管理平台
对于建筑业的各种海量数据,虽然不同类型的资料分别储存于不同部门,但部门间相互联系、密不可分,从而建立公共数据库十分有必要。个人可通过不同渠道将资料上传到公共数据库,在上传前为资料设定密码,只有输入相应的提取码才能调用相关资料。在智能管理平台中,公共数据库是基础,为后期运用管理提供了资源与条件。由于数据量巨大,上传数据需经过优化系统处理,利用数字压缩技术进行压缩,以减少数据占用的内存并提高传输效率。现阶段存在多种压缩技术,如空格压缩、游长压缩、关键字编码及哈夫曼统计方法等,可根据不同数据类型选择最合适的压缩方法。
数据处理核心技术包括3个系统,即指纹系统、水印嵌入系统及特征分析系统。近年来,针对真伪鉴别、所有权验证及监控等,国内外对指纹水印的研究日益深入。指纹系统的核心技术是指纹提取及后期指纹检索等,在获得数据后,提取待处理数据的特征向量,并按一定规则形成简短、唯一的指纹序列(见图3)。有学者提出,可通过提取视频的抽象特征形成指纹信息[7-8],但是该方法区分性较弱,因为抽象特征与原数据只是相似关系。余旺盛等[9-10]提出提取全部特征的指纹算法,该方法虽然能保持较好的攻击高鲁棒性,但是难以检测数据微小篡改。此后,多种指纹提取方法被提出,如利用局部特征提取指纹、基于兴趣点特征提取指纹信息,以及结合空域特征和时域特征生成指纹等。
建筑行业数据的独有特征,使得特征向量提取更为容易,进而生成唯一的指纹序列。利用特征分析系统,对被提取的指纹数据进行分类储存,能极大提高准确性及效率。水印嵌入技术的关键在于算法选择,现有多种方案及算法,如基于帧内预测模式多划分的HEVC鲁棒视频水印算法[11],基于奇异值分解(SVD)的视频水印方案等[12]。合适的算法选择可以在高保真的前提下,更好地将水印信息嵌入数据中,并能在一定程度上抵御有损压缩、重编码等攻击。数字水印嵌入流程如图4所示。
图3 指纹系统应用流程
图4 水印嵌入流程
建筑工程中经常需要调用数据,而指纹检索技术可从海量数据中快速找到所需资料。国内外研究人员在该领域作了不少有益探索与研究,如Yang等[13]通过改进原有字符串匹配算法以获得更小的方差,提高了数据检索的准确度但不会增加算法复杂度;Atallah[14]提出基于向量空间模型的指纹序列对比算法,用欧式距离确定相似性。还有一些学者提出基于汉明距离的序列对比算法等。指纹提取技术在效率和准确度上普遍优于普通检索方法,从而得到广泛应用。为进一步提高检索速度,在数据被检索一段时间后,统计数据检索情况,利用哈夫曼编码对被检索率较高的数据进行重新编码,编码越短,检索时间越短。当数据真实性不确定、所属权存在争议时,水印提取系统的适用性更好,该技术已在公共安全领域得到成熟应用,将其移植于建筑行业在理论及实践上都是可行的。
如今,计算机已在各行各业普及,相关技术日益成熟,推动了建筑业创新变革。但信息流失的威胁愈加严重,建筑业需要引入新的技术管理信息数据。本文基于数字指纹、水印及哈夫曼编码等计算机技术,构建了一个智能化管理建筑业大数据的平台,对数据储存、提取、处理3个阶段进行说明,论证了大数据智能化管理平台建设可行性。建筑业大数据与计算机技术的密切结合,体现了行业交叉融合的必要性及重要性:通过吸收其它行业优点,促进建筑行业走向新的高度。如何进一步将建筑业与其它行业交叉融合,解决建筑行业面临的各种问题,是下一步研究重点。
[1] 杨波.我国建筑业执业资格胜任能力评价研究[D].西安:西安建筑科技大学,2013.
[2] 宓群.建筑工程纠纷解决模式探究[D].杭州:浙江大学,2012.
[3] CHANNAPRAGADA R S R, MANTHA A S, PRASAD M V N K. Study of contemporary digital watermarking techniques[J]. International Journal of Computer Science Issues, 2012, 9(6).
[4] 胡雪峰.对典型直方图水印算法的改进研究[D].北京:清华大学,2015.
[5] GOLD S. Understanding the digital fingerprint[J]. Network Security, 2013(12):15-18.
[6] 卫军朝,张春芳.国内外科学数据管理平台比较研究[J].图书情报知识,2017(5):97-107.
[7] HUANG Z,SHEN H T ,SHAO J ,et al. Bounded coordinate system indexing for real-time video clip search[J]. ACM Transactions on Information System, 2009,27(3):1-31.
[8] CHATZIGIORGAKI M,SKODRAS A N, Real-time key frame extraction towards video content identification[C]. 16th International Conference on Signal Processing, 2009:1-6.
[9] ESMAEILI M M,WARD R K.Robust video hashing based on temporally informative representative images[C].Proceeding of the 2010 Digest of Technical Papers International Conference on Consumer Electronics,2010:179-180.
[10] 余旺盛,田孝华,侯志强.基于区域边缘统计的图像特征描述新方法[J].计算机学报,2014,37(6):1398-1410.
[11] 蔡春亭,冯桂,王驰,等.基于帧内预测模式多划分的HEVC鲁棒视频水印算法[J].计算机应用,2017,37(6):1772-1776.
[12] MAKBOL N M, KHOO B E.A new robust and secure digital image watermarking scheme based on the integer wavelet transform and singular value decomposition[J]. Digital Signal Processing, 2014,33:134-147.
[13] YANG Y X,NIU X X, LI L X, et al. General theory of security and a study of hacker's behavior in big data era[J]. Peer-to-Peer Networking and Applications, 2016,11(1):1-10.
[14] ATALLAH M J,GRIGORESCU E,WU Y. A lower-variance randomized algorithm for approximate string matching[J]. Information Processing Letters,2013,113(18):690-692.