详情

医链一路——医疗数据资产化系统

申报人:孟令昊 申报日期:2022-03-30

基本情况

2022
医链一路——医疗数据资产化系统 学生申报
创新训练项目
管理学
管理科学与工程类
学生自主选题
一年期
医疗数据的共享、防篡改、防泄漏一直是困扰医疗行业的难题,区块链技术或许是一种改变数据利用现状的方式。 本项目基于现有的产权理论和司法实践探索数据确权方案,采用成熟的联盟链技术、面向罕见病例搭建EMR共享服务系统,在此基础上设计数据产权交易的激励机制,构建医疗数据资产化管理体系。 相比其他类似项目,本项目具有以下新特点:(1)在政府透明监管和医学伦理委员会主持下、由患者自我决策是否愿意出售个人数据换取经济收益,规避棘手的患者隐私和医学伦理问题,解决医疗数据资产来源合法性问题;(2)全国有医疗技术能力确诊和治疗罕见病的医疗机构屈指可数,这些顶尖医疗机构使得数据来源明确且数据质量可控,简化了数据采集工作,解决医疗数据资产供给侧问题;(3)罕见病例相比普通病例因其稀缺性而具有更高的医疗价值,共享罕见病例数据可以使得医疗机构更加深入了解疾病、提高医疗质量(例如更快和更早的诊断)、让卫生保健服务降本增效,惠民生、促产业,解决医疗数据资产需求侧问题。 基于本系统使医疗数据能够全流通,对于疑难杂症乃至所有病症的医治都会有巨大帮助。

1.参与老师国家社会科学基金项目“网络圈群社交行为形成机理及舆情治理机制研究”,并任本科团队负责人。

2.参与山东工商学院联合“深创学院”和“南京博雅区块链研究院”共同举办的山东工商学院“鸿鋮”区块链应用技术精英班并顺利结业。

3.参加第十二届山东省科技节获得山东省三等奖,并担任项目第一负责人。

4.第七届山东省电子与信息技术应用大赛优秀奖,项目第一负责人。

5.第七届山东工商学院“互联网+”大学生创新创业大赛金奖,优秀创意奖。

6.“挑战杯”暨山东工商学院第三届“财翼山商”创新创意大赛第二名,项目第一负责人。

7.创新创业实验室负责人,多次带领实验室成员组织参加各类科创比赛。

1宁禄乔:在科研工作方面,参与国家自然基金课题多项,主持山东省自然基金项目一项,参编教材多部,发表 CSSCICSCD 等论文十余篇。出版学术专著一部。指导学生获得全国信息技术应用水平大赛“中兴杯”安卓智能终端创意大赛全国一等奖、挑战杯山东省大学生课外学术科技作品竞赛三等奖、山东省大学生科技节电子与信息技术应用大赛一等奖等奖项,多次荣获“优秀青春成长导师”等称号。

2)姜慧:主要从事管理信息系统、数据管理、政府信息化与数字政府等方向的研究工作。主持省级软科学课题(2021RKY010131项、教育部协同育人项目(2021024280061项、校级科研教学项目多项;作为子课题负责人参与国家社会科学基金重点项目(17ATQ0061项、中央高校基本科研业务费专项资金重大培育项目(CCNU16Z020021项;参与国家社会科学基金项目(20BSH1511项、教育部人文社科项目(18YJCZH2231项、山东省自然科学基金项目2项(ZR2020MG023ZR2020MG006);出版著作4部(含参编);在《图书情报工作》、《科技管理研究》、《情报理论与实践》等权威和核心期刊上发表学术论文10余篇。上述成果对项目的全面深入研究提供了重要基础。

指导教师为选题提供思路指导,技术指导,资源支持,确保项目顺利实施。
省级

项目成员

序号 学生 所属学院 专业 年级 项目中的分工 成员类型
孟令昊 管理科学与工程学院(山东应急管理学院) 信息管理与信息系统(校企) 2019 项目负责人
王影 管理科学与工程学院(山东应急管理学院) 信息管理与信息系统 2020 数据整理,项目进度统筹规划
卢显委 管理科学与工程学院(山东应急管理学院) 信息管理与信息系统 2020 论文撰写,数据收集和整理
孔祥飞 管理科学与工程学院(山东应急管理学院) 信息管理与信息系统(校企) 2019 系统模型整体架构设计
范佳雯 管理科学与工程学院(山东应急管理学院) 工业工程 2019 项目流程优化,数据分析与计算

指导教师

序号 教师姓名 所属学院 是否企业导师 教师类型
宁禄乔 管理科学与工程学院(山东应急管理学院)
姜慧 管理科学与工程学院(山东应急管理学院)

立项依据

1.综述

大数据时代,尽管我们都从数据驱动型社会中受益,但头部企业集中大量的公共和私人组织个人和敏感信息。个人缺很少可以控制这些数据及其存储方式。近年来,个人隐私数据遭泄露或是肆意传播的新闻屡见不鲜,与医疗行业正规数据的匮乏形成鲜明对比。我们现在面对一个关键的问题:个性化和数据需求。对此,我们提出了“医疗数据资产化系统”,一个新兴的、去中心化的记录管理系统去处理电子医疗记录,搭建病人群体与医疗及科研机构之间数据的共享平台,赋予共享平台用户处置数据的权利。使用联盟链,利用其防篡改,可追溯等特性,实现医疗数据的资产化,将数据赋予资产的属性,并以此激励个人将医疗数据共享。让普通人能真正掌握自己的数据,同时可以此获利。基于本系统使医疗数据能够全流通,医院和科研机构获取样本数据更加便捷,数据更加丰富。对于疑难杂症乃至所有病症的医治都会有巨大帮助。

2.现有弊端

 2.1中心化医疗信息系统使得信息互通受阻。

社会快速发展,每日新增医疗诊断信息几何增长,但同时由于各医疗系统的独立性,不同医院甚至不同科室的医生都不能共享这些医疗信息,造成了资源浪费,同时也加重了患者的成本负担。

对于某些疑难杂症,需要很多科室的专家进行集体会诊,甚至不同医院的医生进行同步会诊。但是由于各个医疗系统相对独立,很难做到医疗诊断信息共享。另外,专家会诊时候需要共享各种资料。如果患者到不同医院门诊,需要自行携带医疗诊断信息,从医学诊断角度上说,患者看不到,也不应该看到某些太过具体的医疗诊断信息,这就需要新接手的医生重新根据目前情况做出诊断,不仅增加了误诊的概率,还造成医疗资源的浪费,同时增加了患者的时间和精力投入。对于一些需要长期性治疗的患者,医生往往需要通过患者以往的治疗过程,用药习惯,开出针对性的诊疗方案,但由于各个医疗系统的隔离,医生只能通过患者带来的病历卡或者患者描述,来局部地了解患者诊疗过程,不能对患者整个治疗过程有个较为完整地把控。对于患者来说,在治疗期间,更换医生的成本比较高,进一步加大就医难度。

目前,所有的医疗信息系统都是以医疗机构为导向来进行管理和运营的。为保护患者隐私,除患者本人要求调出并查看自己的个人信息外,原则上不允许进行医疗机构以外的信息转移和共享,这种以医疗机构为导向的患者医疗信息管理系统必然会造成医疗数据分散在不同的医院,碎片化的医疗数据降低了医疗服务的质量。另一方面,医疗研究和人工智能领域对医疗信息的需求日益增加,可以供医学研究的数据却很少,而且数据的可靠性也很难得到保证。虽然每天都有大量的医疗数据产生,但是由于数据分散在不同的医疗机构,导致实际上只有小部分数据可用。

 2.2医疗信息易泄露

根据IBM Security2020年数据泄露成本报告,2020年全球医疗数据泄露平均成本高达713万美元,这比去年增长了10%以上。而外媒Securityaffairs报道,德国漏洞分析和管理公司 Greenbone Networks 的专家发现,600个未受保护的服务器暴露于互联网,这些服务器包含大量医疗放射图像。其中,有超过7.37亿个放射图像,涉及 2000 多万人,影响到52个国家的患者。中国有14个未受保护的 PACS 服务器系统,泄露279000个数据记录。

医院就诊信息的泄露,不仅会造成患者的安全威胁、面临患者的法律诉讼、医疗机构的声誉受损,严重的话还会导致社会安全感下降。这些数据可被攻击者用于各种目的,包括发布个人姓名和图像来损害一个人的声誉;将数据与暗网其他数据连接起来,让网络钓鱼和社交工程更加有效;阅读并自动处理数据来搜索有价值的身份信息,例如社会安全号码用来盗用身份。

而这些信息泄露的根本原因还是对此信息的安置不够妥当,传统的储存方式容易出现一旦露出破绽便被不法分子“一锅端”的状况,而普通民众对此的防御意识不够,泄露的信息的情况容易发生,甚至被用于不正当用途。

 2.3医疗数据二次利用率有待提高

据有关材料显示,医院在各方面的数据二次利用率普遍偏低,各类数据资源整合、应用和关键指标分析展现为利用率相对最高的工作,利用率也不到百分之五十。在整体医疗的数据利用方面来看,三级医院对于数据二次利用工作的比例明显高于三级以下医院,而有半数以上的三级以下医院还未开展数据二次利用工作。在经济发展相对落后的地区,医疗数据的二次利用率更低。这就导致了病人在转诊时要花费更多的时间精力,医生也无法很好的将信息给利用起来,从而造成就诊过程中的资源浪费。

3.项目背景

在过去,个人的医疗记录属于医院,患者自己反而很难拿到,其他医院也无法利用这个数据进行研究,这无论对于个人还是对医学研究都不是好事。

在区块链技术兴起之后,一些统计学家和生物信息专家就在思考一件事:能否利用区块链中查看信息和验证信息分离的特点,把个人的医疗记录还给个人,然后让患者授权医生使用那些信息进行统计研究。这些医疗信息本身会加密,只有患者本人和被授权查看的医生才能打开查看,一般做研究的人看不到这些信息,但是在得到一定的使用授权后,可以通过提问的方式从个人的医疗记录中获得答案。根据斯坦福大学统计系和医学院教授王永雄院士Wing Hung Wong介绍,美国大部分医生愿意花钱查询他们之前接触不到的病例记录,每一次查询可以支10-15美元。如果这件事能够做成,据估计,那些患有疑难杂症的病人一年可以收1-2万美元的信息授权费用。这些钱可以帮助他们支付医药费以及部分医疗保险的费用。更重要的是,当那些疑难杂症患者的病例记录被大量医生查看后,有可能为他们找到医治的方法。据约翰霍普金斯大学生物医学工程系前系主任迈克尔·米勒教授Michael Miller也曾经说过,在美国,一些疑难杂症可能5年前在某家医院就有了有效医治的方法,但是其他医生却不知道,于是在遇到类似的病人之后束手无策。这是因为信息流通不畅,而医疗数据又涉及到人最隐私的信息,更加难以共享。如果能够通过区块链技术解决医疗信息的查询和验证问题,对于疑难病症乃至所有病症的医治都会有巨大的帮助。对于大部分的普通人来讲,他们的数据未必那么特殊,价值未必那么高,但仍然是有价值的,并且能够为自己带来利益。比如在进行更一般的大范围医学统计研究时,就会需要那些普通病患的信息数据。

新的商业模式在制约大公司使用数据的权力,同时将数据所有权交还给个人后,数据其实可以造福更多的人、更多的企业,只不过我们需要改变一下利用数据盈利的商业模式,通过区块链技术,将人们关系最密切但同时又往往忽视的数据,转化为看得见摸得着的利益。患者可以自主选择是否将自身的医疗数据上链共享,医疗数据需求方则可以购买数据的查阅和使用权利,以此方式能够获得相比于传统方式更加全面更加真实的数据,更有利于产出更加严谨科学的研究结果。

在基于区块链技术的电子病历系统中,各个医院的患者病历信息都存储在区块链病历系统中。患者通过自身的私钥对其病历数据进行加密,在患者进行授权的情况下,医院才有权对患者的病历信息进行修改、增加等操作,保证了患者数据信息的私密性。医院对数据信息的访问通过统一的客户端进行,实现了数据共享。由于区块链中采用了工作量机制或PBFT算法,其内部数据极难被篡改,有效地保证了患者病历信息的安全。患者还可以对其自身持有的私钥进行交易,这就将传统的电子病历信息转化为新型数字资产。

1.区块链技术概述

区块链是用分布式数据库识别、传播和记载信息的智能化对等网络。其分布式、对等节点的构造决定了其具有去中心化的特点。没有一个节点可以垄断网络中的大部分信息,分布式网络中的各个节点都可以获取网络中的全量数据。其智能化体现在能运行在网络各个节点中的智能合约,这些智能合约不受人为因素的控制,只执行既定的程序流程,这种智能合约的存在是区块链技术具有去信任特点的一个主要原因。而如工作量机制、PBFT算法等共识算法则是区块链网络数据安全的保证。区块链技术中使用到的密码学相关技术则保证了用户信息的私密性。区块链这种独特的数据存储机制还带来了数据的高可追溯性的优势。

区块链是一种分布式、去中心化的数据库,其中存储的是在参与者间共享的交易记录。它基于密码学原理而不是信任,它允许任何两个有交易意愿的部分进行直接交易而不必通过可信任的第三方。医疗健康领域对敏感数据的保护要求是非常严格的,区块链技术中隐私保护特性非常契合这一特点。而且由于区块链具有数据公开全网共享的特点,其可以用来解决当前医疗系统数据共享困难的问题。



1 典型的区块链结构

2 对于医疗数据储存的区块链结构


区块链的时间戳、Hash加密、用户的公私钥对、链式存储结构等技术和特点为数字资源的确权提供了基础。用户将要登记的数据用Hash加密算法进行加密,与其他操作数据打包,同时加上时间戳等信息形成区块数据。区块中数字资源登记操作有完整的记录时间,并用用户的私钥对数据进行签名。用户的私钥确认了用户的身份,时间戳记录了数字资源上链或在链上产生的时间,由此实现了数字资源在区块链的登记确权。若区块链的某一区块确权登记信息的被篡改,则该登记信息的Hash值就会发生改变,进而影响到当前区块的根Hash值。由区块的存储结构可知,当一个区块Hash值被篡改,所有的区块的Hash值都会随之改变,这样做的工作量巨大且不易实现,从而使区块链拥有了其不可篡改的特性,为数字资源的交易与侵权维权提供了保障。

2.用户数据存储方式与功能

由于大量的数字资源存在着较大的容量,若将这些数字资源全部通过区块链来存储传输,将会影响区块链的性能。本方案采取元数据+云存储的方案来解决上述问题,即将数字资源的元数据的Hash值存储在链上,而将数字资源的具体内容通过链下云存储的方式进行存储。链上用户通过元数据了解数字资源的基本信息,通过元数据相关的云存储来获取数字资源的具体内容。数字资源的基本存储方式如图所示。


3 数字资源存储与利用方式


元数据主要是描述数据属性的信息,用来支持如指示存储位置、历史数据、资源查找、文件记录等功能。本文的数字资源元数据主要是通过在区块链上描述数据属性,让其他用户知悉相应的数字资源信息。参考都柏林描述性元数据核心元素集以及借鉴PREMIS保存性元数据设计思路,设计数字资源链上的元数据信息如下表所示

数字资源元数据

元数据项

备注

元数据项

备注

Identifier

资源的唯一标识

Creator

创建资源内容的主要责任者

Type

资源所属的类别

Source

资源的来源

Title

资源的名称

Subject

资源内容的主题描述

Language

描述资源知识内容的语种

Storage

资源的存储位置

Description

资源内容的描述

Format

资源的物理或数字表现 

Contributor

资源的其他贡献者

Coverage

资源应用的范围

Rights

资源的版权所有者

Price

资源转让的价格

Date

资源产生时间

Relation

与其他资源的索引关系

Publisher

资源可能出版的实体名称

 


4 医疗数据块存储内容



基于本系统功能需求,医疗数据块于链代码中储存方式如以下表。


链代码中患者病历模型设计

字段名称

数据类型

说明

Create Time

int64

患者病历创建时间

IdCardNumber

string

患者身份证号

PatientName

string

患者姓名

Birthday

string

出生日期

Gender

string

性别m为男性, f为女性

Nation

string

民族

HomeAddress

string

家庭住址

AllowQuery

int

是否有权限查询,0:不允许查询, 1:允许查询

AllowAppend

int

是否允许添加新病历,0:不允许添加,1:允许添加

MedicalContents

数组

患者的全部电子病历集合

3 链代码中患者主诉等信息信息模型设计

字段名称

数据类型

说明

IdNumber

int

患者该条病历的id

AllowModify

int

是否能够修改病历

MedicalCreateTime

int64

该条病历的创建时间

MedicalType

int64

患者疾病类型

MainSymptoms

string

患者主诉

DetailSymptoms

DetailSymptoms’Content

患者症状详细信息

DiseasesOnceSuffered

string

患者曾患病

SystemReview

string

系统回顾

PatientPersonalDescription

PatientPersonalDescription’Content

患者个人史

 

4 患者症状详细信息模型

字段名称

数据类型

说明

OnsetTimeAndPossiblePathogeny

string

发病时间和可能的病因

MainSymptomsElaborateDescription

string

主要症状的详细描述

SimultaneousPhenomenon

string

伴随症状

OtherDiseases

string

患者患有的其他疾病

GeneralConditions

string

发病以来的一般情况

 

5 患者个人史信息模型

字段名称

数据类型

说明

RecentAreaAndDate

string

患者最近去过的地点以及时间

HabitsAndCustoms

string

患者起居习惯卫生习惯、饮食规律

Occupation

string

患者的职业和工作环境

VisitProstitutes

string

患者有无冶游史,以及发生时间

GrowthAndDevelopmentHistory

string

患者生长发育史

MaritalStatus

string

患者婚姻情况

Menstruation

string

女性患者月经情况

ReproductionCondition

string

患者生殖健康情况

3.区块链确权与交易方案实施框架

区块链确权,其本质是所有者存储到区块链数字资源的或者在区块链中新产生的资源借助加密及时间戳技术,确认并记录资源的最先拥有者。由于区块链具有去中心化、分布式、不可篡改等特性,并且可以记录所有用户的所有操作,因此在区块链上数字资源任一时刻的所有权归属是明晰的,且侵权的维权相对更容易。


5  数字资源确权与交易方案实施框架


 3.1数据层

主要是形成数字资源的区块数据,由于区块链的高冗余特性,使得链上无法存储过大的数据,根据前述存储方案,采取链上链下相结合的方式,链上存储数字资源的元数据,链下通过云存储方式存储数字资源的 完整内容。

 3.2网络层

区块链本质上是一个 P2P 网络,每当一个节点创造出新的区块后,它需要以广播的形式通知其他节点, 其他节点收到信息后对该区块进行验证,然后在该区块的基础上去创建新的区块。 网络层使用的机制包括传播机制、数据验证机制等。

 3.3共识层

共识层的功能是让高度分散的节点在P2P网络中,针对区块数据的有效性达成共识,决定了谁可以将新的区块添加到主链中。

 3.4激励层

角色在区块链履行职责时均要质押一定量的 DOTs,以防止一些恶意行为,若行为被证实是合理有效的,各角色根据自己的贡献可得相应的奖励,这些方式体现了该方案的激励机制。

 3.5合约层

数据确权阶段有身份验证规则和资源查重规则,按照这两项规则完成对原创人的身份验证以及计算数字资源相似度的任务,审核通过后,将数字资源的元数据上链。

 3.6核心应用层主要功能

实现数字资源的确权与交易的界面操作及相应的功能。数字资源产权所有人在确权操作时,先进行身份验证,通过后,对数字资源进行原创性检查。若要确权的数字资源的元数据与已有资源的相似度小于一个已设定的阈值,则认为其原创性较高,将数字资源元数据存储到资源所有权登记库中,完成确权操作,否则回滚相关操作。若用户要购买相关数字资源,则先查询资源所有权登记库,然后进行支付购买,资源所有者按照约定分成的比例获得相应的收益,之后区块链完成所有权变更。上述的交易过程通过智能合约自动完成,即资源所有者在同意用户购买资源后,便触发了智能合约,自动执行交易流程。数据资源的确权与交易流程如图所示。


6  数字资源确权与交易流程

基于区块链技术的数据资产交易的参与者:

①数据资产的供给方

数据资产的供给方是指数据的持有者或者数据的所属人员在数据资产化系统中,可以将自身持有的数据资产卖给数据的需要者,实现数据资产的变卖,如患者或患者家属。

②数据资产的需求方

数据资产的需求方是指数据的获取方,用资产去购买有价值并且可利用的数据,进而获取更多的利益,满足自身的需求,如医生,医疗研究机构等。

③数据资产交易机构

数据资产交易机构是指数据资产化交易平台的运行和管理者,连接并沟通供求双方,为供求双方提供一个渠道,为双方提供高效、稳定、安全、公正合理的交易媒介,即本项目落实结果。

 

4.基于区块链技术的数据资产交易管理体系

4.1参与者引入

数据资产交易双方均需通过唯一的身份代码注册平台账号,经平台初步审核身份信息通过后,取得数据交易权限。

4.2数据资产交易的公共区、个体区

数据交易的参与者进入交易管理平台后,供给方将所持有的原始数据加密并建立目录索引。加密的数掘存放在供给方个体区,原始数据的索引在生成后,共享在公共区,索引包括原始数据的提供机构、价格以及详细描述等信息,方便需求方选择购买,但不包含具体的数据,并且索引不得被篡改。

4.3数据资产所有权的确认

基于区块链技术的数据资产交易管理体系应当依法保护数据供给方的权益,通过区块链技术,对数据进行确权和溯湖源。当交易发生,被交易的数据资产需要被标记原始所有权声明,也就是说,通过对交易的数据资产加上唯一不可变的数字签名标签,以确定最初所有者,当数据被他方使用或二次交易,其增值仍然可为初始供给者所分享。如此,便解决了传统模式下数据资产初始所有者在数据沉淀后难以判定的问题困境。

4.4数据资产交易的查询、申请

只有对所有权确认的数挥,才能允许数据提供者向平台申请其所有数据资产的交易要求,并将数据摘要信息公示在平台公共区。数据的需求方可以通过数据筛选查词,选择自身所需数据,通过数据资产交易管理平台向供给方提出交易申请,查询数据地址。

4.5数据资产交易的确认

快求双方达成交易协议后,数据需求方需要首先访问通过数据资产查询获取的数据资产地址并进行身份确认,其次,数据供给方包含公开密钥、机密密钥以及主体ID值等的信息包需要对不同的数据发送。信息购买者需要提取相关数据信息。通过私钥、公钥签名,将数据加密和保存,数据需求方在获取数据信息后,应核实来源,然后,对数据包进行解码处理,提取数据。

4.6数据资产交易的监管。

救据资产供应方在区块链交易平台进行数据资产的发布,并创建智能合约,通过求购方触发智能合约购买支付完成交易。在数据资产交易过程中,数据资产信息上的链、数据资产交易用户上的链、数据资产交易信息上的链、分布式存储,实时同步到各个端点,实现了可监管性,减少了数据交易的欺诈可能性,保障各节点利益与维护数据资产质量。

5.数据资产交易管理运行保障暨加密机制

5.1数据造假防控机制。

一般而言,根据技术手段和途径的差异,造假数据的控制主要包括三种方式:资格确定机制、监督机制、投诉和惩罚机制。参与者进入平台首先需要面临的是资格认证,该机制主要解决参与者的资质认定一级生成公钥私钥问题,通过对新申请的参与者的合法性、真实性、实名认证信息的审核,并生成与之对应的公钥私钥,达到设置进入壁垒,提升参与者的总体质量,优化数据资产的质显,将造假数据拦截在进入前;监管机制旨在保障交易过程中供求双方的基本权益,主要通过不定期抽查参与方的数据真实性、质量,及时核实参与方的评价、反馈投诉意见、及时甄别造假数据;投诉机制则用于解决数据交易后双方的争议问题,主要包括提出投诉申请、确认投诉以及核查投诉真实性,在交易后筛选可能的造假数据并甄别;处罚机制的主要目标是对造假数据及其所有者进行强制退出,保障参与方的合理、台法权益。基于投诉与监督机制,通过收集造假数据资产的信息以及与之相对应的造假数据资产供给者,根据其后果的严重性与影响的恶性程度,对伪道者进行相应的信用拉分,最大限度降低参与数据资产交易的概率。对于信用低于一定水平的参加者,可以取消其交易资格。

5.2数据安保机制。

基于区块链技术的数据安保机制,相关方只有在获得——对应的密钥的情况下才能查看加密并储存在参与方个体区的数据资产,而且在完成核项数据资产交易后,需求方的权限也仅限于对部分数据进行浏览,无权查看全部数据。与此同时,数据安保机制还设置防范数据的泄露,除数据供给方外不允钟任何个体对对数据进行备份和复制等操作。实现系统安全和应用级安全的数据信息安全管理机构不仅要有效保障原始数据的安全,还必须切实保护原始数据资产所有者的合法权益。遵循数据资产的全生命周期原则,做到为数据资产内容安全有效护航。

5.3双向匿名机制。

基于区块链的数据资产公开的考虑是,交易系统采用的双向匿名机构是基于块链上的共同记录而设计的。通过双向匿名机制这一设计实现了视底的对交易对象与买家的隐私保护,第三方无法查间数据资产的所有者交易了何数据以及谁是数据资产的购买者。虽然交易记录的信息构成包含了主体标志信息、主体内容描述信息、交易数据哈希信息以及交易双发公钥信息,但通过有效的匿名化处理之后,可以进一步实现防止第三方通过交易记录逆向推出所交易购买数据的目的和用途。

5.4去中心化机制。

基于区块链的新式数据资产交易系统采用去中心化机制可以有效杜绝数据资产交易过程中数据沉淀与数据泄露等现象的发生。采用非对称加密技术,点对点的数据传输,使得保存的数摆索引仅包含了私钥签名、数据价格、公钥数据、哈希值与主体数据明细等信息,而交易数据本身并不直接被公共接触和获取。通过引入的椭圆曲线公钥密码算法只提供了数据资产交易通道,而公共区也仅保存经过加密后的数据索引,从而彻底保证了交易的数据资产信息安全性,促进交易点信息传输的实现,有效防止大量的数据沉淀,同时还能够提供交易渠道、查询和结算服务。

由于区块链防篡改的特点,保证了基于区块链的医疗系统中数据的安全性。其次,其分布式和去中心化的特点,所以使基于区块链的医疗系统具有良好的共享性。但是因其透明性的原因,导致区块链系统中的数据在所有节点间公开,隐私性不能得到保障。

针对以上问题,本文提出了一种基于属性加密的医疗区块链共享模型,结合该模型本章节提出了一种适用于区块链的高效、属性可撤销的案,以解决区块链医疗数据隐私性的问题。此方案在大属性域下构造,同时支持属性的撤销、多属性授权机构和可验证的外包解密,这些特点使本方案在实际应用中更加灵活

系统建立阶段:该阶段主要包含全局初始化算法、授权机构初始化算法。全局初始化算法(GloableSetup(λ)→GP):随机输入一个参数λ,输出GP作为系统全局变量。授权机构初始化算法(AASetup(GP,θ)→(PKθ,SKθ)):每个属性授权机构θ输入全局变量GP,以属性授权机构的公钥和私钥(PKθ,SKθ)作为输出。

密钥生成阶段:该阶段主要包含用户密钥生成算法、转换密钥生成算法。用户密钥生成算法(UserKeyGen(GP,id)→(Upkid,Rkid)):用户id以全局变量为输入,输出当前用户的公钥Upkid以及恢复密钥Rkid。转换密钥生成算法(TkGen(GP,{SKθ},id,Upkid,S)→Tkid,s):授权机构输入GPSKθidUpkid、以及用户的属性S,输出针对用户id的转换密钥Tkid,s,并将Tkid,s发送给解密代理服务器。

加密阶段:该阶段只有一个加密算法。加密转换算法(Encrypt(GP,{PKθ},M,(A,ρ))→(CT,TagCT)):输入全局变量GP,授权机构公钥{PKθ},明文消息M,以及访问策略(A,ρ);输出密文消息CT和对应的密文标签TagCT。加密函数由用户运行,并将密文消息和密文标签{CT,TagCT}上传到区块链系统。

解密阶段:该阶段主要包含转换算法、用户解密算法以及属性撤销算法。

转换算法(Transform(Tkid,s,GP,Upkid,CT)→CTid):转换算法由解密代理服务器执行,以用户对应的转换密钥Tkid,s,全局变量GP,用户的公钥Upkid以及访问策略(A,ρ)对应的密文CT为输入。如果解密用户的属性S符合预先设置的访问策略(A,ρ)的属性要求,则代理服务器进行部分解密,然后将部分解密的密文CTid发送给用户id,由用户进行最终解密;如果解密的用户属性不满足访问策略则输出解密失败。

用户解密算法(Decrypt(CTid,TagCT,Rkid)→M):该算法由数据使用者执行,以部分解密密文CTid,密文标签TagCT和恢复密钥Rkid为输入;用户首先检查密文与解密标签是否一致,如果一致则继续解密得到明文消息M,如果不一致则输出错误。

属性撤销算法(AttributeRev(xid,vid,S')→Tkid,s):输入用户参数xid、当前密钥版本号vid和需要更新的用户属性集S';输出更新后的转换密钥和恢复密钥。


7 加密算法流程图

6.预期实现效果

         6.1医疗数据获取:

患者到医疗机构就诊后生成相应的医疗数据,患者获取到医疗数据后,首先,患者预先设置访问策略,然后根据访问策略对医疗数据进行属性加密并生成医疗数据的摘要信息,即医疗数据的哈希值、索引等,最后将加密后的医疗数据存储到医疗机构的本地数据库,并返回摘要数据信息。

         6.2摘要数据发布到区块链:

患者收到摘要数据后,将摘要数据发布到区块链系统,区块链将收集的信息添加到新的块。区块链通过智能合约设置密文的访问权限实现发布流程

         6.3数据请求:

当用户需要查询相关数据时,数据使用者向区块链服务提供者发送数据查询请求,区块链服务提供者根据数据使用者提供的关键字在区块链中检索出相应数据,随后查看该数据请求者是否满足相关数据的访问策略要求,如果满足则将相关数据的摘要信息发送给数据使用者,如不满足,则返回错误。

         6.4医疗数据的密文获取:

患者得到医疗数据的索引信息后,根据索引信息可以获取完整数据的实际存储地址,根据地址便可以得到加密后的完整数据,并且还能够根据医疗数据的哈希值验证医疗数据的密文是否完整或者被篡改。

         6.5代理解密:

数据请求方获取到医疗数据的密文信息后,将密文信息发送给解密代理解密服务器,由解密代理服务器执行转换函数进行中间解密,解密完成后,代理服务器将中间解密后的转换密文发送给数据请求方,最后由数据请求方进行最终解密。

         6.6用户解密:

数据请求方收到中间密文后,对中间密文进行最终解密,获取明文数据。


8 预期模型

1.当前国内外同类课题研究水平概述

区块链技术发展经历了以比特币为代表虚拟货币的底层技术、在金融行业被广泛应用和不再局限于金融领域,可以为各行各业提供解决方案,包括促进医疗等领域的大规模协作三个阶段。

国外:

美国公布的十五大区块链论文中提到区块链技术解决方案可支持许多现有的医疗保健业务流程,为信息交流、病人跟踪、身份保证和验证,改善数据的完整性,并能够实现大规模的互操作性。关于在理赔过程中的改善,其论文提出:智能合约、区块链和其他技术可被组合成一个平台,急剧改进理赔过程,并改善所有利益相关者的医疗体验。苏格兰、美国、英国国调查人员联合发布的医学领域调研报告显示仅2018月医疗领域就有40份与区块链相关的研究报告。此外区块链解决方案在医疗健康领域有数据管理、欺诈监测、公众健康监察并通过不同设备实现医疗物联网等多方面应用。

2016美国公共卫生服务部向医疗卫生行业征集区块链技术应用研究报告,象征着美国卫生部门在区块链领域启动研究应用工作要求报告基于支撑虚拟货币的底层区块链技术,研究区块链技术满足医疗卫生行业应用需求的可行性并提出合理建议。

20171美国食品药品监督管理局与沃森健康部门签署协议,主要内容是通过研究、开发和测试,在包括临床试验、医疗记录、基因组数据、来自移动可穿戴设备以及物联网的健康数据等公共卫生领域,探索区块链技术应用。同年FDA与IBM签署了一项研究计划,旨在通过区块链实现医疗健康数据的安全高效共享,进而打造一个去中心化并且可扩展的数据共享生态系统。

20175萨里大学进行了基于证据的医疗再分配合作模式的研究课题,该项目基于区块链和深度学习等技术,整合可穿戴设备收集到的数据,为医疗健康数据提供安全可靠的存储和传播方式,是区块链在个性化医疗护理活动中的应用体现。英国区块链企业家曾创立利用区块链技术实现医疗数据的存储与发送的平台,患者通过平台可以接触到世界各地的医生,保险公司和药店可以获取更为准确的信息进而为消费者提供更及时的服务。

2018年美国5家规模最大的医疗卫生企业利用区块链系统收集与医疗服务提供者相关的统计数据。参与这项研究的还包括1个国家医疗测试实验室、医疗索赔处理机构以及两家保险公司。这标志着美国保险业在全行业层面推动共享医疗卫生数据。区块链技术在英国卫生医疗领域也被逐渐关注和研究。同年3月,Azaria等提出了MedRec方案,该方案利用区块链的特性以及POS共识机制进行身份管理和验证,确保了共享医疗数据的机密性。MedRec能合约结构可作为“医疗目标和资源定位”的一个模型,使用公钥加密,并启用了来源和数据完整性的关键属性。9月,库马尔在2018 IEEE 20 电子健康网络、应用和服务国际会议 (Healthcom) 提出《医疗保健中的区块链利用:关键要求和挑战》,将区块链的特性应用于医疗保健领域,并对此提出要求,说明其具有巨大的挑战性。

20194月,亚美尼亚政府与Whise - Embleema签署了通过区块链实现数字医疗现代化的战略伙伴关系。

2020年,LI.J等人设计新的基于区块链的电子医疗纪录共享系统,解决了相互信任问题和电子医疗记录存储/共享安全问题。

20214月,Ejaz Muneeb等人发表文献《可信赖的低延迟数字医疗应用的区块链-边缘框架》在其中提出了利用整合边缘计算和区块链技术来为家中老年人提供方便、可靠和远程监测与援助,是根据区块链在去中心化、可追溯性、透明度和不变性方面提供许多关键特征,使所涉及的网络实体/医疗保健利益相关者所需的可信计算环境能够在它们之间安全地共享信息和资源的应用。

202231日, Johari Rahul等人对于专业的黑客和破解者对电子记录的频繁攻击问题,引出医院管理系统中患者电子病历( EMR )的安全至关重要,对此,他们从零开始开发了一个名为MedichainBlockChain框架,该框架包含了一个BlockChain的所有基本功能,以保障患者的数据安全。

2022322日,Lee Sejong等人发表《基于区块链的患者信息交换系统中的隐私保护:系统设计研究》

 

国内:

国内中投顾问在其发布的2016-2020区块链技术深度调研及投资前景预测报告》中将区块链技术在医疗领域的应用分为以下几个方面:电子健康病历、DNA钱包”、药品防伪、蛋白质折2017年8月阿里健康宣布与常州市合作“医联体+区块链”试点项目,将区块链技术应用于常州市医联体技术架构中,这是国内首个基于医疗场景实施的区块链解决方案。目前当地部分医疗机构之间可以实现安全可靠的数据交互,以低成本、高安全的区块链技术解决长期困扰医疗机构的信息孤岛和安全问题,据悉该技术首先在常州武进医院和郑陆镇卫生院落地,后续将逐步推进到常州天宁区医联体内所有三级医院和基层医院,形成快速部署的信息网络。

20199,复旦大学附属华山医院携手蚂蚁金服,推出全国首个区块链电子处方。这个技术能解决医院里处方精准无误且不可篡改、复诊患者拿着处方在不遵医嘱在外面重复开药风险等多个问题。患者只需要点开小程序,在小程序上进行操作,就能做到线上看病,医生远程开好处方药,患者在家坐等送药上门。

2019年,上海仁济医院通过区块链初步实现异地电子病历共享,上海市人民医院与安徽省立医院共建区块链电子病历等。可以说,基于区块链的电子病历研究和应用创新非常活跃。

2020年,国家发改委把区块链技术明确为新型基础设施。在国家大力推动区块链基础技术研发、完善区块链生态链建设的重要时期,医疗行业应抓住区块链发展的机遇,加强医疗行业区块链技术的自主研发与创新,深度开发区块链技术的应用潜力,真正实现信息新技术为医疗行业发展保驾护航。同时,它以新发展理念为引领,以技术创新为驱动,以信息网络为基础,面向高质量发展需要,提供数字转型、智能升级、融合创新等服务的基础设施体系,为数据资产管理方面的研究提供了更具深远意义的新背景。

2021年,周正强等人将智能合约和密文策略属性加密技术相结合,实现具有时间维度的细粒度访问控制,进一步确保了医疗数据在共享时的安全。

2022年1月,国务院印发《“十四五”数字经济发展规划》,对数据要素作出专章部署,提出强化高质量数据要素供给、加快数据要素市场化流通、创新数据要素开发利用机制等重点任务举措,对于加快形成数据要素市场体系、促进数字经济高质量发展具有重要意义。

区块链技术也被探索应用于解决跨境贸易中的信任问题。20209月举行的首届“外滩大会”上,蚂蚁集团发布了基于蚂蚁链的跨境贸易和金融服务平台Trusple,拟以区块链技术解决中小企业跨境贸易信任问题。法国巴黎银行、花旗银行、星展银行、德意志银行、渣打银行成为Trusple批五家合作伙伴。

国内学者近年来也做了多方面的研究和尝试,曹辉通过改进共识机制的算法和底DMB型,采用私有链和行业联盟链相结合的方式,初步实现了对脑卒中电子病历数据的安全存储,为医疗区块链更广泛的应用提供了实践经验。李晓璐创新性地提出一种无证书可截取签名方(CL-CES),实现了对电子病历中敏感数据的截取功能,可以满足电子病历对于不可伪造性和保密性的安全需求。王旭通过对医疗数据进行结构化和标准化的预处理,构建医疗数据的关键字索引结构,对医疗数据和索引均进行加密。通过区块链网络共享密文,实现对医疗数据的安全访问,从应用层和交易层分别进行了隐私保护机制的研究与实现。

日期

官方机构

文件

区块链相关内容

20201012

国家卫健委

《关于加强全民健康信息标准化体系建设的意见》

提出“探索研究区块链在医疗健康领域应用场务标准,加强规范引导区块链技术与医疗健康行业的融合应用

2020922

国家医疗保障局

《对十三届全国人大三次会议第7927号建议的答复》

提出国家医保局将依托全国一体化在线政务服务平台,积极与相关部门沟通,在保障参保信息交换机制,实现医疗、医药、医保数据共亨协同,同时积极探索区块链技术在医保相关领域的应用

2020629

国家卫健委办公厅

《国家卫生健康委办公厅关于做好信息化支撑常态化疫情防控工作的通知》

提出要强化数据共享,探索构建患者主导的医疗数据共享机制,应用区块链等技术实现安全流动和授权访问

2020618

北京市政府办公厅

《北京市区块链创新发展行动计划(2020-2022)

在卫生健康上:表示将围绕数据安全、过程可靠、监管合规的医疗卫生管理体系建设需求、探索打造区块链技术应用场景;基于区块链技术数据共享、信息透明、智能可信等特点,探索其在医疗监管、疫苗管理、医疗废物管理及其他业务场景中的应用

2020618

中共中央国务院

《海南自由贸易港建设总体方案》

提出建设区域医疗中心,建设国家区块链技术和产业创新发展基地

项目

区块链特性

详情

苏州昆山市药事管理服务平台

数据共享、隐私保护

率先实现医疗机构电子处方向社会零售药店开放,实现就诊配药信息全程互享互通、全网支付.搭建起病惠、医师、药师及监管人员间的多元化购药监管平台

太一云与医天下合建的个人健康档案

数据共享

安全查看、下载、管理、传输和再利用个人健康医疗信息

区块链医美生态平台Pulcher

数据共享

致力于依托技术破局现阶段医美行业痼疾,深度整合医美及衍生产业资源构建价值互联网时代的医美产业应用体系,开辟属于医美产业的价值互联网生态位。Pulcher生态包含一条为医美行业设计的基础公链、一套分布式应用系统以及一系列支持结构:能够为医美及相关行业的各种参与者提供链上功能支持和通证经济纽带,服务于医美产业的全面升级转型

数钮科技

追踪溯源、数据共享

通过对从业者资质、病人病史、术后效果、争议仲裁等各个环节的上链,提供无法筹改的记录信息、让行业更为健康地发展。推进数据规范化、语义规范化、临床过程的标准化。这里,开源、开放共享的基础思想十分重要、是数据互联互通的底层逻辑

辉瑞等的MediLedger项目

防伪溯源、数据共享

旨在创建管理药品供应链的区块链工具,使制药商、批发商、医院等相关机构都用区块链对所有的药品相关信息进行登记,并最大程度保证其可追溯性


         2021上半年,在线医疗需求进一步释放。从实验室到临床一线,从病原检测、流行病溯源、快速筛查到疫苗研发,从在线问诊、远程医疗到互联网医院,在线医疗打破时间、空间和地域等限制,持续推动我国医疗数字化发展进程。在政策利好和市场需求的共同推动下,各医疗平台流量迅速增长,行业迎来发展新阶段。

2.产业发展趋势与前景 

政策利好和技术进步推动我国在线医疗用户规模快速增长。截至20216月,我国在线医疗用户规模2.39亿,较202012月增长2453万,占网民整体的23.7%在政策方面,在线医疗相关规定进一步落实,从互联网医院到明确常见病、慢性病患者互联网问诊可进行医保报销,从网售药品到核心诊疗再到互联网医保,各地通过出台对应方案积极支持在线医疗全面发展,筑牢了在线医疗用户规模增长基础。

电子病历成为我国医院优先级最高的应用系统。根20213月中国医院协会信息管理专业委员会发布的《中国医院信息化状况调查(2019-2020年度)》报告,有高达86.14%的医院将电子病历系统作为最重要的应用信息系统,远远高于其他任何系统,充分说明了医院已经对电子病历高度重视,并将其作为未来的重要工作。

 

 

 

医疗健康方面,医疗大数据成为 2019年大数据应用的热点方向。2018年7月颁布的《国家健康医疗大数据标准、安全和服务管理办法》为健康行业大数据服务指导了方向。电子病历、个性化诊疗、医疗知识图谱、临床决策支持系统、药品器械研发等成为行业热点。

区块链系统是一个面向大众全面开放的系统,并且是利用专业的计算机技术开发的系统,在这个系统中存储的所有数据都是开放的,面向世界上全部人员都是公开的,无论在哪个国家、哪个区域的人都可以随时根据自己的需求在公共连接上查询和用区块链系统中的所有数据。由此看来,区块链系统有着很高的透明度,我们可以充分利用区块链这一技术积极推进档案信息化的共建共享,方便患者和医院的需求,能够使区块链技术更好地服务于大众,建立公开透明的信息化数据时代。我们利用区块链技术存储的数据是不可更改和具有不可逆性。区块链技术在存储数据时是对信息、序列、时间等进行同时叠加记录,把他们在同一时间存储于不同的分中心,所有数据一旦被存储就无法更改和可逆。换言之,就要只要把数据信息放到区块链系统中,这些信息就永久有效地被存储,一般是不会被轻易修改,如果想要修改,就需要有技术人员可以将系统中超过一半以上的链节点全部进行有效地控制,但是能够做到这一点是非常困难的。由此可见,区块链将会发挥更好的信息保护作用,并且区块链的存在将使数字资产化真正具有可实施性。

新的时代,新的机遇。我们也看到,大数据与5G人工智能、区块链等新一代信息技术的融合发展日益紧密。特别是区块链技术,一方面区块链可以在一定程度上解决数据确权难、数据孤岛严重、数据垄断等“先天病”,另一方面隐私计算技术等大数据技术也反过来促进了区块链技术的完善。在新一代信息技术的共同作用下,中国的数字经济正向着更加互信、共享、均衡的方向发展,数据的“生产关系”正在进一步重塑。

在技术方面,深度学习技术作为人工智能的核心技术之一,在语音识别、视觉识别和目标检测等诸多医学研究方向都取得了较好的实践成果,我国医疗数据大且丰富多样的样本库,也为人工智能不断训练及算法打磨提供了广泛数据集;同时5G络的加速建设,将给国内医疗大数据产业链带来颠覆性变革,为在线医疗提供可持续性的保障。

1.创新点

  1.1有效将用户使用权与数据所有权分离

在数据的所有权和使用权严格分开之后,利用区块链或者其他技术,数据的所有者可以将自己的数据放在现有的大数据平台上,但是此时那些平台公司在没有得到授权时,是无法解读和使用数据的。

这些数据平台公司,可以通过免费提供存储和其他服务换取用户数据的使用权。而对于第三方公司,如果想使用数据,则要向用户付费。注意,这里只是提供了数据的使用权,不是给第三方拷贝一份数据。

为了方便理解这种新的利益分配方式,我们不妨对比一下银行的例子。

客户把1万元存入银行,银行以贷款的方式提供给第三方使用,第三方就需要向该客户支付利息(实际上客户在银行存款获得的利息就来源于此)。而银行从中间赚取一个存款利息和贷款利息的差值,作为银行替客户管理钱财的成本和自己的利润。

假如我们把数据公司A成是一个银行。用户的数据放在它的上面,它使用了该数据获得了收益,每年应该付给用户的收益是500,但由于它帮用户保管了数据,该用户需要向它付300元的服务费用,那么最后它还是需要付给用户200元,这是它使用该用户的信息所要付的授权费用。

B公司也想使用该用户的数据,可以A司接洽,由A公司来做中间人B公司同样要付给用户费用,比如每年300元,中间人A公司可能从中收取100元,于是用户得200的收益,有点像用户存在A司的数据产生的利息。当然,因为用户是数据的所有者,用户也可以选择拒绝给第三方使用。如C公司也想使用该用户存A司的数据,那么该用户又能获得每年200的收益。

这样,用户的数据的价值就可以通过价格体现出来。同时,一个人在互联网上的活动越多,积累的数据量越大,他的数据可能就越值钱,收益也越大。区块链让每个人在平等的节点上管理自己的数据与信息,而且年限越长样本越优质。而不是像今天这样,一个人买东西越多,反而越有可能受到价格歧视,譬如各种大数据杀熟,苹果手机打车费用高的事件。

  1.2赋予数据以资产的属性

作为一种由多个互不信任的节点共同维护一个全局状态的新型数据库,区块链具有数据可追溯、数据高安全性以及数据防篡改等优点,可以解决数据安全存储以及多方不互信情况下数据共享的问题,非常适用于数据资产管理。

当前区块链主要被应用于数据资产管理的数据安全共享方面。本项目提出了基于区块链技术对医疗数据资产进行确权与共享的方法。通过让平台将用户的数据真正交还给用户,赋予共享平台用户处置数据的权利,有效打破了“数据孤岛”,解决了共享数据收集和共享数据应用面临的困境,实现了共享经济有序、稳定发展,为解决共享经济领域的诸多争议提供了解决办法。针对医疗数据资产缺乏有效流通,阻碍医疗数据共享及高效使用等问题,保护数据安全,运用区块链技术推动我国医疗系统的进步等。通过将区块链技术与医疗数据结合,可有效地解决各医院医疗数据间独立不相关及“数据孤岛”的困境,帮助医疗服务平台更好地进行信息化转型。

2.项目特色

2.1 技术特色

在基于区块链的数据资产管理新模式中,不是只应用了区块链体系中的某一层或某几层,而是对区块链体系中的网络层、共识层、数据层、智能合约层以及应用层多层次进行结合,并分别对其进行优化,具体框架如下图所示。在网络层和共识层,通过节点权限分级以及自定义共识机制实现数据安全共享;在数据层,通过优化存储结构和查询方式(如建立有效索引)提高数据查询效率,通过日志数据上链保证数据可溯源,通过使用加密算法加密数据来保证隐私性;在智能合约层,通过使用智能合约程序段实现部分数据自动化管理;在应用层,通过加密交易信息提高用户敏感信息的安全性。

传统区块链的网络层和共识层的作用是保证区块链网络中各个节点通过共识算法维护完整副本的一致性,只有恶意节点的算力达到总算力的一半以上,才有可能修改存储在区块链中的数据,因此区块链具有数据安全共享的特性。在传统区块链中,网络层使用的是点对点peer to peerP2P)网络,而在数据资产管理场景中,数据资产拥有者、数据资产被分享者、区块链网络参与者以及区块链管理者在区块链网络中的权限并不相同。区块链管理者负责管理整个区块链,适合作为拥有最高权限的超级节点。而数据资产拥有者、数据资产被分享者仅对自己参与的数据资产有访问权限,可以通过信息加密对访问权限进行控制,因此数据资产拥有者和数据资产被分享者在网络层不需要享受更高的权限。而区块链网络参与者属于在区块链网络中还未进行动作的节点。因此将这3种节点作为参与区块链网络的普通节点即可。在基于区块链的数据资产管理新模式中,在设置P2P网络的同时,在网络层模仿传统数据库对节点进行权限分级,设置超级节点和普通节点两种节点类型。超级节点由官方掌控,负责对区块链网络进行管理,保证数据资产共享的安全与合法。有共享数据资产需求的用户包括数据资产拥有者、数据资产被分享者、区块链网络参与者,他们可以作为普通节点加入网络,普通节点被超级节点管理,普通节点之间是平等的。在传统区块链中,公有链一般采用基于工作量证明或股权证明的共识机制,而私有链或联盟链一般采用实用拜占庭容错practical Byzantine fault tolerancePBFT)等共识机制,其实质是保证所有节点的一致性,同时也在一定程度上避免了恶意节点对区块链网络的破坏。这些共识机制虽然保证了节点的一致性,但是很大程度上牺牲了数据上链的效率,不适用于数据资产管理的应用场景。因此,在基于区块链的数据资产管理新模式中的共识层,官方可以在创建区块链平台的初期设计自定义的共识机制,以满足数据资产管理的需求。例如,由于超级节点由区块链管理者掌握,能保证其身份的安全,因此在数据上链过程中由超级节点对上传的数据进行验证,然后将通过验证的数据打包成块,并广播通知各普通节点,各普通节点收到消息后同步至本地的数据副本。


传统区块链的智能合约层可以保证在没有人为参与的情况下进行可信操作,这些操作可追踪且不可逆转,从而保证了区块链的自动化属性。在数据资产管理新模式中,官方可以通过网络中的超级节点利用由自动化脚本代码组成的智能合约来制定共享交易规则,进行身份审查和数据校验,从而保证数据资产共享交易的合法性。而用户可以通过普通节点利用智能合约进行数据资产自动化管理,也可以利用智能合约实现与其他用户的自动化数据资产共享。在传统区块链中,智能合约部署方式被作为一种特殊的交易上链。与之类似,在基于区块链的数据资产管理新模式中,超级节点可以将其发布的智能合约打包成区块后上传至区块链上进行部署,而普通节点的合约需要经过超级节点的验证后才能上链部署。

基于区块链的数据资产管理与基于区块链的医疗数据管理以及金融数据管理不同。在医疗数据管理和金融数据管理中,部分关键数据上链即可,因此可以使用链上链下的存储结构,链上存储关键数据,链下使用数据库存储其他数据。然而,数据资产是从数据中提取出的具有价值的部分,所有数据资产都应该作为关键数据上链,为了保证链上数据查询的效率,优化存储结构和查询方式非常必要。


2.2方案特色

其一,医疗数据的管理与使用,从来不是一个单纯的技术问题,在本方案中,我们让患者自我决策是否愿意出售个人数据换取医疗资金,赋予用户在允许范围内对数据最大的处置权限,并从中规避棘手的患者隐私问题。

而对于个人隐私和医疗机构管理问题,想实现医疗数据共享存在两个主要矛盾。患者不信任本系统,对于系统是否把自身数据的内容盗用或者对于“数据本身”是否被合理上传不信任;医疗机构不信任系统,对于系统所提供的数据是否真实有效,或者来源无法明确。

对此,我们采用双信任挂钩的机制。目前来看医疗数据的主要产出地就是医疗机构,用户选择在医疗机构就医并给予个人信息查看的权利,这是用户对医疗机构的信任。其次,对于产出于本医院的数据,医院是可以且必须对数据的真实性负责,而经过医院认证的数据同样是被其他医院所认可的,这是医疗机构与医疗机构的信任。基于双方的信任,我们提出以下方案,来解决当前的难点。

首先,系统给予用户自由选择使用的权利,用户可以选择是否将数据上传,出售,数据上传的过程则由医疗机构监管,在数据被上传加密后,解密所需要的私钥则由用户自主保存,将数据的所有权利都交还给用户。其次,系统则与医疗机构签署合约,用户数据直接在医疗机构本地进行上传,上传同时对数据打上医疗机构的标记证明数据的来源及可靠性,同样的,系统提供给医疗机构数据时也只会提供经过标记认证的数据。以此来达到让用户信任系统,可以放心将自身的数据上传,让医疗机构信任系统,放心的使用系统提供的数据。

其二,调查发现,过去一年,罕见病患者治疗花费均值高达约 67000 元,罕见病的治疗确实给患者家庭带来不小经济负担。目前 95%的罕见病没有治疗方法。罕见病患者面临着确诊难、用药难、费用贵等多重困境。对罕见病患者来说,最重要的就是实现病有所医、医有所药、药有所保。例如血友病是一种罕见病,患者的血液中缺少一种凝血因子,需要经常反复注射凝血因子,才能保证其正常的凝血功能。

三保合一以后,血友病门诊患者的治疗费用大约平均能报销 70%-75%,病人自己承担 25%左右,但是在日常诊疗中发现,有些病人连这 25%也无法承担。对于血友病患者来说,一旦患病就要终生用药,医药费用毫无疑问是一笔不小的负担。血友病患者每年在医保报销后,仍需自付数万元费用,对于一些患者来说,仍然压力很大。在罕见病群体中,还有一些患者并不能和血友病患者一样享受医保报销。比如说戈谢病、庞贝病等罕见病患者,一年的治疗费用甚至超过上百万,但却还没有纳入医保。

目前针对罕见病的诊疗技术不够完善,医疗费用昂贵,以及针对罕见病的药品种类不全,药价颇高,均导致罕见病患者的生活情况十分不乐观。但反过来说,罕见病例具有资产价值高、数据用途明晰、交易机制简单等特点,采用该系统后,患者将个人患病数据授权医院和科研机构后,不但可以获取一定的授权费用用来减免医药费,从而改善罕见病患者的治疗经济压力,而且科研机构将得到更丰富、真实的研究数据,能够更加高效研究病症,提高诊疗技术,对罕见病患者的医治有巨大帮助。


1.技术路线

本系统基于中央服务器和节点服务器架构。中央服务器负责接入节点服务器,保证各个节点服务器的数据一致性,并为同步节点服务器的区块链数据提供支持服务。各个节点服务器接入中央服务器,向中央服务器发送区块链增加消息,然后由中央服务器广播到各个节点服务器,以此达到同步的目的。由于传统服务器所拥有的广播机制局限性,所有服务器都需要把消息广播到每个其他服务器,那就需要这些服务器暴露在万维网。本系统中,由于这种中央服务器统筹的特性,保证了医疗诊断过程的独立性和私密性。每个节点服务器独立维护每个医疗体系的医生和患者信息。同时也降低了组网的难度,节点服务器可根据自身情况选择性休眠,等再次上线,从中央服务器同步数据即可。节点服务器对用户提供 web 访问接口,可适配手机,电脑等多种接入设备。

本系统使用 Solidity 语言进行开发,基于多种主流框架,使用中央服务器和节点服务器架构对整个医疗区块链进行更新和维护。每个节点服务器独立接入中央服务器,由节点服务器提供用户访问 web 服务。医生使用该平台对用户进行医疗信息的查看和修改和提交,患者可查看自身医疗信息,可以通过不同节点服务器访问到整个区块链信息。医疗信息使用加密技术,使用患者名称作为秘钥,医生和患者均可查看自身医疗诊断信息。由于区块链的唯一性,使用医疗诊断账单的形式来记录医生对个特性病人的诊断情况,最后以账单形式汇总出病人医疗信息;由节点服务器保存医生信息和病人信息,节点服务器之间相互隔离,保证了多节点服务器彼此信息的保密性;医疗信息使用加密算法,密码默认使用病人信息。传统的去中心化区块链系统,所有负责用户接入的节点需要将自身更改广播出去,本方案中采用的中央服务器-节点服务器模型,大大降低了组网难度,保证了各个接入节点的独立性。

2.拟解决的问题

2.1 监管下实现共享

本项目也可以很好的解决现存的由于医疗结构相互独立,医疗信息不能很好共享的问题。每个医疗系统作为一个区块链服务中心,记录下本系统下的所有医疗诊断信息,同时记录下每次用药和当时的诊疗情况;区块链服务中心会把数据更新情况提交给中央服务器,中央服务器把数据更新消息广播到所有注册到中央服务器的节点服务器。这样不仅能保证整个系统的区块链的唯一性,还能同步所有的区块链节点服务器,保证各个节点服务器的数据一致性。针对某一项研究,提供相对应的信息。而为了确保这些信息供且仅供这一项研究所使用,设立信息的二次确认机制,由联盟链系统提供信息的合法性与真实性确定的二次验证作为唯一授权标志,区块链的好处就在于,能够在保证共识的前提下实现监管。

2.2 罕见病的诊断及治疗

疑难重症和少见病是大型综合性、专科性医院临床工作的主要任务之一。因病例相对集中,通常疑难重症和罕见病也是这类医院临床研究的重点。但同时,正是因为病例数量少,一家医院的病例数量很难满足研究需要,而常规多中心研究因成本高、组织难度大等原因很难组织实施此,将患者用户的数据上链,可以扩大医疗数据的获取面,使医院除了本地数据之外也能便捷的拿到其他地区的数据,大大解决了罕见病历数据匮乏而难以研究的窘境。

医院间数据共享,信息互联,形成研究平台。平台建成后应形成能够支持多种类型临床研究的技术平台,形成内部良性循环运行机制,支持临床研究长期稳定持续地开展。同时,注册上传的病例资料将在各种临床研究中反复使用,事先设计的临床研究方案必须适应今后开展各类临床研究的需要。

3.预期成果

区块链目前应用于医疗的案例少:

2020 年,全球区块链专利新增 1.03万件,有29个国家和地区参与了专利申请。中国和美国是专利申请数量最多的两个国家。其中,中国 2020 年新增区块链专利约 8200 件,占全球总数的 79.6%;美国新增1434件,占全球总数的13.9%

截至2020年末,全球区块链专利申请数量累计达到5.14万件,51个国家近7千家公司参与了专利申请。其中,中国累计申请区块链专利超过3万件,位居全球之首,专利申请数量占全球总规模的58%,是美国同期的2.5倍,超过4100家公司参与了专利申请。美国累计申请专利1.21万件,占全球总规模的24%,位居全球第二,累计有2088家公司参与了专利申请。在2020年,我国新增区块链专利近8200件,有1257家公司参与了专利申请。专利申请数量最多的3家公司分别是平安集团(992件)、腾讯科技(729件)和蚂蚁集团(529件)。从专利行业分布情况来看,金融、支付、商业贸易、企业服务、数字资产和交通运输是2020年关注度最高的6个行业,申请这些领域的公司数量均在100家以上。从趋势来看,金融、支付、商业贸易、数字资产、交通运输等行业关注度正常减弱,申请这些领域的公司占比相较2019年出现下滑情况。而企业服务、医疗、电力能源、政务、农业等行业关注度走强,申请这些领域的公司占比相较2019年出现增长趋势。

对于国内相近的产品大多也是刚刚起步,无论是市场占有率还是发展速度都没有太大的优势,对于我们新产品来说也处在同一起跑线。

当我们数据的价值真正得到市场认可,让我们能够从中受益的时候,它们才成为了数据资产。如果我们真的能向着把大量数据变成数据资产的方向共同努力,全社会就能够形成巨大的数据资产,或许有一天,我们每一个人的数据资产会比我们的固定资产规模更大。

而这些设想也许有人会表示怀疑,但是可以想一想,二战之后,华尔街的证券商向大众推销股票这种纸面资产时,很多人也不相信它能和看得见摸得着的固定资产相比。然而今天,美国的股市规模已经超过了房市规模,而且正在以更快的速度增长。虽然区块链技术自身还不完善,就像是一个粗陋的玩具,但不要忘了1876年电话发明时,人们是怎样评价的。在当年西联电报公司备忘录里还写着:“电话这个东西毛病太多,并不是一个值得考虑的通信方式,基本上对我们没有什么价值。”

数据并非不能成为资产,但要实现数据的资产化,就需要技术和法律共同进步,给予支持。

按照进度计划如期进行,本项目结项时至少取得如下成果:

①为医疗数据的处理与利用提供新思路。

②结合项目后期调研数据等积累结果在国内外知名期刊公开发表多篇高水平学术论文。



本项目将从系统规划、系统分析、系统设计、系统实施、系统运行和维护几个阶段着手。

20221月-3月进行项目规划。提出本项目的基本构想,对项目背景与社会现状进行调查研究,主要从医疗市场所处的环境,医疗市场中待解决问题,用户对医疗方面的需求是什么,为什么会存在这些问题,如何解决这些问题入手,进行更深层次的挖掘,明确用户的各种要求,最大限度的满足用户需求,据此对本项目进行可行性研究。

20224-6对本项目进行系统分析。上交申报书进行审批的同时,对本项目的社会状况与可行性进行更为详细的调查和分析,对技术方面进行一定程度的预测与估计,并且尝试对本项目进行逻辑设计。

20226-8月进行系统设计。通过调查回馈结果,针对所收集的用户的问题,进行归纳总结,对项目进行审计以及不断改良。根据改良后结果进行总体设计,并且在此后拟出此过程中数据资产化的一些问题,将之细化并有针对性的进行详细设计。

20228-11月针对以上确定问题进行系统实施。首先对本项目进行审查改进,确定并无太大问题。然后进行编程调试,将用户需求抽象为概念结构模型,消除部分数据冗余后,最终确定符合现实环境关系的概念结构模型。最后根据概念结构模型建立逻辑结构模型,确定各数据之间的关系,最后确定物理结构模型,确定数据的存储结构和存储方法,从而实现系统转换。

202212-20231月进行系统运行与维护。将本项目进行验收,根据项目设计文档进行原型设计,将技术有文档化转变为可操作的功能原型,确保最终达到的效果与最终系统页面保持一致。分析系统运行状况,根据原型开发搭建系统的开发框架,确保系统开发完成,确保页面的兼容性,并对系统进行维护。此后对系统进行评价,寻找可改进的点,为下一代产品迭代做准备。

20211月,项目负责人参与山东工商学院与深创学院、南京博雅联合举办的“鸿鋮”区块链应用技术精英班,次月项目正式启动。

20213月,本项目初期研究成果《联盟链医疗—基于区块链的数据资产化研究》参与财翼山商工程学院“挑战杯”,获得第二名。

20217月,项目负责人参与“鸿鋮”区块链应用技术精英班,为期一个月的线下集训,接触商业化开发实践。

202110月,项目正式更名为《医链一路——医疗数据资产化系统》并山东省科技节-山东省电子与信息大赛,获得山东省三等奖。

本次参赛团队有3名大三、2名大二成员,来自不同专业,均具备很强的专业素养,多人多次获得校级一等奖学金及以上荣誉。有助于充分发挥专业特长,施展个人才华,借此次国创为契机,展现扎实的专业素养与能力,促进项目更好的设想并加以实施。

项目始于2020年初新冠疫情肆虐时期项目负责人对于医疗行业的关注,加之对于区块链技术的了解。经一年周期对国内医疗行业了解与深度技术学习,逐渐将“数据的资产化”这一想法付诸实施。

本项目现已具备作为创新型项目所必需的理论、技术、管理模型等诸要素。实验室团队十余人在项目初期借助清华大学和本校提供的相关数据资料和已出版著作对相关文献和已出版著作进行了长期、大量的研究与分析。采用现已成熟公开的技术手段,对于区块链的分布式存储,数据加密及共享和智能合约等方面已具备构建概念模型的能力。掌握区块链初步开发Solidity 编程技术,具有项目完整开发的条件。但与真正成熟的产品相较而言,由于资金与本地疫情等多方面因素影响,现阶段所需要的实地调研部分较为欠缺,采集样本相对较少,种类不够齐全。这也是本项目在未来一段时间亟待解决的问题。

经费预算

开支科目 预算经费(元) 主要用途 阶段下达经费计划(元)
前半阶段 后半阶段
预算经费总额 8300.00 论文出版、技术咨询 4500.00 3800.00
1. 业务费 5000.00 系统测试、软件购进 2700.00 2300.00
(1)计算、分析、测试费 3000.00 对系统进行测试分析 2000.00 1000.00
(2)能源动力费 0.00 0.00 0.00
(3)会议、差旅费 1000.00 实地调查开销、对技术人员进行咨询开销 700.00 300.00
(4)文献检索费 0.00 0.00 0.00
(5)论文出版费 1000.00 论文版面费 0.00 1000.00
2. 仪器设备购置费 1000.00 对所需要软件进行购进 1000.00 0.00
3. 实验装置试制费 2000.00 进行实验测试、工资 500.00 1500.00
4. 材料费 300.00 办公用具购入 300.00 0.00
结束