跳转到主要内容

印度医院系统的安全联合学习平台承诺实现健康数据的民主化访问,为人工智能医疗技术的发展铺平道路。

对于医疗保健部门,筒仓数据是创新用例(如药物发现、临床试验和预测性医疗保健)的主要瓶颈。印度医疗保健机构Aster DM Healthcare现已找到了解决这一问题的方法,可能会带来一些前沿解决方案。

单个患者每年通过成像和电子病历生成近80MB的数据。加拿大皇家银行资本市场预测,到2025年,医疗保健数据的年增长率将达到36%。“预计到2025年底,仅基因组数据就将达到2到40EB,超过所有其他技术平台获取的数据量,”该报告称。

尽管医疗成像等领域的人工智能解决方案有助于解决人员短缺和人口老龄化等紧迫挑战,但在遵守监管政策的同时,访问分布在不同医院、地理区域和其他卫生系统的相关数据仓库是一项巨大挑战。

医疗创新

Harsh Rajaram博士,Aster Telehealth印度和GCC首席运营官

伊斯托克

“在分布式学习环境中,来自不同医院的数据必须集中起来,以创建用于模型培训的集中数据存储库,这引发了对数据隐私的许多担忧。医院对参与此类活动持怀疑态度,担心失去对患者数据的控制,尽管他们看到了其中的巨大价值,”Aster Telehealth首席运营官Harsha Rajaram博士说,印度和海湾合作委员会。其母公司Aster DM Healthcare是一家集医院、诊所、药房和医疗保健咨询服务于一体的企业集团。

为了克服这些挑战,Aster DM医疗保健的创新中心Aster创新和研究中心部署了其安全的联合学习平台(SFLP),该平台能够安全、快速地访问匿名和结构化的健康数据,用于研究和协作。

联合学习是一种使用存储在多个分散源的数据训练人工智能算法的方法,无需移动数据。SFLP允许在不损害数据隐私的情况下访问不同的数据源,因为数据保留在源中,而模型训练来自多个数据源。

“该平台标志着一个范式转变,它将计算转化为数据,而不是将数据转化为计算,”Aster数字健康公司的人工智能科学家创新顾问Lalit Gupta博士说。

“联邦技术为我们提供了一个平台,通过它,我们可以释放数据提供的巨大潜力,更好地洞察临床、运营和业务挑战,并利用新的机会,而无需担心失去对我们数据的控制。它将允许来自多个组织的数据科学家在不共享原始数据的情况下进行人工智能培训。通过获得大型数据使用r数据集,他们可以开发更精确的人工智能模型。它还将确保数据合规和治理,”首席运营官Rajaram说。

SFLP的构建块

在部署平台之前,Aster利用来自Aster医院班加罗尔和Vijayawada集群的医院数据对平台进行了能力演示或概念验证。

“该平台由位于班加罗尔和Vijayawada的机器组成的两节点协作。主管/聚合器位于班加洛尔,两个特使/协作者分别分布在班加罗鲁和Vijaya wada之间。软件设置包括Ubuntu 20.04.02,内核版本5.4.0-65-generic,用于协作的OpenFL Python库,PyTorch Python库[GG1]用于开发深度学习模型,以及Nvidia Quadro RTX 6000 GPU。

医疗创新

Lalit Gupta博士,Aster数字健康创新顾问和人工智能科学家

伊斯托克

“Aster IT团队帮助安装和设置了三台服务器,启用了端口,安装了操作系统和必要的驱动程序,并维护了服务器。IT团队还帮助从PACS和HIS获取数据,这是联合学习实验所需的,”他说。PACS是指图片存档和通信系统,是一种用于存储和传输电子图像和报告的医学成像技术。HIS或健康信息系统被设计用于管理医疗保健数据。

作为能力演示的一部分,超过125000张胸部X射线图像,包括来自班加罗尔30000多个独特患者数据的18573张图像,用于训练用Python开发的CheXNet人工智能模型,以检测X射线报告中的异常。额外的18537张图像提供了3%的精度提升,这是因为真实世界的数据无法用于训练人工智能模型。

该平台可以容纳任何分析工具,对数据大小没有任何限制。“我们将根据用例决定数据的大小。在我们的能力演示实验中,我们使用了大约30GB的胸部X射线图像数据库,”COO Rajaram说。

Aster花了大约八个月的时间,包括四个月的能力演示,部署了该系统。该平台于2022年6月上线。Rajaram说:“我们的硬件和软件目前仅在两家医院部署。我们打算将这些部署增加到多家医院,并期待其他供应商携手利用生态系统。”。

应对新的数据安全挑战

虽然联合学习作为一种方法是一种公认的解决数据隐私挑战的方法,但它也带来了额外的安全风险,因为数据/人工智能模型资产更容易受到黑客攻击。因此,提供与隐私相关的安全功能至关重要。

一组与安全相关的指令代码内置于服务器的中央处理单元中,提供所需的基于硬件的内存加密,将特定应用程序代码和内存中的数据隔离,以实现数据安全。“该平台将联合学习与硬件支持的安全保障相结合。这有助于保护存储中的数据和人工智能模型,当通过网络传输时,以及在执行联合学习培训作业期间。平台中的安全功能提供了保密性、完整性和证明能力,防止数据的窃取或反向工程。”拉贾拉姆说。

“注释已经在我们的PACS系统中。我们使用它的API进行数据提取。虽然由于它在我们的网络中,所以不需要匿名,但对于试点,我们确实从后端匿名了数据,”他说。

本文: