在新冠肺炎疫情爆發后,幾乎是在一夜之間,互聯網醫療就完成了一次大范圍的用戶教育和市場普及。其在抗疫“第二戰場”的出色表現,讓人們意識到了互聯網在打破空間和時間限制方面的突出優勢。
與此同時,在經歷了長期的探索實踐后,互聯網醫療行業正在進入高質量發展的階段,互聯網診療數據的治理也隨之被提上日程。廈門大學附屬第一醫院與神州醫療聯合在《中國衛生信息管理雜志》上發表了《互聯網診療服務數據治理的探索與實踐》論文,旨在探索互聯網診療服務數據治理的價值和應用,促進互聯網診療數據有效沉淀為數據資產及解決備受關注的數據安全及隱私相關挑戰的方法。以下是論文內容的部分節選。
《互聯網診療服務數據治理的探索與實踐》
廈門大學附屬第一醫院 弓凱、王占祥
神州醫療科技股份有限公司 吳戈、武曉玉、吳惠庶
01基本現狀及治理必要性
1.1 現狀與問題
目前,互聯網診療用戶體驗的大多是“輕問診模式”產品,有80%的用戶選擇互聯網診療的目的是咨詢病情、尋求診斷和治療建議,以及開具常服藥物?;ヂ摼W診療服務通常以視頻對話、語音通話、圖文咨詢和文字咨詢為溝通形式,主要業務留存數據為患者的診前描述和醫患之間的對話信息,本質上是非專業性的文本描述。
1.2 數據治理的必要性
1.2.1 互聯網診療服務的監管評價需要數據治理
2021年10月26日,《互聯網診療監管細則(征求意見稿)》的發布,促使互聯網診療全面進入監管時代。監管細則明確要求省級衛生健康主管部門“對互聯網診療整體情況進行分析,定期(每月至少 1 次)向各醫療機構及其登記機關反饋問題”,并鼓勵“運用人工智能、大數據等新興技術實施分析和監管”。
1.2.2 互聯網診療相關的學術研究需要數據治理
目前,互聯網診療對各類??萍膊「深A的療效, 以及對衛生經濟的影響普遍缺少嚴謹的循證評價,而數據治理的好壞則影響了相關研究結論的可信水平和推薦強度。
1.2.3 互聯網診療場景下的智慧服務應用開發和部署需要前置數據治理
智慧應用的開發和部署依賴于完善的數據處理管道,經過良好的數據治理才能打通醫院在業務、數據和應用3個層面的銜接壁壘。
1.2.4 互聯網診療場景下的隱私信息識別和保護需要數據治理
隨著《中華人民共和國個人信息保護法》的施行,數據權限控制、個人信息去標識化、數據加密、安全審計已經成為互聯網醫療健康信息系統的建設重點。
02數據治理技術的方法和應用
2.1 醫療數據治理方法
2.1.1 基本步驟
數據治理包含 "理" "采" "存" "管" "用" 5 個步驟, 即業務和數據資源梳理、數據采集清洗、數據庫設計和存儲、元數據管理、數據挖掘與利用。
2.1.2 治理的核心
醫學術語標準化能夠實現醫學信息的互通,提高數據治理的效率與質量 , 是醫療數據治理的核心。在國際上應用較為廣泛的臨床醫學術語標準包括《醫學術語系統命名 - 臨床術語》(SNOMEDCT),《國際疾病分類與代碼》(ICD-10),《觀測指標標識符邏輯命名與編碼系統》(LOINC)等;在國內,臨床醫學術語標準建設的起步較晚。國家衛生健康委發布了《衛生信息數據元目錄》等衛生信息標準,在實踐中臨床術語的標準化仍需借鑒國際標準,并結合我國的特定需求進行本土化,構建相應的中文臨床醫學術語體系。
2.2 主要應用
2.2.1 互聯網診療中數據的初步利用
2020 年,廈門大學附屬第一醫院(以下簡稱“廈大一附院”)使用多中心線上問診數據挖掘新冠肺炎相關問診人群的用戶特征,發現群眾普遍存在疑病、恐病情緒,并存在小病亂投醫、大病怕投醫的不合理就醫行為。通過對文本非專業術語進行標準化、歸一化,對文本信息的關鍵詞進行摘取,形成用戶的簡要畫像,根據臨床預測模型做出了對患者疑病情緒和來院就診傾向的預測,據此在疫情期間輔助實現對網絡問診用戶的精細化管理,見圖1。廈大一附院已經開始對大規模網絡問診數據進行就診意圖和掛錯科室的人工標注。
2.2.2 互聯網診療領域的數據深度利用方向
(1)真實世界研究。結合人工智能和機器學習技術,構建臨床預測模型并集成為工具集或平臺,輔助臨床醫生進行臨床決策。
(2)患者個體健康數據監測。通過可穿戴或便攜式醫療設備及遠程監控系統,實現疾病易感人群篩查和線上慢病管理。
(3)政府和保險公司根據疾病支付數據,優化醫保定價,調整疾病防治支付策略。
(4)藥物研發?;谒幬锱R床試驗階段之前的數據集,預測臨床結果并評判藥物研發的優先級,縮短研發周期,降低研發成本。
(5)利用就診數據優化就診流程和資源配置。
(6)數據安全及隱私保護。利用隱私計算、聯邦學習、數據脫敏和同態加密等技術控制患者隱私暴露風險,為互聯網診療合規工作及患者隱私保護工作,提供全流程的數據標準化、數據分類分級、敏感字段判斷、風險控制等支撐。
03面臨的挑戰及未來發展方向
3.1 面臨的挑戰
3.1.1 數據的多樣性挑戰
數據治理中的主要技術問題包括數據的孤立 / 碎片化、觀測數據的局限性、驗證、數據結構問題、數據標準化問題、數據不準確和不一致性、數據可靠性、語義互操作性、可擴展性、數據缺失和假陽性等。
3.1.2 數據的安全性挑戰
數據泄露等安全問題可能對醫療保健構成重大威脅,患者隱私和保密在醫療保健領域至關重要。缺乏數據協議和標準是醫療領域數據治理面臨的關鍵問題。
3.1.3 互聯網診療數據口語化表達帶來的挑戰
互聯網診療患者自報告信息中會存在大量的非專業性描述,而這些非專業性描述可能需要醫生轉述,并以結構化的形式進行整理。另外,語音識別技術尚未應用于互聯網診療業務中。
3.1.4 數據長期治理需求帶來的挑戰
數據治理是提高數據質量的一項長期工作?;ヂ摼W診療數據趨向與線下電子病歷同質化管理。因此,需提升醫療機構對常態化數據治理工作的重視。
3.2 數據治理技術的發展方向
3.2.1 引入人工智能技術協助數據治理
多模態數據越來越多地出現在互聯網診療業務中,傳統的數據治理技術已經不能滿足現實需求,數據的底層治理能力亟待人工智能技術協助提升。
3.2.2 多模態融合技術實現數據關聯互補
通過人工智能技術中的多模態融合技術實現歸納多源異構的數據,將數據相互關聯,從而達到減少數據重復錄入、數據間及時糾錯、系統間信息同步修改的目標,并有望解決互聯網診療業務下的信息孤立問題。
04結語
目前,我國互聯網診療領域數據治理仍處于起步階段,面臨著數據多樣化治理、術語標準化建設、個人信息與隱私安全保護等需求和挑戰?;ヂ摼W診療服務數據治理將推動醫療行業的移動信息化和物聯網化,為提升互聯網診療、實現遠程精準醫療、共享優質醫療資源提供必要支撐。