機器需要更多的學習次數,以得到更準確的判斷,多次學習的基礎是數據,現階段最大的困難是數據積累。
人工智能+醫學影像正在成為現實。
9月6日,香港中文大學宣布,該校研究團隊利用人工智能影像識別技術判讀肺癌及乳腺癌,準確率分別達到91%及99%,識別過程只需30秒至10分鐘。近日,騰訊也發布AI醫學影像產品“騰訊覓影”,通過將醫生多年積淀的病例圖片與AI結合,騰訊覓影篩查一個內鏡檢查用時不到4秒,早期食管癌的篩查準確率高達90%。目前,該項技術已在中山大學附屬腫瘤醫院、廣東省第二人民醫院、深圳市南山區人民醫院啟動臨床預實驗。
“人工智能將迎來爆發式增長,數據易于獲取的行業會率先進入人工智能時代。”招銀國際一機器學習工程師告訴21世紀經濟報道記者,人工智能醫療影像可節省醫生在處理數據、分析病理方面花費的大量時間。
“人工智能+醫學影像”自2016年來逐漸受到資本熱捧。推想科技、圖瑪森維、雅森科技等人工智能影像分析與診斷服務的企業相繼獲得千萬元融資。放諸全球,IBM斥資10億美元收購了醫療影像處理公司Merge,將其技術整合進沃森系統。
千億市場
據國金證券調查,目前我國影像市場規模達到2000多億元,省會城市的影像中心規模在250億-300億,縣級市影像中心規模300多億。
“由于中國信息化建設較晚,醫療影像方面落后美國。醫學影像數據共享度較低,正逐漸向電子信息化邁進。”上述機器學習工程師告訴記者,臨床需求及云技術的普及加速了醫學影像智能化。
CHIMA數據顯示,2015年我國醫院PACS系統(醫學影像存檔與通信系統)建設水平50%-60%,遠低于美國幾乎100%的水平。
PACS系統是指影像歸檔和通信系統。簡單說就是醫院影像科檢測數據通過PACS系統保存到服務器,根據實際需求可進行圖像分割、特征提取、定量分析、對比分析等。
根據人工智能的不同路徑,影像智能分析市場可分兩類:一類是以IBM沃森系統、百度醫療大腦為代表的提升影像診斷效率的智能系統,通過大量患者電子數據累積,對醫院影像診斷分析;另一類是幫助醫生提高影像診斷精準度,通過對醫學影像數據的深度解讀分擔醫生工作量。
“無論哪種類型,都需要讓機器學習海量數據。”上述機器學習工程師認為,隨著云技術的普及,以華潤萬里云為代表的云端影像信息系統企業在市場上涌現,提高了患者信息的存儲效率。
這種趨勢下,飛利浦、西門子、聯影等傳統醫學影像設備廠商,因其產品使用普遍,如實現PACS系統信息化轉型,數據將實現在云端實時存儲,更容易搶占市場份額。
數據處理難題
人工智能應用普及的三大推力是深度學習為代表的新技術、計算力和海量數據,前兩者各行業通用,對醫療領域來說,數據首當其沖。
“機器需要更多的學習次數,以得到更準確的判斷。多次學習的基礎是數據,醫療影像需要海量醫療影像和醫生的結果判斷。”一位熟悉智能醫療的投資人士告訴記者,現階段最大的困難是數據積累。
咨詢公司IDC預測數據顯示,到2020年全球醫療數據量將達40萬億GB,每年還將迅速增長,這些數據中80%以上是非結構化影像數據。
另外,影像數據和放射科醫生增長速度存在不匹配。據相關部門和動脈網數據,美國、中國的影像數據年增長率將分別達到63.1%和30%。但兩國放射科醫生年增長率僅有2.2%和4.1%。
“兩者之間的鴻溝一方面促進了人工智能的發展,同時也給人工智能存儲及處理海量數據帶來巨大難題。”上述人士解釋道。
記者注意到,由于醫療數據尚未實現互聯互通,國內醫療影像數據應用還處于起步階段,數據格式難以統一。“眾多醫療影像公司以科研合作方式從醫院獲取影像數據,但僅依靠幾家醫院遠遠不夠,擴大合作醫院范圍又會增加醫療影像公司的成本。”
此外,獲取醫學影像后,對于病灶識別與標注,也是機器智能化必不可少的過程。通常的做法是醫療影像公司花費較大成本,請影像科醫生識別病灶并標注,高昂的成本讓部分企業望而卻步。
在醫學人工智能領域,IBM沃森一直處于領先。但近期屢遭市場質疑的原因之一就是沃森需要特定類型的數據持續進行“訓練”,這些數據要么非常緊缺,要么難以訪問。資深技術投資者和風投公司Social Capital創始人Chamath Palihapitiya 5月在CNBC上表示,IBM的專長只是通過強大的營銷和市場能力讓消費者為并不了解的服務買單。
“為使人工智能更聰明,需要構建深度理論學習模型。”上述投資人士認為,在構建模型前需定義一個理論策略去評估、調試,“通過調整順序,學習模型會逐步明確及常規化”。
文章來源:21世紀經濟報道