珀金埃尔默信息科学事业部中国区负责人陈其平先生
“何为大数据?就是要从海量数据中寻找事物本质和规律。”这是陈其平在信息科学领域深耕多年后,依然坚守的信条。
早在“大数据”、“AI”等成为热词之前,陈其平就跨入了这一行业。
2015年,陈其平加入珀金埃尔默,担任信息科学事业部中国区负责人。
5年后的今天,珀金埃尔默信息科学事业部已经从原来100%的业务系统驱动增长转变为超50%的数据服务驱动增长。
这无疑与当下日趋火热的“新基建”浪潮不谋而合。“‘新基建’热潮对我们信息科学事业部产生了非常积极的影响,我们多年来积累的产品、经验,在这片热土上一定会有更好的用武之地。”
恰逢“新基建”好时机
“大数据在‘新基建’中的重要性不言而喻。但我不认为大数据是突然爆红的一个概念,这实际上是一个量变引起的质变的过程。宏观战略希望利用大数据为信息化产业革命带来新的契机。
珀金埃尔默并不是由于国家有了‘新基建’政策才迎合潮流去推出相应的产品,而是自2011年收购了全球最大的致力于医药研发与临床领域的私有信息科学软件公司CambridgeSoft并整合自身软件产品成立珀金埃尔默信息科学事业部(Informatics业务部门)后,珀金埃尔默一直在信息服务、数据分析的领域持续耕耘。
而现在,我们恰逢国家推出‘新基建’这个好时机。”陈其平表示。
多年深耕,让珀金埃尔默信息科学事业部在全球形成强大的影响力——为全球超1000家跨国药企及科研机构提供服务;全球超100万科学家正在运用珀金埃尔默信息科学技术;全球前25强药企在研发上都采用了珀金埃尔默的信息化解决方案。
总的来说,珀金埃尔默信息科学事业部中国区的业务目前主要有两个方向:
一是为医药研发提供信息科学解决方案;
二是为医疗机构和科研机构提供数据集成、分析服务。
医药研发:整体数字化解决方案
在医药研发领域,珀金埃尔默提供涵盖药物研发、实验、筛选、临床试验的整体数字化解决方案。
该方案通过将ChemDraw专业化学绘图软件、电子实验记录本Signals Notebook、药物筛选Signals Screening、药物探索LeadDiscovery、识别临床安全信号SignalsMedical Review整合,实现了药物研发的Make-Test-Decide全流程全信息化支撑。
珀金埃尔默还利用药物研发过程中产生的数据,为客户提供转化医学服务SignalsTranslational。
例如,一些医药公司致力于研发抗肿瘤药物,其研发的某些抗肿瘤药物在临床过程中可能出现不良反应进而导致临床被叫停。但实际上这些药物针对一些靶向病人或特异病人可能具有非常良好的治疗效果。
珀金埃尔默可以通过转化医学服务,从海量数据中寻找抗肿瘤药物潜在的特定配型患者,深度挖掘创新药物潜力,挽救药物前景的同时,也为患者提供了更多、更好的选择。
陈其平表示:“转化医学领域将会是我们未来发展的一个重点。”
医院信息化:敏捷的临床数据集成及模型开发
大健康领域积累的数据量,目前仍每年以约+50%的速度复合增长。庞大的数据量,成为临床数据应用、临床科研的机会与挑战。
珀金埃尔默信息科学事业部的另一业务方向就是为医疗机构提供创新数据集成和应用方案与服务,提升其数据利用效率。
以珀金埃尔默与上海某三甲医院合作的下肢静脉血栓栓塞(VTE)项目为例:
VTE是院内非预期死亡的重要原因,是仅次于心肌梗死和脑卒中的第三大常见血管疾病,严重威胁着人类的健康,VTE还会带来严重伤残,对生命健康造成巨大的伤害。
如果能够利用大数据进行早期识别、筛查、预警以及早期干预,可以有效提升治疗效果以及患者的生活质量。
珀金埃尔默中国信息科学事业部联合医院临床科研部门,通过尽可能多地发现影响VTE产生的因素、参数、信号,研发并改善了传统VTE预警模型——帮助医生尽早识别出哪些是潜在VTE患者并动态进行监控。这一过程运用到了珀金埃尔默一系列的新技术,包括数据挖掘、自然语言处理、实时流数据分析、统计分析算法等。
VTE预警模型
在中国,珀金埃尔默信息科学事业部对接百余家医院及公共卫生机构,包括二十余家知名大型三甲医院,协助了上千个大数据模型的构建,辅助大量临床数据集成、科研成果及产出。
除VTE预警模型外,还协助研发出合理用药判断模型、专项疾病监测模型、慢病科学管理模型、疾病爆发与群体性研究等多种高新现代化模型。
跨部门合作:提供全生命周期数字化服务
“珀金埃尔默一直在致力于推动跨部门合作以及各部门之间的优势互补。也就是说,我们不希望局限于提供某个仪器的分析功能或测试功能,而是希望能够给行业提供全生命周期的数字化服务。”
因此,珀金埃尔默信息科学事业部同公司的诊断部门、生命科学部门密切合作。例如:
在IVD领域,信息科学事业部紧跟国内外IVD试剂研发、注册、生产规范条例,为IVD研发提供系统支撑;突发的新冠病毒疫情对病毒核酸提取、核酸检测试剂的质控、筛查流程的质控等提出了更高的要求,信息科学事业部通过软件解决方案来提供更好的质控保证。
在生命科学领域,信息科学事业部针对生命科学部门的高内涵细胞成像设备(Operetta® CLS和Opera® Phenix),提供基于高内涵影像数据管理及分析解决方案,为客户提供细胞成像之后的数据分析、筛选、整理、归档等服务。
高内涵筛选流程及解决方案
“信息化发展到今天,任何一家公司如果不去讲数据、脱离信息化,一定会被时代所淘汰。珀金埃尔默信息科学事业部一定会积极参与‘新基建’,利用我们在数据清洗、分析、探索、运用方面的成熟经验和产品为‘新基建’提供更好的服务。”陈其平总结道。
当然,中国医疗在这场“新基建”带来的信息化革命中仍然面临挑战。“其中关键的一点是,我们希望有更好的数据保护条例、更好的知识产权保护机制来保驾护航。”
医疗数据像金矿一样,需要经过加工
“医疗数据的利用听起来比较简单,但实际上医疗数据就像金矿一样,必须要经过加工才能够利用。这个过程并不容易。
珀金埃尔默信息科学事业部有句口号,叫做‘Shining light on dark data’。就是利用自然语言分析技术,对数据进行清洗、结构化、规整化,让处于黑暗中的数据发光。”陈其平表示。
以数据集成为例,通常一个大数据项目可能需要以年/季度为单位来进行数据集成。采用珀金埃尔默解决方案,能够将数据集成的时间从以年/季度为单位缩减到以周/天为单位,推动集成、数据应用从量变到质变。
*数据集成是把不同来源、格式、特点性质的数据在逻辑上或物理上有机地集中,从而提供全面的数据共享。
珀金埃尔默的可视化分析软件,能够实现上亿条数据的实时在线分析,实时响应不同维度下的数据变化。更难能可贵的是,该可视化分析软件支持自助式服务,可以让每一位非信息科学专业的科学家,脱离IT工作人员的支持,便捷地使用该软件来进行数据探索与分析。
数据分析的前提是数据集成。珀金埃尔默信息科学事业部的目标是建立一个干净的、样本齐全的、维度更广泛的数据集。
但医疗数据存在非结构性、非连续性、低可用性问题。
在建立数据集的过程中,可能遇到患者在不同医疗机构看病、病例书写不规范……在这种状况下,哪怕收集了十万个患者数据,最终可用的患者数据可能只有1000个。
“尤其针对某一病种,可能我们集成了90%维度的患者数据,但恰恰该病种的重要因素就发生在那10%没有采集到的维度数据中,那么采集到的90%维度的数据实际上是无效数据。因此,我们需要通过各种方式方法获取到患者更广泛、更多维度数据。”
为此,珀金埃尔默一方面通过AI学习进行模拟,通过机器学习实现关键维度缺失数据的模拟;另一方面,用其成熟软件来进行数据处理,速度更快,且可以纳入更多维度的数据。
在数据“金矿”的获取以及加工过程中,陈其平强调:“珀金埃尔默是一家负责任的公司,我们严格遵循各国法规要求,如美国的HIPPA、欧洲的GDPR以及国内的各种数据保护规范。珀金埃尔默的每一位员工,都会经过相关培训,并签字承诺进行数据与隐私的保护。”
行业内复合型人才/医疗人才稀缺
大数据的爆火带来相关领域人才的热招。
对于人才招聘,扎根这一领域多年的陈其平显然很有感触:“我们一直期望寻找到一些优秀人才在领域内发光发热。但这是个医工结合的领域,我们需要同时具备医疗行业、医疗信息化、统计学背景的人才,这样的复合型人才在该领域少之又少,非常罕见。”
因此,在进行人才储备时,陈其平并不局限于招聘稀缺的复合型人才,而是将人才需求按背景特性进行重新解构。目前,珀金埃尔默中国信息科技事业部的员工中,约60%具有统计学相关背景,约40%具有医疗以及医疗信息化的背景。
“在进行人才的重新解构过程中,我们发现其实中国这些年经过高等教育普及、高校大量开设信息统计学专业后,已经培养了大量的信息化领域人才。但依然缺乏医疗业务方面的人才。虽然中国医疗信息化这些年蓬勃发展,但高端医疗信息化及相关科研领域的人才依旧匮乏。
在中国,珀金埃尔默希望利用与全球大型药企、科研机构的合作经验,让我们信息科学领域的人才技术积累与医疗医药专业人才碰撞出火花,进而提供更好的医工结合解决方案。”
加入珀金埃尔默信息科学事业部五年后,陈其平在其任上迎来了“新基建”的好时机。
“好风凭借力”,“新基建”热潮,或将珀金埃尔默信息科学事业部送上更高的台阶。