依图医疗倪浩:仅谈算法是外行的表现,内行的人都谈标准

2017-11-10 19:57:11雷锋网

雷锋网消息,说起依图科技,更为人所知的是其在安防领域的实力,其研发的安防产品、大数据产品等在金融行业应用广泛。但是,如果说到其医疗团队,一部分人会陌生,用依图医疗总裁倪浩的一句话就是“可能是我们太过低调了”。实际上,2016年,依图的医疗团队就开始以医学影像为切入点拓展AI医疗领域。目前,依图的阅片机器人产品已经在几十家三甲医院的影像中心落地。

近日, 在2017杭州·云栖大会上,依图医疗总裁倪浩在会上发表了主题为“医疗人工智能的创新之路”的主题演讲。雷锋网(公众号:雷锋网)了解到,倪浩原先在阿里云计算担任技术专家,后建立阿里云产品团队并担任产品总监。

依图医疗倪浩:仅谈算法是外行的表现,内行的人都谈标准

倪浩表示,2016年医疗领域最火的不是人工智能,而是移动医疗。但是 90% 的移动医疗业务是非常不靠谱的,因为移动医疗需要医院的基础设施做支撑,先要跳过医院做诊断是完全不现实的,因此依图医疗在成立之后就定位于“服务医院的人工智能”。

在他看来,人工智能医疗在中国发展具有巨大的优势:一,中国的医疗问题多,人口基数非常大,医疗问题非常突出;二,中国技术人才的储备非常强,顶级 AI 会议的论文里50%都是由华人发表;三,中国的创业体系在全球非常领先。“所以我认为中国的医疗人工智能会是世界的引领者。”

其实,医疗人工智能发展到今天,已经有相当多的产品在医院得到应用,而医生最关注的还是产品的准确率。但是倪浩却不这么认为,“系统的敏感性95%、特异性95%,只是把这些数字讲出来,你没有办法分辨是真的还是假的,因为他也没有讲这个数字是在哪一个数据集上面测出来的,因为没有一个公开的数据集可以检测这件事情,有公开数据集可能又被算法针对性地优化掉了,所以这种数字就不要去相信。”

作为一个医疗人工智能行业的从业者,倪浩对于行业的现状深有感触。他用三句话概括:

第一句话:“仅谈算法是外行的表现,内行的人都谈标准”。

现在算法就已经一样了,但是靠算法去保持你的先进性就是没有入门的表现。算法不是核心竞争力,最核心的竞争力是怎么应用算法,怎么样才能够用好是基于对数据的理解。

第二句话:“医生大脑里的知识是非常宝贵的,但想挖掘很困难。”

今天大家讲医疗人工智能靠专家+算法+数据,我认为持这个观点的人已经很落后了,今天我们最重要的事情是怎么把医生大脑里面的这些知识挖出来,这些知识需要很强的实践探索。怎样挖出医生脑子里面真正的知识是非常关键的。我们甚至直接聘请了几个医生专职到我们公司来。

第三句话:“对数据理解的深度,决定了一个AI能够走多远。”

对数据的理解,本质上是反映了对场景的理解深度。比如大家都在做肺结节,但是我相信把肺结节的使用场景用到体检门诊是不一样的,这个门诊应用跟专科医院应用是不一样的。他们关注的点是很不一样的,检出这件事情对别人有价值吗?没有价值。对于肿瘤医院有价值吗?完全没有价值。那有价值的是什么呢?肿瘤医院有可能关心的是你这个是原发的还是激发的。

以下是倪浩的演讲内容实录,雷锋网做了不改变原意的编辑:

倪浩我在阿里云一共待了8年,离开阿里之后开始做人工智能医疗,今天很高兴能够以合作伙伴的身份回到云栖大会。

云计算大数据已经为社会积累了非常好的基础设施,无论在技术能力上,还是数据积累上,已经使得很多行业具备发展更进一步的智能应用的土壤。我当时选择医疗方向,跟我的背景有一点关系,我本科学医,学得太差了,后来就去学计算机,发现计算机是真的太简单了。现在回过头来,这么困难的医学问题能不能用计算机的方式去解决?又该从哪里做起?

2016年我们开始做的时候,人工智能在医疗领域不是那么火,最火的是什么呢?移动医疗。90%移动医疗业务是非常的不靠谱,为什么呢?因为现在的西方医学体系建立在生物、化学等基础学科的发展基础之上,那么移动医疗想跳过医院所拥有的这些基础设施去给病人做进一步的诊断是完全不现实的。我当时就觉得如果要做医疗人工智能,那一定要跟真正拥有医疗资源的人合作——医院。所以去年开始我们公司的方向就定位在服务于医院的人工智能。

依图公司是2012年成立,专注于人工智能,2016年成立了依图医疗子公司。浙江省人民医院、浙江大学医学院附属第二医院、浙江大学附属第一医院、浙江省肿瘤医院、复旦大学附属肿瘤医院、广州市妇女儿童医疗中心、广州军区武汉总医院、武汉大学中南医院、上海市同济大学附属同济医院等顶级三甲医院,都是我们的客户。

属于中国医疗人工智能的 “世界级挑战与机遇 

人工智能发展两起两落,那么为什么这一回我们相信能够成功,且愿意做这个投入呢?之前人工智能的发展都是以一个新的算法出现作为基础,今天的差别在于,算法出来其实不那么新了,最重要的是整个社会一起把基础打牢了:一个是云计算和大数据的发展,云计算提供了计算能力,大数据推动行业的数据开始集中,人工智能没有数据什么都没有;另一个是CPU的发展

人工智能医疗在中国,今天比起全球来说有极大优势。一,中国的医疗问题非常大,人口基数非常大,医疗问题非常突出;二,中国的技术人才的储备非常强,顶级 AI 会议的论文里50%都是由华人发表;三,中国的创业体系在全球非常领先。所以我认为中国的医疗人工智能会是世界的引领者。

我刚开始做这件事情的时候,跟美国的国内卫生研究院NH的一个首席科学家交流,他认识美国一个最顶级的影像科医生,这个人应当是全世界片子最多的一个人,经验非常丰富,一周要看100多个病人的片子。各位看一下,我们中国80%的影像科医生,一天要看100多个人的片子,数据积累的差异非常大。比起国外,中国今天在医疗领域创新的心态更开放,而我们合作过这些医院后发现,越顶级的专家对于人工智能的态度就越开放、越拥抱,所以我们刚开始其实找过一些普通医院,也找过一些顶级医院,最后发现顶级医院的专家态度更加开放,所以从顶级医院开始合作。

接下来给大家分享一下我们的系统。

中国医疗人工智能现在最热门的影像,影像里面最热门的是肺结节,有比较多的因素导致这个点。我们做的这个产品非常好,在今年3月份就被央视报道,因为当时我们的产品在医院临床路径里面用了起来。在胸部CT智能辅助诊断系统上,公开数据集这件事算是我们的一个教训,公开数据集可以让你起步,但不能让你进入临床,就是公开数据集可以让你做出一个demo出来,但是不可能让你做出一个能够进入到生产系统的产品,差得非常非常远。不管是谁的公开数据集,今天能cover的临床产品是非常非常小的一部分,都是一个特定的小场景。当你到临床领域之后,现实分分钟教你做人,有非常非常多的不认识的东西出来,你会发现光病灶可以分成十几种出来,在 CT 里面表现更复杂。公开数据集只能让你找出一种,差别非常大,所以只有非常踏实地自己去摸整个场景。

场景至上,这个场景里面有哪些复杂的问题,多跟医生一起做,千万不要躲在实验室里面去做。很多人在讲,今天我这个系统的敏感性95%、特异性95%,只是把这些数字讲出来,你没有办法分辨是真的还是假的,因为他也没有讲这个数字是在哪一个数据集上面测出来的,因为没有一个公开的数据集可以检测这件事情,有公开数据集可能又被算法针对性地优化掉了,所以这种数字就不要去相信了。依图今天去讲的时候,是基于我们这个系统用在医院的临床路径里面,90%自动生成的诊断报告被医生直接使用,这代表系统对于临床的适应性,代表了它到底给临床带来多大价值。

今天人工智能带给医疗影像领域的一个真正变化是什么?原有的医疗影像是基于形态的非量化观测,这是医生工作的逻辑,他要完成的任务是病灶检出与诊断。今天放射科医生已经被逼到变化的一个点上去了,比如肿瘤的治疗使得原来基于形态学的非量化观测,已经远远满足不了临床需求,今天临床要求你去做疾病分析、去参与治疗方案、去对愈后效果进行评估,所以需要放射科医生从原有的方式变成一个基于高维特征、量化评估,让影像在临床路径里发挥更大价值。

今天,中华医学会放射学年会在上海召开,我们在中放有个专场。金征宇教授就是北京协和医院的放射科主任,他觉得影像科往后有两个出路,一个是跟临床结合,另外一个是跟病例结合,精标准化,从影像数据里挖掘更大的价值点出来。今天可能满世界都是病例,病例能够训练大家入门,能够让大家知道这个做人工智能医疗有多么深的坑,然后把这个东西做通了,后面的东西也可能比较容易就能够走通了。你可以基于这个产品建立你的医学研发链路,这还是挺make  sense的。下面我再给大家介绍一下我们跟浙江大学医学院附属儿童医院一起做的儿童骨龄辅助诊断系统。

以前医生对骨龄的诊断基本上精确到1岁,今天我们做这个系统之后精确到一个月左右。骨龄可能大家了解不太多,不像肺结节这么容易理解。骨龄主要用来评估青少年发育情况,看看发育有没有异常,矮小症、性早熟,实际上是家长非常关心的问题。以前是医生看图谱,这个图谱主观性非常强,不同医生看出来的差异非常大。以前还有一种比较好的这个评估方式叫TW3,在中国其实也有人在做这样的东西,但是没有人工智能的时候他要怎么做?他要把手掌上的十几根骨头评级,代入到一个很麻烦的公式算出来,我们跟浙儿保的傅君芬院长一起合作,她说以前有一个软件帮她去算公式的情况下,算一个精准的骨龄出来要15分钟。今天我们做到了2秒钟,这不是值得自豪的,因为人工智能必须是2秒钟出结果的。但是我觉得比较了不起的事情是什么呢?就是我们这个合作不是只做一个软件用智能读里面的公式,我们的目的是一起去建立中国骨龄的新标准。原来骨龄的评估方式是欧洲人基于白人小孩评估出来的,中国有一个改良版,没有完全改良,数据样本也非常小。到今天,整个社会发生了很大的变化,人的生活水平比之前提高了很多,所以必须制定新的骨龄标准。我觉得这个标准很可能是一个人工智能的算法的标准,有可能还是会产生一个图谱,但是这个图谱也只是一个辅助,让人去理解。未来医生可能根本不需要去理解这个标准,这就是一个算法,这个算法经过各种临床的验证,已经足够准确了,有一个图谱只是帮助你理解。

医疗人工智能领域今天在图像这个方向是被大家充分认可的,只是觉得这个事情是时间点的问题,没有人怀疑说这个图像走向人工智能化会有一个多大的瓶颈。当然我还是觉得有可能低估了一点这件事情,毕竟整个放射科,再包含超声、病历、眼底疾病等一系列领域,每一个领域都有其复杂度,我觉得没有那么简单。

其实大家意识到了临床的科室在医院里边,放射科只有一个,临床的科室更多,一个医院几十个临床的科室很正常,所以我们开始在基于临床科室内部做一些工作,我们做什么呢?我们刚开始是在儿科领域,基于电子病历系统、基于电子病历的数据去做儿科的辅助诊断。这是一个非常非常早的系统,最早是去年10月份的时候,今天变化比较大,我们跟广东省儿童妇幼保健院一起做了一个叫“咪姆熊”的儿科电子病历辅助诊断系统。这个系统的关键点不在于输入一个病历后能够给你看出一个什么样子的结果,这个产品应用在医院用的自检,自检可能对于这个场景是有需求的。今天其实很多好的医生跟普通医生之间的差距,在于他们能够把问题思考到什么维度,能够问出多少问题出来,比如说门诊场景,能够去问病人多少问题,有没有精确地把该问的问出来。我们在这个产品里面做了一个核心的功能叫“问诊”,而不是说把病历数据读了之后,只是给出一个诊断的结果出来。这个产品很快我们会把它再推广,推向更多医院使用。

另外我觉得为医生做科研是很有价值的一件事情,这本质上是在帮医生去探索一些新疆界,所以我们把一些机器学习算法直接集成到了科研的平台里面去,帮助医生去自动处理数据甚至是医生的笔录。一是数据要结构化,医生写的很多自由文本要固化,把它变成可以被使用的类似于数据库的一个东西;二要处理数据里的医学概念,比如说肺癌,它有分小细胞癌、非小细胞癌,每种都有不同的说法,有一个层级这样的一个关系出来。不同的医院说法也不一样,不同的医生说法可能也不一样,肝硬变同样一件事情,不同的医院说法也不一样,那么你想使用这些数据,定义这件事情是要把这些数据统一起来,这件事情不能靠人去整理,这件事情同样用机器去做,让机器去学习什么样子的词是同一个意思。很重要的两个基础场景,不把这两个事情做完,结构化数据化做完,基本上临床没有办法应用。

医疗人工智能的三个层次

第一个层次是帮助医生去解决重复性问题,医生能做,但是他会因为一些原因发挥的不稳定,或者因为一些经验不够这个,不够,比起一些老专家不够那么好,那么这是机器擅长做的,像骨龄这样子的事情,看的多了,那么准确度就高了,机器今天很擅长做这个事情,人只要能做,他很快就能够学会,并且数据量也大,那么他很快的就能够学的很好。

第二个层次是帮助医生去聘请人工智能的专家顾问组,就像辅助诊断,让专家的思维逻辑摆在你的眼前,当一个医生去给患者去做诊断的时候,有一个专家顾问在边上告诉他,你该问什么样的问题,告诉他某一个医学文献里面讲过你这样的case,告诉历史上已经有一个专家诊断出跟你相似度达到98%的一个case,你可以拿来参考。这是比较复合地帮助普通医生去提升的。

第三个层次是帮助医学专家去拓展新的医学疆界,帮助不少医生去做课题,帮助他去发现一些疾病原来可能没有办法去处理的,不同的特征之间的关联性到底有多大。今天你帮他把基础设施建立好了,他原来可能要用三个月时间做一次科研,挑选病例、随访、把想要的病人挑出来,找到之间的关系去分析规律;而依图科研平台上就是十分钟,我觉得这个是真的在帮助医生去发现医学领域新疆界。

我们怎么看医疗人工智能行业现状

从去年到今年,中国至少有50家以上的人工智能公司被新创立出来,我们也碰到了一些对手,我觉得这对于整个行业来说是一个非常健康的状态。但是今天医疗领域跟其它领域又有很大的不一样,所以就会存在一个情况,把其它领域的一些经验迁移到医疗领域去,很可能是非常不合适的。

我有几句话。

第一句话:“仅谈算法是外行的表现,内行的人都谈标准”。

不知道你们有没有共鸣,我们会碰到很多人不管是圈内的人,圈外的人,医生,工人,他们都会问我,算法这个东西未来一定是趋同的,我说不是未来趋同,现在就已经一样了,大家都是有这个算法的,但是靠算法去保持你的先进性就是没有入门的表现。连算法都不会用的人就不谈了,会用算法的时候,那么这个算法不是你的核心竞争力,最核心的竞争力是怎么应用算法。举一个例子,大家都买一把菜刀,五星级酒店大厨跟一星级酒店大厨切出来的土豆丝是不一样的。怎么去用这个算法才是最关键的,怎么样才能够用好是基于对数据的理解。

第二句话:“医生大脑里的知识是非常宝贵的,但想挖掘很困难。”

今天大家讲,医疗人工智能靠专家+算法+数据,我认为持这个观点的人已经很落后了,今天我们最重要的事情是怎么把医生大脑里面的这些知识挖出来,这些知识需要很强的实践探索。我们都是知识上专注的人,但是一天两天让我把自身最精华的东西、这个行业里面最深的理解写出来,根本没有价值;你没有办法去挖掘医生脑子里面的东西的时候,你就没有办法真正打开应用系统,你的数据也不可能得到很好的训练,所以怎样挖出医生脑子里面真正的知识是非常关键的。我们在这件事情上花了非常非常多的时间,甚至直接聘请了几个医生专职到我们公司来。

这里面每一个事情都不一样,比如说做影像挖掘的方式是不一样的,做电子病历挖掘的方式又是另外一种,有的可能是关注诊断的一些特征,有的可能是关注一些更加宏观的东西,这要求在每一个方向上比较深入探索。

第三句话:“对数据理解的深度,决定了一个AI能够走多远。”

对数据的理解,本质上是反映了你对场景的理解深度。比如大家都在做肺结节,但是我相信今天能够把肺结节的使用场景用到体检门诊是不一样的,这个门诊应用跟专科医院应用,比如说肿瘤医院又是不一样的。他们关注的点是很不一样的,检出这件事情对别人有价值吗?没有价值。对于肿瘤医院有价值吗?完全没有价值。那有价值的是什么呢?比如肿瘤医院有可能关心的是,你这个是原发的还是激发的。

医疗 AI 发展的挑战 

第一点,意识上障碍: AI 医疗 vs 医疗 AI , AI 公司 vs 医疗公司 

做人工智能公司,我们经历了一个很长的过程认知到,我们到底是一家什么样的公司,我们是一家人工智能的公司还是一家医疗公司。这一点对于你的战略,对于你的策略都有很大的不同,有人之前问,到底是AI+医疗还是医疗+AI,至少是说今天是把你自己当成 AI 公司还是医疗公司。依图医疗今天把自己当成是一家医疗公司,核心竞争力是 AI ,在这个定位下我建立了很大的医生团队,包含很多全职医生,也包含了很多兼职医生。这个医疗公司比以前的医疗公司还要深刻,是因为我们今天做的东西是要重构临床工作流,所以对于临床工作流没有一个非常深刻的认知是不可能做到这一点的,你做人工智能永远只是做一个科室级的,做一个工具而已。

第二点,缺乏行业的协同:数据的标准,临床路径的标准,效果评估的标准 

这个行业处于比较早的阶段,缺乏标准,当然现在让国家出台标准我觉得也不是好事情,但是我们要在这个行业里一起去发展一些标准出来:数据的标准,临床工作流的标准,效果评估的标准。

一是数据的标准,今天的数据不一致性是非常可怕的,影像是标准化最好的一批数据,但是不同医院还是差别很大,比如肺结节这件事情,低剂量CT层厚不一样,剂量也不一样,最后反映出来的这个维度都不一样。数据不标准,对于很多公司来说是一个很大的资源浪费,得花很多的算法来处理这个事情。

二是临床工作流标准,这关乎跟医生之间的关系、能否回答医生的问题。未来这个东西到底会不会替代医生?它当然不会替代医生,但是在临床工作流,今天到底是扮演一个什么样的角色?

三是效果评估的标准,用在临床工作流中怎么样才叫对临床产生到了真正的价值。

第三点,宏观政策:用互联网思维做医疗AI面临的挑战 

在政府监管层面,我们作为从业者已经感受到了比较大的痛点。

第一个点叫 AI 的整合。今天做人工智能的基本上就老老实实去申请三级证,二级证都不要申请,然后三级证的时间是两年,就是说两年时间你才能拿到这个证,才能够真正大规模铺开到医院去。这个跟互联网思维是完全不一样的。

第二个点是收费项。能不能从病人身上收到钱,如果没有,对于医院是一个成本项,他怎么办?我想听听龚院长的一些分享,这方面有没有一些看法,我觉得这个是这行业需要继续探索的。

医疗这个行业是一个得能够沉下心来做的行业,没有五年,不做好五年烧钱的准备,不要去做这件事情,就是五年都出不来这件事情。我不是说五年没有产品出来,而是说五年,整个行业可能还没到一个快速发展、能够规模复制的阶段。未来前景还是非常美好的,人工智能一定会成为医院的基础设施,所以也期待各位同行跟我们的医院客户能够一起努力把人工智能真的构建成未来医院的基础设施。

我今天就讲到这里,谢谢大家。


2
Top