365彩票_陈润生院士:人工智能和大数据如何催生精准医疗? - 365彩票_【官方网址】

当前位置:首页 > 探索 > 科学

365彩票_陈润生院士:人工智能和大数据如何催生精准医疗?

2020-10-23 10:05:02

【365彩票】11月1日,在 由新华网与南京市经济和信息化委员会主办的首届中国智谷大会人工智能与产业创意高峰论坛上,生物信息学家、中科院院士陈润生做了了为题《大数据与精准医学》的演说。陈润生院士指出,随着人工智能和大数据等技术的应用于医学领域将不会推展精准医学的发展,在疾病再次发生之前展开采行针对性的措施,从而转变医疗身体健康的概念。

365彩票

同时,人工智能和大数据也对研究我们遗传信息中97%的、我们仍未理解的“暗物质信息”起着关键作用。总体来看,精准医学才刚上路,还不存在很多的机会。以下是陈润生院士演说全文,在现场国史基础上展开了不改为本意的编辑:敬重的各位专家、各位领导、十分荣幸能参与这个不会,我想要今天我就大数据和精准医学讲一个观点,因为现在大家告诉,精准医学十分冷了,虽然相比人工智能还是小弟弟,但是我们告诉,2005年1月20号美国总统奥巴马在他公开发表的美国要积极开展精准医学研究,从那以后,精准医学就在全世界获得了广泛的推崇,在很多发达国家还包括我们国家某种程度是大家都很关心的一个领域,我们国家领导人也多次对于精准医学的发展都有最重要的命令,而且在资助上也有明确反映。

所以我今天主要讲精准医学的四个方面问题,一个是跟大家交流,也期望进行一些辩论。1. 精准医学是组学大数据跟临床医学的融合第一个问题,精准医学的本质是什么,核心是什么?我看见国内有各种各样的评论,关于辩论精准医学的内涵,各种观点都有,我自己实在,精准医学的核心只不过就是一点,十分具体,就是组学大数据跟医学的融合,说道得更加明确一点,就是组学大数据跟临床医学的融合。也就是说,把组学大数据中用临床的医学当中来,提升医疗临床的准确度,提升化疗的效果。

这里又还包括两层含义,一个含义是组学大数据,另外一个含义是医学。那么组学大数据又还包括两层含义,一个是组学,一个是大数据,我们告诉,近年来,随着临床研究的发展,我们取得了更加以基因组为代表的分子水平的人类信息,这个是以前前所未有的。那么,随着以基因组为代表的组学数据的发展,人们更加多的累积了以遗传密码为代表的某种程度是基因的信息,也还包括蛋白的信息,那么后来,人们找到,挖出这些信息以后不会获得很多的体现人类身体健康和疾病的信息。

所以有人明确提出,如果把这些信息应用于到临床当中来,一定会提升临床的效果,这就是所谓精准医学的本质含义。但是,只取得这些遗传密码的信息是过于的。大家告诉,所有遗传密码的信息都是十分十分多的一个大数据,这个大数据大家是很更容易测出的,还包括我们现在告诉在我们国内,每个人花一万块人民币就可以获得你的遗传密码,但是你获得你的遗传密码你是一点都不懂,因为这只有四个字(A、C、G、T),所以要背诵他,你就要发展大数据分析的理论方法和技术。所以,那么要把这些组学数据用大临床当中来,必需是组学数据和大数据分析方法的融合。

所以一部分是组学大数据,一部分是医学,两个融合一起,就包含了现在精准医学的本质和核心,这是第一个问题。关于精准医学的本质,他也是自上世纪90年代由于组学数据中用临床当中,发展转化成转化成医学,个体化医学,现在从2011年有出有了精准医学的名称,但不管怎么说道,都是他的本质是确切的,就是组学大数据在临床医学当中的应用于。2. 精准医学有可能转变医疗身体健康的基本概念第二个问题:精准医学需要使医学带给哪些本质的变化。

如果精准医学只是把医学提升一点点百分数的话,我想要,那么精准医学就不一定会引发更加多领导人的留意。就精准医学的内涵,一定会有一些本质上的变化,那么这个本质上的变化是什么?我们也用一句话来说,精准医学他的本质上所以引发各国领导人的推崇,是精准医学有可能转变医疗身体健康的基本概念,也就是说,促成医疗的基本概念从当前的临床化疗转变成身体健康确保。我们告诉,现在的医疗体系面临的是病人,那么他主要是对病人展开所谓的化疗,但是,未来因为精准医学的发展,由于组学大数据的插手,那么就不会使得这个时候的身体健康某种程度是对病人,而是对全民,对任何人在他没患病的时候我们测量他的组学数据,分析组学大数据,那么就可以对他未来身体健康发展的危险性因素作出评估,根据评估展开必要介入,这样的话有些疾病不发展,有些疾病减低他的程度,提升他的生活质量,这样就把整个医疗身体健康体系的关口后脚,在没病之前就明确提出评估与确保。(未来医学的三个趋势)这样一个根本性的概念的改变,有人指出,有可能造成一些新兴产业的经常出现,有人预估,跟所谓精准医学涉及的这个概念改变造成的新型,或许到2018年或许到2千亿美元的改变,也就相等于将近2万亿人民币,对GDP就有影响。

这种有精准医学带给的本性概念的转变由此促成的产业的发展当然不会引发各国领导人的留意,这是第二个方面,关于精整医学他有可能带给的一些本质变化的估量。精准医学研究已沦为新一轮国家科技竞争与引导国际战略的制高点。

大家告诉美国要测量100万自然人的遗传密码,欧盟也在大力推展所谓精准医学的研究,还包括英国、法国等等,日本也在展开精准医学涉及的投放和计划。那么精准医学我们如何仔细分析,他有可能在哪些方面促成产业的变革和发展呢?我想要最少在四个方面:第一个可以促成海量的生物样本库和数据库的发展。大家告诉,由于精准医学的推展,那么必须测量百万人量级的这些人的组学信息,首先牵涉到到这百万人生物样品的提供,交给、萃取和获取给这些人用于,这当然是一个相当大的产业。

同时,这些样本测完了数据是百万人数量级的一定要增进适当的大规模的数据库的发展,有人估算,这个产业的规模有可能是百亿数量级。第二个有了这些样品,那么就要测以基因组为代表的这些组学数据,所以就要测基因组、蛋白组、mRNA组,这些测序的数据,意味着到2018年,就可以到117亿美金的规模。那么有了样本库,有了组学数据的测量,那么下一步在这些海量数据挖出的基础上,就可以增进产生大量的新的分子临床的指标。

我们告诉,就不会减少很多跟疾病相关的信息,这些信息当中,有很多就可以作为新的疾病的标记。同时,也可以找到很多新的药物设计的靶点,这就增进了第三个产业,也就是所谓分子临床和药物设计靶点的涉及产业。第四个当然预示着精准医学概念而产生的新的医疗设施,比如说要正式成立一些身体健康源,要一些身体健康师,这些方面是可以和现在医院、医生互为关系的产业大约是千亿数量,这些产业必定不会带给变革,国内早已有所反映,有成百上千个小的公司在渐渐地正式成立了。

当然他们怎么来更佳的发展,尚待辩论。(精准医学将造就基因测序、分子临床、个体化化疗等市场规模的不断扩大)我们国家的精准医学发展目标我不赘述了,跟国际是完全一致的,这第二个方面,精准医学可以带给哪些本质的变化,如何增进产业的发展,在那几个产业发展可以造就或引领。3. 如何才能精准?第三个我要说一个问题是要构建精准医学,要做到哪些点?做哪些点,才能做精准?那么精准医学我实在最少要不具备两个条件,第一个,要不具备组学大数据的基础,我们告诉,精准医学就是把两组大数据中用临床当中来,所以第一个你要提供组学大数据,那么也就是提供基因组,蛋白组、转至组、新陈代谢组等等这些组学数据,这些数据本身是没用的,第二步就是组学数据的挖出,挖出的话就不会中用大数据分析的理论方法,还包括刚才张钹院士谈的人工智能的方法,深度自学的方法等等,以科学知识为基础的方法用来挖出这些组学,以取得在分子水平上跟疾病相关的科学知识,这是第一个基础。

(精准医学的基础)有了这些分子科学知识和组学科学知识的中用临床疾病当中来,还要创建第二个基础,就是搭起分子水平的以基因型为代表的信息核,创建这种桥梁之后才能有效地把分子水平的信息转化成应用于到疾病的临床和化疗当中来,那么这就是要创建所谓生物信息学、生物网络,系统生物学等等的方面,有了这两个基础我们就可以更佳地构建精准医学,当然一个十分最重要的就是精准医学的发展,是应该和当前的临床的影象学、临床的生化检验、当前临床的科学知识很好地融合下,并不是有些公司他测量的序什么都要求了,实质上不是那样,是应当更佳地融合一起才能更佳做精准。精准医学只是把新的数据应用于在原先的数据上使得更佳地提升。4. 精准医学才刚上路第四个说道的精准医学现在在什么阶段,发展到什么阶段?大家告诉,有可能我们目前精准医学沦为大家的热词以后,大家指出我们现在什么都可以精准,医学很更容易精准了,我个人的观点,精准医学只不过虽然是本质上有可能带给变革,有可能引领新的产业的发展,或许产业规模是极大的,但是现在才刚上路,才刚刚开始!为什么?是在精准医学的概念下,我们目前仍然不存在着极大的挑战,我们仍然不存在着极大的艰难。因此,我下面不会荐一两个例子来解释精整医学目前不存在什么样的艰难?为什么说道精准医学才刚上路呢?我们的创意的机遇在哪里,我们迎接挑战在哪儿?我拿组学当中只举一个例子,在我们的临床密码当中,在我们的组学当中,目前,还不存在着大量的暗信息,所谓我们的自己的遗传密码目前我们需要从规律上分析的只有一小部分,其他还无法分析的就是基因组当中的所谓亮信息。

我们一个人的遗传密码信息是3*10的九次方,如果装订成册,每3千个字符一页,100页印刷层一册,那就是一万册。如果一万册书每一册一厘米,我们自己的基因密码书就是就是一百米,大家可以想象,你自己的遗传密码从地面的中央到四十层楼房那么低,如果你全部背诵了,你就精准。

365彩票

我坚信没谁能精准,我现在要告诉他大家的是集全世界科学家的智慧,还包括生物医学家的智慧,这本天书世界上需要从规律上理解的部分只有遗传密码的3%,另外的97%实质上集目前全世界的智慧还不懂。迄今为止我们的遗传密码97%是亮的,我想要在下面给大家做到一些进行性的解释。

(2010年science杂志评选的“新世纪10年卓越找到”:基因暗物质)首先从遗传密码来讲,我们只不过,我们的97%的遗传密码,从总体,从规律上来讲,我们人类还不理解,那3%我们理解的就是指中学大家就告诉的,尊从中心发展的蛋白质信息,那3%就是建蛋白质的遗传密码,我们告诉他的归类了,也告诉他的信息,但另外的97%的遗传密码是跟生产蛋白组牵涉到的,这些信息,迄今为止我们不告诉他做到什么用的,这就是遗传密码当中的所谓暗物质,也是遗传密码当中的非编码序列,那么这个概念,大家可以想一想,当我们测遗传密码,而97%的密码还不告诉的情况下我们如何做精准呢?所以离精准还差了很相当大的距离。(有所不同生物基因解码的程度)转入21世纪科学家明确提出问题,说道这些我们还不理解的、占到人类基因组97%的暗物质遗传密码,那否有mRNA产物,否有信息派发?换句话说,他否在活动,在行使功能呢?这个结果是100%认同的,这些非编码序列和我们生产蛋白的那些基因一样,每时每刻都在传达,每时每刻都在起起到,所以他们也是确实地已完成生物学功能,那么这些东西我可以荐几个例子解释,他跟肿瘤的关系,当然,虽然我们不全部理解它,但是早已有些支离破碎的例子解释他的生物学功能。

比如说有一个来自97%的这样一个产物,它叫PCGEM1,可以造成前列腺癌,不是由于蛋白引发的。还有MALAT-1,它可以造成非小细胞肺癌,我们大家告诉我们国家肺癌是增长速度中,我们现在临床医院当中,检测肿瘤用的指标都是我谈的3%,而化疗的靶点你用的药物也是对那3%,我现在告诉他你,那97%,有很多例子证明,他也与肿瘤有关,但根本没划入到我们临床之临床和化疗当中来,你想要这个肿瘤能清领得好吗?你没考虑到他,当然没想起检测和化疗他,就是说,我们还有一个97%与疾病情况有关的东西目前为止没那么带入到我们临床化疗的视野当中,这就是精准医学面对着组学的所谓的暗信息的极大挑战。(长链非编码MALAT-1 RNA与肺癌的关系)我们告诉那个97%(的遗传暗物质信息)是和我们疾病,和我们的身体健康息息相关。

我们有多少这样的编码没找到呢?我们大约有25000个基因,那些97%的我们现在能无法评估一下,他有多少原件呢?因为伦理上的原因对人我们还不告诉,遗传研究所对老鼠做到过研究,把所有的原件都当作,管你是编码还所谓编码,一共找到的18万1千个,这是在老鼠里面确实继续执行功能的原件的上限,实质上一定会比他大,在这里找到,产生意义的3%要求了两万个原件,换句话说我们还有16万1千个(非编码RNA)来自那97%,这16万1千个据我所知,目前我们全世界科学家解析了约1千个,换句话说,还有16万个机会,有过于多的机会有些十分最重要的元件功能的找到。这些领域2016由这两位就是在那97%研究当中,我曾多次进过一个笑话,大家算算,从1900年研究那3%约创下了50名诺贝尔奖获得者,现在告诉了还有97%,97比3,那个约是1300左右,所以我们有一千多个机会在这个领域作出诺贝尔奖级别的原创性类似贡献,而只有一个方位被占有,所以我们还有极大的机会。(大量非编码RNA蕴藏大量的机会)因此,我们从精准医学来讲,我们现在只不过无法做到的精准是因为有一个极大的大数据,只是所指他的内涵并没被挖出,但是另一方面,他可以给我们获取一个全新的机会,不管对技术研究还是产业发展都有极大研究,所以对非编码的研究毫无疑问不会对疾病的临床化疗获取全新的临床方向,或者对药物的设计研发获取新的平台,对新的物种,新的性状的培育获取一个新的基础,对于组学的方向有很多,精准医学只不过才刚刚开始。

大家都是大数据的专家,我想要我不能十分慢的说道说道题目,只不过对大数据的分析,仍然不存在着有些核心的挑战,第一个数据量大,大家告诉,现在的测序仪一个普通的一次运营就可以到1T的数据,全世界有成千上万个这样的仪器,还包括我的组里就有所谓的获得一个T的数据,所以这些数据量是十分大的。那么每个人有3×10的九次方。这个数据告诉他大家,从数据质量来讲,他的噪音很高,同时又大量缺陷值的这样一个数据源。

第二个样本较小,我们要解决问题肿瘤的问题,但是我们告诉肿瘤的变量,自变量有可能成前上万,但是我们采样本只有百数量级,因此我们为什么要测,比方要研究肿瘤或者是心脑血管病,他的自身变量千数量级,我们的百万级,就像政府,测一百万人总够了,第二个,我们创建适合的数学模型,利用人工智能和机器学习等方法,使得我们需要相匹配。大家告诉某种程度是组学数据,也还有生物学数据,更加必须我们某种程度是科技界,企业界,我们告诉我们国内数据共享不存在基本一个最重要的问题,如果一个数据共享问题不解决问题,我们就是在大数据时代做到小数据的工作,公开发表小数据的企业,似乎365彩票无法适应环境国际竞争的态势。后面我谈的很坚硬,对不起,闲置大家的时间,谢谢!在陈润生院士做完演说后,(公众号:)记者也对陈院士展开了一段时间专访:问:精准医疗目前最主要的挑战在哪里?问:我们的挑战很多。

精准医疗的基础是组学大数据,还包括组学和大数据都不存在着挑战。比如组学,我们很更容易测量获得数据,但对数据的内涵大部分我们并不知道。

从大数据的挖出本身也有很多问题,今天没时间进行谈,还包括数据本身生物学含义的挖出,还包括数据样本、数据集本身的缺失比如说缺陷值,还有原件之间的相互作用等,都仍然不存在很多问题。但从另外一方面谈这是机会,我们对于不得而知数据的研究,理解一点,我们就可以前进一点,然后应用于一点,从而推展整个精准医疗的发展。问:我们展开精准医疗研究的条件和国际比起如何?问:最近这么多年,我们国家对精准医疗的推崇、还包括对基础研究方面的投资,实质上从技术条件和研究上来讲并不不存在显然艰难,艰难来自于科研当中的的组织等各种方面的问题,以及基础研究如何从思想上来提升创意意识。

从公开发表论文方面,我们是次于美国的第二名,但最重要的是做自己的独创性研究,而不是追随。问:您有提及“必须百万级别的样本”,我们早已告诉像Deepmind、23andme等企业早已在与卫生部门和医院合作提供百万级别的样本数据,我们国内有类似于的例子吗?问:国内有一些项目,如精准医学研究的计划就计划测100万数据,而且也在展开中。但是我实在测哪个100万数据并不最重要,最重要的是我们有很多数据,必须有一个机制去统合一起,这样比你大大测试新的数据更加最重要。嘉宾概述陈润生,生物信息学家,中国科学院院士。

现为中国科学院生物物理研究所研究员、博士生导师。国际人类基因组的组织(HUGO)会员。在基因标示、生物进化、SNP数据分析、生物网络、非编码基因等方面展开了系统、了解的研究,曾参与我国第一个原始基因组泉生热袍菌 B4基因组序列的装配和基因标识,曾参与人类基因组1%和水稻基因组工作草图的研究。

近年来主要专门从事非编码RNA的系统找到与功能研究。原创文章,予以许可禁令刊登。

下文闻刊登须知。|365彩票。

本文来源:365彩票-www.barsublime.com

标签 365彩票
热门推荐