欢迎访问浙江省数理医学会官方网站!(www.zsmm.org.cn)

专家座谈

您的位置:科普园地 >> 专家座谈

大数据:从数字医学到数据医学

作者:作者:秦建增
来源:中华医学会数字医学分会 发布时间:2016/6/14   [收藏本文]

秦建增

南方医科大学中医药学院 510515


摘要:通过对大数据的特点和大数据对生命科学领域带来的巨大影响的分析,提出了从数字医学向数据医学转变的大趋势,提醒我们应及早更新观念,加强协作,做出成绩。

关键词:大数据    数字医学    数据医学


“大数据开启了一次重大的时代转型。就像望远镜让我们能够感受宇宙,显微镜让我们能够观测微生物一样,大数据正在改变我们的生活以及理解世界的方式,成为新发明和新服务的源泉,而更多的改变正蓄势待发……”——维克托·迈尔-舍恩伯格。


一、大数据不仅仅是数据量巨大,更重要的是让我们跨入了一个新时代,改变我们理解世界的方式。

1. 数字化是基础

数字化指的是把模拟数据转换成用0和1表示的二进制码,这样电脑就可以处理这些数据了。20世纪90年代,我们主要对文本进行数字化。随着过去的几十年里存储能力、处理能力和带宽的提高,我们也能对图像、视频和音乐等类似的内容执行这种转化了。

甚至在2000年的时候,数字存储信息仍只占全球数据量的四分之一,当时,另外四分之三的信息都存储在报纸、胶片、黑胶唱片和盒式磁带这类媒介上。在2007年,所有数据中只有7%是存储在报纸、书籍、图片等媒介上的模拟数据。到2013年,世界上存储的数据预计能达到约1.2泽字节,其中非数字数据只占不到2%。数字化使信息的海量存储成为可能,是进入大数据时代的基础条件。

2. 数据化是关键

数据化和数字化大相径庭。“数据”(data)这个词在拉丁文里是“已知”的意思,也可以理解为“事实”。数据代表着对某件事物的描述,数据可以记录、分析和重组它。数字化完成了从模拟信息到数字信息的转变,使信息的表达、存储、传输成为可能。数据化则使数字化的信息再利用成为可能。

3. 从量变到质变

大数据时代的到来不是一蹴而就的,正如宇宙天文信息那样,尽管这些数据已经存在那里,但是,人类无法获取、表达、存储和利用这些信息,随着计算机技术的发展,数字化和数据化成为可能,云存储和云计算技术的发展,数据存储的数量发生了巨大变化,数据从TB级到PB级的转换,这种变化,完成了从量变到质变的积累。

4. 大数据时代的新思维

大数据时代,由于数据信息量之大、类型之多导致人类单纯靠自己的大脑和普通的计算机无法实现,从而促使我们对大数据时代的新思维方式的出现。大数据的精髓在于我们分析信息时的三个转变,这些转变将改变我们理解和组建社会的方法。第一个转变就是,在大数据时代,我们可以分析更多的数据,有时候甚至可以处理和某个特别现象相关的所有数据,而不再依赖于随机采样。随机采样是小数据时代的折衷办法,即设想通过最少的数据获得最多的信息,大数据时代实现了全数据模式,即样本=总体。第二个改变就是,研究数据如此之多,以至于我们不再热衷于追求精确度。在小数据时代,追求精确度是合理的。因为当时我们收集的数据很少,所以需要越精确越好。如今这依然适用于一些事情。但是对于其他事情,快速获得一个大概的轮廓和发展脉络,就要比严格的精确性要重要得多。第三个转变因前两个转变而促成,即我们不再热衷于寻找因果关系。在小数据时代,我们会假想世界是怎么运作的,然后通过收集和分析数据来验证这种假想。在不久的将来,我们会在大数据的指导下探索世界,不再受限于各种假想。我们的研究始于数据,也因为数据我们发现了以前不曾发现的联系。


二、大数据时代,重新认识生命科学。

1. 从个人到循证到大数据

随着科学技术的发展,临床医学逐渐从基于个人经验,转向需要寻找更可靠的证据,循证医学应运而生。由于采用多中心随机对照的临床试验获得的结论更加可靠,所以,通过多中心随机对照试验得到的结论被认为是最高级别的证据。但是,任何临床试验,无论通过多么严谨的设计,临床的复杂性都无法完全控制,所以,其得到的结论也具有一定的局限性。也就是说,无论怎样严谨的抽样,都会存在抽样误差,都不能全面准确地反映总体情况。随着计算机信息技术的发展,医学大数据时代也即将到来,一旦全人类的健康数据得到联网,我们不再需要通过抽样获得数据,全人类的健康数据就是一个整体数据,基于证据的医学将从大数据获益,并转而成为基于数据的医学。

2. 从医生到数据专家

在没有大数据的年代,医务工作者必须是通过专业学习和专业培训,获得相应资质的人员,随着大数据时代的来临,医务工作领域将出现一类新的专家,医学大数据专家,他们可能并不懂医学专业知识,但却能对医学的发展起到巨大的作用。

2009年出现了一种新的流感病毒。这种甲型H1N1流感结合了导致禽流感和猪流感的病毒的特点,在短短几周之内迅速传播开来。在甲型H1N1流感爆发的几周前,互联网巨头谷歌公司的工程师们在《自然》杂志上发表了一篇引人注目的论文。它令公共卫生官员们和计算机科学家们感到震惊。谷歌公司总共处理了4.5亿个不同的数学模型,再将得出的预测与2007年、2008年美国疾控中心记录的实际流感病例进行对比后,谷歌公司发现,他们的软件发现了45条检索词条的组合,将它们用于一个特定的数学模型后,他们的预测与官方数据的相关性高达97%。和疾控中心一样,他们也能判断出流感是从哪里传播出来的,而且判断非常及时,不会像疾控中心一样要在流感爆发一两周之后才可以做到。所以,2009年甲型H1N1流感爆发的时候,与习惯性滞后的官方数据相比,谷歌成为了一个更有效、更及时的指示标。惊人的是,谷歌公司的方法甚至不需要分发口腔试纸和联系医生——它是建立在大数据的基础之上的。

3. 从治疗到预测

医疗模式在逐渐从治疗向预防的转变,如何从海量的医疗和健康数据中发现规律,及早提出预防建议,要比病后治疗更有意义。随着大数据时代的来临,基于大数据的预测成为可能,为及早提出保健计划提供了依据。

美国零售商塔吉特公司可以在完全不和准妈妈对话的前提下,通过大数据技术预测一个女性会在什么时候怀孕。杜西格在《习惯的力量》(The Power of Habit)一书中讲到了接下来发生的事情。一天,一个男人冲进了一家位于明尼阿波利斯市郊的塔吉特商店,要求经理出来见他。他气愤地说:“我女儿还是高中生,你们却给她邮寄婴儿服和婴儿床的优惠券,你们是在鼓励她怀孕吗?”而当几天后,经理打电话向这个男人致歉时,这个男人的语气变得平和起来。他说:“我跟我的女儿谈过了,她的预产期是8月份,是我完全没有意识到这个事情的发生,应该说抱歉的人是我。”


三、从数字医学到数据医学

计算机技术、光电技术、各种医疗设备的发展,促进了医学从传统模拟信号时代向数字医学时代的转变,如今,几乎全部医疗数据均可以通过计算机数字技术表达、储存和呈现,数字医学已经基本实现。随着计算机信息技术的发展,特别是大数据的存储、传输和利用技术的发展,医疗大数据应用成为可能,数据医学时代即将到来。数字化技术是数字医学时代的代表和核心,大数据技术则是数据医学时代的关键,我们应当尽快转变观念,充分认识大数据对生命科学领域的巨大影响,重视基础架构的设计,加强协作,争取能在大数据时代,为生命科学领域的应用做出贡献。


参考文献:1.维克托·迈尔-舍恩伯格,肯尼思·库克耶.著,周涛译.大数据时代——生活、工作与思维的大变革.浙江人民出版社,2012年12月.

2.胡瑞娟,李岩芳,何昀.基于关联规则算法的医疗数据挖掘.长春理工大学学报(自然科学版),2009,32(2):282-284.

3.Duhigg,Charles.“How Companies Learn Your Secrets.” New York Times,February  12012(http://www.nytimes.com/2012/02/19/magazine/shopping-habits.html).

4.Brown,Brad,Michael Chui,and James Manyika.“Are You Ready for the Era of‘Big Data’?”McKinsey Quarterly,October 2011,p.10.

5. Davenport,Thomas H.,Paul Barth,and Randy Bean.“How ‘Big Data’Is Different.”Sloan Review,July 30,2012.




分享到:
相关文章
超声人工智能的现状及展望——美国托马斯杰斐逊大学放射系终身教授刘吉斌讲座
当医学遇上数学,医生做手术是这样的……
人工智能把“大专家”请进社区
中科院院士段树民告诉您:“大脑是可以捐献的!”
还可以输入 200 个字符

全部评论(0)

时间 热度