2017年国家自然科学基金天元数学专题讲习班项目《图像处理高级研讨班》纪要
2017年国家自然科学基金天元数学专题讲习班项目《图像处理高级研讨班》于2017年7月28日至8月2日在杭州举办。本次研讨班由浙江大学数学科学学院承办,邀请了国内知名学者讲解图像处理方面的理论方法和最新进展。来自浙江大学、中山大学、华东师范大学、哈尔滨工业大学、北京师范大学、上海大学等国内33所院校的70余名学生和老师参加了研讨班。
研讨班开幕式由浙江大学图像处理研发中心主任孔德兴教授主持。他介绍了此次研讨班的课程安排,并总结了近年来国家自然科学基金委在图像处理领域的资助情况,分析了今后几年该领域的重点资助方向及如何开展前沿性和交叉性研究。南京大学杨孝平教授和中山大学姚正安教授参加开幕式并致辞。两人分别介绍了自己所在单位在图像处理方面的科研现状,希望所有学员能在研讨班期间努力学习,互相交流,提升自己的科研水平,为我国在该领域的科研实力与影响力做出贡献。
一、研讨班主要内容
本次研讨班邀请了8位老师为学员授课,内容大致可分为图像处理的数学理论和技术、静息态功能磁共振图像处理、FPGA和Open CL与图像处理三部分。具体内容如下:
(一)图像处理的数学理论和技术
中山大学的郑伟诗副教授以多模态视频图像理解为题,讲解了在动作识别和前期预测方面一些轻量化和快速的多模态数据分析模型。他认为,依赖单模态数据往往不能全面感知数据,难以获得鲁棒特征表达,而多模态数据是异质的,如能构建异质特征的关联模型,分析它们之间的差异性,建立关联模型和差异度分析的协同学习模型,并结合机器学习建立多模态数据模型,就可以获得比单模态数据处理更高精度的性能。
浙江大学的莫群副教授主要讲解了压缩感知的理论基础及运用。理论基础包括信号的稀疏表示、观测矩阵、重构算法三部分。在稀疏表示方面,他除了介绍一些经典稀疏方法外,还讲解了信号在冗余字典下的稀疏分解。在观测矩阵方面,他向学员说明了设计目的和限制条件——观测基矩阵与稀疏基矩阵的乘积满足有限等距性质,从而保证能够从观测值准确重构信号。而在重构算法方面,他分析了贪婪算法和凸优化算法这两大算法的优缺点。在此基础上,他总结了一些基于压缩感知理论的用于图像复原、去模糊、融合与压缩、特征提取与识别等处理的算法。
电子科技大学的李纯明教授的授课内容主要为图像分割及其医学应用。他以主动轮廓模型和水平集方法为核心内容,辅以偏移场估计和Multi-atlas方法,讲解了如何在灰度不均一的情况下建立区域分割模型。以分割左心室和右心室为例,原始医学图像可能会有区域间对比不明显、区域内灰度不一致、乳腺肌肉与心肌灰度差不多等问题,但通过曲率和凸性处理、双层水平集表现、距离正则化、时间层校正等手段,校正图像能更清晰的看到各区域的位置,分割效果更佳。随后,他提到今后研究的方向将放在与机器学习结合以及加速研究不同的分割算法上。
华东师范大学的沈纯理教授的授课内容主要为图像配准和脑电波处理。图像配准的内容包括点云配准、多模态图像配准、大尺度形变图像的配准等几个方面。他着重介绍了一些配准算法,并讲解了它们的演变方程。在讲点云配准时,他展示了一种在李群框架下用于多维点集的仿射配准算法。面对多模态图像,他提到使用核方法,并利用再生核希尔伯特空间来简化计算。而针对大尺度形变图像,他介绍了微分同胚配准算法。而这些算法能给图像处理带来鲁棒性和精确性。与此同时,他还讲解了一些去噪去模糊问题和处理方法。脑电波处理的内容包括EEG正问题和反问题、信号源定位、稀疏编码及增强平整度、EEG重构、相关算法等。他重点提及图形分数阶总变分处理EEG重构,一阶原始-对偶算法和坐标更新法处理凸函数最优化问题。至于今后的工作,他希望能基于EEG信号分类,将字典学习同整个框架结合起来。
(二)静息态功能磁共振图像处理
杭州师范大学认知与脑疾病研究中心主任臧玉峰教授介绍了静息态功能磁共振的概念、背景、特征、分析方法、相关应用等内容。他提到,与任务状态功能磁共振相比,静息态功能磁共振具有设计简单、基线控制容易、便于研究持续的神经活动等特点。而静息态功能磁共振图像的分析方法大致可分功能整合、局部功能、脑网络等几类,常见的分析算法有种子相关分析、独立成分分析、ICA分析、层次聚类、自组织映射、图论及小世界网络等。随后,他还展示了Meta-Analysis在脑障碍患者的静息态功能磁共振上的应用,以及如何通过深部脑刺激、经颅磁刺激、经颅超声刺激等方式进行脑异常活动的精准定位。
基于臧玉峰教授的课程内容,杭州师范大学认知与脑疾病研究中心科研助理贾熙泽详细介绍了静息态功能磁共振的数据处理软件REST,包括该软件的开发背景、功能设置、数据分析操作等。REST软件可对静息态功能磁共振的数据进行事前处理和事后处理,然后对数据进行分析。事前处理需要经过将DICOM转换NIFTI、去除前几个时间点、时间层校正、移动修正、数据标准化、空间平滑、去线性漂移、回归去除噪音、低频率滤波等步骤。事后处理则根据ALFF、fALFF、KCC Re-ho、Functional connectivity、Degree centrality等方式的不同选择性的调整上述步骤。而数据分析的方法包括T检验、方差分析或协方差分析、效应值、相关分析等。用户可以根据科研需求选择不同的分析方式,并在Viewer中查看结果。此外,该软件在Utilities还设置了ROI信号提取、切片重组、3D磁共振脑灌注成像技术标准化等功能。
(三)FPGA和Open CL与图像处理
英特尔的工程师袁亚东以Altera FPGA为例,向学员介绍了FPGA的设计工具和流程,包括IP的生成、引线分配、时序分析、故障排除四个示范,以及其在图像处理中的运用。首先,他解释了FPGA的可编程逻辑,并强调FPGA具有高密度创建许多复杂逻辑功能、高性能、整合许多功能、具有许多可获得I/O标准和特征、预建IP模块等优势。接着,他介绍了Quartus II开发工具和要点,包括设计输入的方法、物理限制输入、时序限制输入、创建一个设计、适配后设计分析、硬件输入和故障排除等内容,并进行了各步骤的代码演示。最后,他提及FPGA图像处理技术能获得很好的处理效果,而且处理速度也远远高于软件方法的处理效率。
接着FPGA的内容,英特尔的另一位工程师余洋洋向学院介绍了Open CL语言。他讲到,Open CL由一门用于编写kernel的语言和一组用于定义并控制平台的API组成,它提供了基于任务分割和数据分割的并行计算机制,英特尔使用该语言进行FPGA开发。随后,他介绍了Platform、Device、Context、Program、Kernel、Memory Object、Command Queue、NDRange等基本概念,详细讲解了获取Platform、获取Device、创建Context、创建Command Queue、创建Memory Object、创建编译Program 、创建Kernel、设置Kernel参数、设置Group Size、Kernel入队执行、读取结果、释放资源12个编程步骤,并演示了代码操作。之后,他还讲解了Open CL的执行模型和内存模型,让学员了解GPU并行运行的原理。
二、研讨班主要成果
通过6天的学习,学员们普遍加强了图像处理中数学方法和技术的认识,熟悉了静息态功能磁共振图像处理的方法和软件使用,了解了Altera FPGA设计和Open CL语言编程。
本次研讨班为各高校的学生和老师的相互交流提供了一个重要平台,让他们多视角、多层面地深入最新研究动态,促进了高校间的合作,对该领域的科研工作起到极大的推动作用。