2018年11月22日下午2点30分在林园校区教学图书楼705室,为了加强同学们对数学世界的了解,感悟数学知识的强大,增强同学们的学习兴趣,437必赢会员中心网页版荣邀中国科学院李启寨研究员莅临我院做学术报告。报告由学院副院长王纯杰主持,学院副院长徐平峰、学院部分老师、研究生、及本科生和其他学院师生参加了本次学术报告会。
报告题目:Bayesian neural networks for selection of drug sensitive genes
摘要:
Recent advances in high-throughput biotechnologies have provided an unprecedented oppor tunity for biomarker discovery, which, from a statistical point of view, can be cast as a variable selection problem. This problem is challenging due to the high-dimensional and non-linear nature of omics data and, in general, it suffers three difficulties: (i) an unknown functional form of the nonlinear system, (ii) variable selection consistency, and (iii) high-demanding computation. To circumvent the first difficulty, we employ a feed-forward neural network to approximate the unknown nonlinear function motivated by its universal approximation ability. To circumvent the second difficulty, we conduct structure selection for the neural network, which induces variable selection, by choosing appropriate prior distributions that lead to the consistency of variable selection. To circumvent the third difficulty, we implement the population stochastic approximation Monte Carlo algorithm, a parallel adaptive Markov Chain Monte Carlo algorithm, on the OpenMP platform which provides a linear speedup for the simulation with the number of cores of the computer. The numerical results indicate that the proposed method can work very well for identication of relevant variables for high-dimensional nonlinear systems. The proposed method is successfully applied to identication of the genes that are associated with anticancer drug sensitivities based on the data collected in the cancer cell line encyclopedia study.
李启寨简介:李启寨,中国科学院数学与系统科学研究院研究员。2001年于中国科学技术大学获学士学位,2006年于中国科学院数学与系统科学研究院获博士学位,2006年-2009年在美国国立卫生健康研究院国家癌症研究所从事博士后研究,2006年7月至今在中国科学院数学与系统科学研究院工作,其中2006年-2010年任助理研究员,2010年-2015年任副研究员,2015年至今任研究员。主要从事生物统计、遗传统计、分组检测、高维统计推断等方面的研究。在自然遗传学,美国人类遗传学,英国皇家统计学会会刊B辑,美国统计学会会刊等杂志发表及接收发表SCI论文80余篇,被国际同行引用1600余次。
报告会中,李启寨老师结合自身多年的学习、教学和科研经验,从“生物标记”引出一个例子,介绍了两种变量选择方法:频率法和贝叶斯方法。接着,讲解了贝叶斯神经网络,用后验分布进行抽样,在理论的基础上,李老师给出了两个例子,用以说明理论的应用。最后,李老师对同学们提出的问题进行了详细的解答,也与学院里的老师进行了深入互动。
本次报告会使同学们对数学与统计学的知识又有了更宽泛的了解,提高了同学们的学习动力及学习积极性。一方面让同学们对统计学的发展前景有了更深刻的认识,另一方面让同学们对自己的未来有了更明确的规划。同时,不仅对外加强了我院的学术交流,而且对内营造了师生们良好的研学氛围。
437必赢会员中心网页版
2018年11月22日