科学研究

学术讲座

当前位置: 437必赢会员中心网页版 >> 科学研究 >> 学术讲座 >> 正文

437必赢会员中心网页版2024年系列学术活动第二十五场

发布日期:2024-08-13    作者: 必赢官方网站首页     点击:

(通讯员:关迪)2024812日上午9:00,首都师范大学崔恒建教授莅临我院做学术报告,报告在南湖校区老图四楼会议室进行学术报告进行。437必赢会员中心网页版副院长杨凯副教授主持会议,学院部分老师及研究生参加了本次学术报告会。

报告人简介:崔恒建,首都师范大学教授,博士生导师,中国科协第十届全委会委员,曾任国务院学位委员会学科评议组专家。中国科学院系统科学研究所博士毕业。在大数据统计建模、高维统计及其稳健统计理论和方法、统计机器学习、金融统计、以及质量管理等领域取得过许多重要的研究成果,发表论文180余篇,其中包括发表在国际顶级的统计和计量经济学杂志JASAAoSJRSS(B)BiometrikaJoE上。主持国家自然科学基金重点项目项目多项。现担任《数学学报》和《应用数学学报》中、英文版以及《Statistical Theory and Related Fields》编委,中国现场统计研究会副理事长,全国工业统计教育研究会副理事长,北京应用统计学会会长,国际数理统计学会(中国分会)常务理事。曾获得教育部高等学校科学技术奖-自然科学奖二等奖;全国统计科学研究优秀成果奖一等奖等。

报告题目:Model-free Feature Screening Based on Hellinger Distance for Ultrahigh Dimensional Data

摘要:With the explosive development of data acquisition and processing technology, the dimension of features increases exponentially with the sample size, which poses great challenges for data analysis. It is vital to accurately identify useful features from thousands of them. In this paper, we develop an omnibus model-free feature screening procedure based on the Hellinger distance with some appealing merits. First, we define the Hellinger distance index for discrete response variables in discriminant analysis. Second, this procedure works consistently for continuous response variables, in which the continuous responses are discretized by slice-and-fused technique. Third, it is robust to the potential outliers and model misspecification. Theoretically, the procedure for discrete and continuous response variables possess sure screening properties and ranking consistency properties under mild conditions. Numerical studies demonstrate that this procedure exhibits strong competitiveness in heavy-tailed and skewed data, while remaining comparable to existing approaches for light-tailed data, indicating its robustness performance across a range of data. Real data contains two examples, discrete and continuous response variables, to illustrate the effectiveness of the proposed method.

会上,崔恒建教授分享了最新研究。介绍了一种基于Hellinger距离的综合无模型特征筛选算法。研究表明,该算法在重尾和偏斜数据中表现出较强的竞争力,同时与现有的轻尾数据方法保持着一定的可比性,其在一系列数据中仍具备鲁棒性。在实例数据包含离散响应变量和连续响应变量两个示例上,均说明了所提算法的有效性。

会后,同学们踊跃提问。本次报告会为师生们呈现了一场干货满满、精彩纷呈的学术盛宴。师生们表示,崔恒建教授的报告内容丰富、站位高远,深入分析了当前的发展趋势、遇到的难题挑战和未来发展的方向及路径。


(审核人:王丹、王纯杰)

437必赢会员中心网页版

2024812


上一条:437必赢会员中心网页版2024年系列学术活动第二十六场

下一条:437必赢会员中心网页版2024年系列学术活动第二十四场