7月10日上午,清华大学在主楼接待厅举行统计与数据科学系成立大会。这是清华大学优化学科布局、服务国家战略的重要举措。
清华大学校长、中国科学院院士李路明,国家统计局党组成员、副局长蔺涛,清华大学数学科学中心主任、求真书院院长、中国科学院外籍院士丘成桐,中国数学会理事长、上海科技大学副校长、中国科学院院士席南华,哈佛大学统计系和生物统计系教授、美国国家科学院院士、美国国家医学院院士林希虹,宾夕法尼亚大学沃顿商学院讲席教授、国际数理统计学会主席蔡天文,哈佛大学教授、清华大学统计学研究中心荣誉主任刘军,中国科学院院士陈松蹊出席大会并致辞。清华大学副校长、中国科学院院士姜培学主持大会并宣读统计与数据科学系成立决定。相关领域专家学者、学会代表和学校相关单位负责人等百余人参加成立大会。
与会嘉宾共同揭牌
会上,李路明,蔺涛,姜培学,中国科学院数学与系统科学研究院研究员、中国科学院院士严加安,刘军,琶洲实验室(黄埔)主任、西安交通大学原副校长、中国科学院院士徐宗本,陈松蹊,林希虹共同为统计与数据科学系揭牌。
李路明讲话
李路明向与会来宾表示欢迎,向长期关心支持学校发展的社会各界表示感谢。他说,数据已经成为国家基础性战略资源。在全球科技竞争中,只有下好数据这个“先手棋”,才能占据优势地位、牢牢把握未来发展的主动权。清华大学成立统计与数据科学系,就是为了加强统计学与数据科学基础研究,积极促进学科交叉融合,把发展科技第一生产力、培养人才第一资源、增强创新第一动力更好结合起来,主动服务国家大数据战略实施和数字中国建设。
李路明回顾了学校在统计学与数据科学相关领域的发展历程并表示,当前,新一轮科技革命和产业变革深入发展,人类社会正在加速进入数字文明时代。面对崭新的发展机遇,一流大学作为国家战略科技力量的重要组成部分,理应有所作为,也必须有所作为。希望统计与数据科学系肩负历史使命、抓住历史机遇,落实立德树人根本任务,加强培养模式创新和课程体系建设;坚持目标导向和自由探索相结合,凝练基础研究关键科学问题美国哈佛大学博士后,开展多学科交叉研究;充分激发创新创造活力,加强关键核心技术协同攻关,更好发挥数据要素作用,支撑发展新质生产力;深化高水平科技开放合作,搭建国际化交流平台,主动融入全球创新网络,切实肩负起构建人类命运共同体的科技创新使命。
蔺涛、丘成桐、席南华、林希虹、蔡天文、刘军、陈松蹊致辞(从左至右,从上至下)
蔺涛向清华大学统计与数据科学系成立表示祝贺,希望以此为契机进一步加强国家统计局和清华大学的合作,打造一流学术研究平台,形成一批具有原创性和影响力的研究成果,共同为以中国式现代化全面推进中华民族伟大复兴作出新的更大贡献。
丘成桐回顾了与统计学、数据科学相关领域顶尖学者的交流经历并表示,希望统计与数据科学系与数学中心以及求真书院展开密切的合作,共同推动基础科学领域取得新的更大进步。
席南华代表中国数学会祝贺清华大学统计与数据科学系成立并表示,期待未来清华的智力资源在统计与数据科学领域大放异彩,有力促进统计与数据科学的长远发展。
林希虹说,清华统计与数据科学系的成立,既能极大促进清华乃至中国统计与数据科学的发展,又能更有效地促进多个科学领域的交叉研究。
蔡天文表示,当前统计与数据科学学科的发展尤为重要,一方面能够吸引顶尖专家学者研究统计学与其他科学领域交叉的前沿问题,另一方面也能培养造就大批优秀人才。
刘军表示,统计与数据科学系将致力于发展有较大社会影响力的统计思想和方法;发挥清华在工科、商科、医科、生命科学、社会科学等方面的有利条件,深入开展与这些领域的密切合作;发展互联网技术、大数据分析、人工智能等领域中的统计方法;培养一流统计与数据科学人才。
陈松蹊表示,统计学是以数据为研究对象的基础学科。未来统计学可以在统计与数据科学基础理论、人工智能和机器学习的统计基础理论、以及其他学科交叉的重点领域发力,实现以数据为其他学科赋能。
活动现场
统计与数据科学发展研讨会同期举行。徐宗本,普林斯顿大学讲席教授、比利时皇家科学院外籍院士范剑青分别以“大模型的极限理论”和“统计数据科学与经济社会”为题作主题报告。
清华大学在统计学与数据科学相关领域具有深厚的积累。我国概率统计学科的奠基人许宝騄1930年转入清华大学改学数学,1933年从算学系毕业,他是中国早期从事概率论和数理统计学研究并达到世界先进水平的一位杰出学者。1979年,清华大学重建数学系,并布局概率统计等方向,培养出以林希虹院士为代表的一批杰出统计学家。自2000年来,数学系教授林元烈、杨瑛始终致力于推动统计学科建设,并于2008年促成“统计讲席教授团”的设立,举办统计学讲座、开设统计学课程,极大地促进了统计学科的发展。2011年学校获批统计学一级学科博士学位授权点,2015年统计学研究中心成立仪式举行。清华工业工程系也为统计学发展提供了诸多支持。经过各方数十年地不懈努力,清华大学统计学在学术研究、学科建设、人才培养、社会服务等方面取得了长足进步,在数理统计、生物健康统计、统计机器学习及应用、经济与金融统计、工业统计与运筹学、交叉数据科学等重点应用方向形成了特色优势。
未来清华大学统计与数据科学系将紧密围绕国家大数据战略、人工智能行动以及《数字中国建设整体布局规划》,立足“四个面向”的战略导向,针对国家重大需求、重大战略、重要部门,培养国际一流的统计学与数据科学领域综合性、创新型高层次人才,以全球视野对标世界一流,努力将统计与数据科学系建设成为国内外知名的产学研一体化学术重镇。
2023年3月25日,由清华大学统计学研究中心、清华大学交叉信息研究院与微软亚洲研究院联合主办的机器学习基础理论研讨会( on and )在微软大厦顺利举办。本次研讨会邀请15名全球范围内机器学习领域的优秀学者,围绕最新的研究成果进行主题报告与分享,并针对当前机器学习领域的前沿问题展开深入交流与探讨。
微软亚洲研究院的张辉帅研究员代表主办单位致辞。他指出,机器学习近年来的发展日新月异,产生了大量应用成果在职研究生,而在领域前沿的研究中,机器学习理论发挥着至关重要的作用。同时,张博士介绍了本次会议的组织者,来自清华大学统计学研究中心的杨朋昆助理教授、清华大学交叉信息研究院张景昭助理教授以及微软亚洲研究院的孙丽君、杨格、张辉帅研究员。
来自研究团队的 研究员首先进行了报告。他的分享聚焦于神经网络的快速训练算法。当前,以GPT系列为代表的超大规模神经网络在实践中表现出了极好的性能,但在实践层面,超大规模神经网络的训练耗时过长且成本十分昂贵,没有巨额预算的研究人员和企业很难跟上前沿的发展。介绍了其团队在团队对于神经网络训练算法的最近研究成果,包括通用理论、细节的改进与实践经验等。改进后的算法将标准计算机视觉模型的训练时间减少了5-7倍,标准语言模型的训练时间减少了2-3倍。
普林斯顿大学的Boris Hanin助理教授报告了深度神经网络贝叶斯插值的最新研究成果。Hanin的结果表明,在贝叶斯估计的视角下,无限深度的线性神经网络可以基于普遍、未知的先验进行最优后验的计算。在技术细节方面,他提出了一个新的缩放参数,可以对后验分布的复杂性和有效深度进行较好的控制。
伊利诺伊大学香槟分校的Maxim 教授的报告主题为镜像朗之万动力学( )中的变分法则。镜像下降法是一种经典的对偶凸优化方法,它通过定义一个距离生成势函数(- )来刻画优化问题的几何结构。教授的最新工作给出了镜像下降及其随机版本的变分公式。隐式正则化的表述可以对该结果进行较好的解释。
斯坦福大学的李志远博士后分享了对于锐度感知最小化(-Aware , SAM) 的研究成果。SAM是一种重要的神经网络正则化方法上海mba,通过在神经网络优化中添加对锐度概念的惩罚项来实现更好的泛化性能。最新的结果通过对锐度概念的明确,在理论层面揭示了SAM的内在机制。特别地,SAM中的两个近似步骤分别都会导致不准确的中间结果,但在全梯度方法下,它们的组合意外地表现了良好的效果。
来自德克萨斯大学奥斯汀分校的刘强助理教授展示了他在最优传输( )问题上取得的新结果。最优传输问题是在给定成本函数下最小化从一组数据传输到另一组数据的总成本的问题。通过一个简明的框架——整流( flow),最优传输问题可以得到有效的求解。该算法只需要求解一系列非线性最小二乘优化问题,具有较高的计算效率。在实践中,通过该方法得到的ODE模型可以生成高质量的图像,且相较于扩散生成模型有显著的加速。此外,经过适当的修改硕士,这一方法可以推广到高维连续分布的最优传输问题。
斯坦福大学的Surya 教授在报告中展示了一种基于数据修剪的自监督算法。相比于以前的算法,基于数据修剪的方法更为简洁与节约,具有更强的可拓展性,且与当前最好的监督数据修剪算法具有相当的性能。进一步地,这一工作包含了网络规模的数据修剪,实验将已经高度筛选的440M LAION图像-文本对子集修剪到270M,而不会影响下游任务的准确性。因此,这一方法体现了合理的数据选择对机器学习模型性能提升的重要性。
微软亚洲研究院的董力研究员展示了他对大型预训练语言模型语境学习(In- , ICL)能力的研究成果,提供了对ICL的性能优越性的一个理论解释。具体而言,可以将语言模型解释为元优化器,并将ICL理解为一种隐式调整。从理论上讲,可以证明的注意力机制具有梯度下降的隐式形式:GPT首先生成元梯度,然后应用其以构建ICL模型。实验结果也表明ICL的各项指标与显式的调整类似。此外,受此启发,一种基于动量梯度下降算法的注意力机制也得以提出。
微软研究院的 研究员通过简单的稀疏编码模型,分析了中出现的现象。实验说明,训练该模型的神经网络时,在较大的学习率下,其收敛性质不稳定,会出现剧烈的振荡现象。分析表明,这一现象主要是由模型的非凸结构所导致。
上海交通大学的许志钦助理教授在报告中展示了他对于深度学习参数凝聚现象的研究。许老师首先提出了神经网络中的一个问题:为什么复杂的神经网络能够有好的拟合效果?在训练过程中,神经网络有两个隐性的规律,一个是频率原则,另一个是参数凝聚现象,后者作为非线性训练过程的特征,会使得训练样本的数量有效地降低。基于凝聚现象,许老师通过秩分析方法定量地理解了对于一个过参数化的神经网络美国哈佛大学博士后,on 【动态】陈松蹊院士引领书院学子走进统计与数据科学,需要多大的数据集来保证其拟合效果较好。
东京大学的 教授介绍了关于重要性加权方法( )的最新进展,并且将其用于解决分布偏移问题。在这次演讲中,他概述了在基于重要性加权的分布偏移问题的自适应方法,以及他最新的进展,包括对于协变量偏移的自适应估计,动态重要性加权对于联合分布偏移的自适应,以及多步骤类的先验偏移的自适应。
北京大学的贺笛助理教授在报告中讨论了哪些图神经网络(GNN)能够用于解决实际问题。他的工作从一个本质不同的角度来研究GNN在-(WL)检验之外的功效。他引入了一种有效且具有原理的称为广义-距离检验(GD-WL),证明了这一检验对于具有双连通的度量都可行。实验表明他们的方法可以一致的优于先前的图神经网络结构。
清华大学的袁洋助理教授在报告中介绍了他关于对比学习的最新理论结果。对比学习是强大的自监督学习方法,但对于其理论性质的了解和对算法的理解相对缺乏。袁老师在文章中证明了对比学习和在相似图上谱聚类的等价性,并且强调这一等价性无需额外的条件。受这一理论的启发,在一些数据集上他们找到了比标准核函数效果更好的新的核函数。
新加坡国立大学的Kenji 教授在报告中介绍了对于Mixup方法的理论理解。Mixup 是一种流行的数据增强技术,用于训练深度神经网络,其通过线性插值输入对及其标签生成额外的样本,这种技术可以提高许多学习范式和应用程序中的泛化性能。
香港大学的曹原助理教授在报告中介绍对两层卷积神经网络(CNN)的良性过拟合的研究。现代的神经网络模型经常可以在训练集过拟合的情况下仍然有较好的表现,这种现象被称为良性过拟合,但对于这种现象的理论层面的理解仍然比较缺乏。曹老师报告了他对于两层卷积神经网络的良性过拟合的研究,找到了一个信噪比需要满足的条件,使得CNN在该条件下为良性过拟合,反之则为有害的过拟合。
来自北京大学的方聪助理教授在报告中介绍了关于环境不变的最小二乘问题。报告中考虑了一个多环境下的线性回归模型,该模型下的数据在不同的实验设定下采集。尽管该模型响应变量的联合分布、协方差可能在不同环境下不同,但其条件期望不变。他的工作构建了一个全新的,关于多环境不变的线性最小二乘(EILLS)目标函数,这一个最小二乘的多环境版本,利用上述条件期望不变结构以及不同环境之间的异质性来确定实际的参数。
最后,参会学者针对机器学习的理论基础展开进一步交流与讨论,会议通过线上及线下平台同时举办,来自全球近四百位学者参与本次会议。
2023年3月20日,香港中文大学(深圳)数据科学学院姚建峰教授、于天维教授、刘瑾副教授、宋方达助理教授到访清华大学统计学研究中心,并出席“清华大学统计学研究中心-香港中文大学(深圳)数据科学学院交流研讨会暨统计学前沿研讨会”,会议由中心李东副教授发起并主持。双方研究团队在会上交流各自研究方向、分享最新研究成果,并针对未来可能合作的方向展开讨论。
首先,来自香港中文大学(深圳)数据科学学院的于天维教授、刘瑾副教授和宋方达助理教授发言,分别围绕生物信息学、空间转录组、统计基因组学等研究方向介绍各自科研进展。
上:研讨会现场 下:(从左至右)于天维教授、刘瑾副教授、宋方达助理教授
随后,清华大学统计学研究中心李东副教授、侯琳副教授、俞声副教授、刘汉中副教授、杨朋昆助理教授发言,介绍最新研究动态及科研成果。
左:李东副教授、侯琳副教授 右:俞声副教授、刘汉中副教授、杨朋昆助理教授
会后,香港中文大学(深圳)数据科学学院姚建峰教授为清华统计中心师生做特邀报告,报告的题目是: in Deep and Early-。统计中心四十余师生聆听报告,针对报告提及的研究问题与姚建峰教授现场互动,姚教授耐心解答。
上:姚建峰教授 下:杨立坚教授及中心师生在报告现场
两校教员合影
哈佛大学的博士后,哈佛大学博士后申请:通向学术顶峰的路径探索
哈佛大学简介
哈佛大学位于美国波士顿附近的剑桥城,是美国最古老的大学。哈佛大学建校比美国建国还要早近140年。
建立于1636年,最早由马萨诸塞州殖民地立法机关创建,初名“新市民学院”。为了纪念在成立初期给予学院慷慨支持的约翰•哈佛牧师,学校于1639年3月更名为“哈佛学院( )”。1780年哈佛学院正式改称“哈佛大学( )”。
哈佛大学致力于卓越的教学、学习和研究,培养在众多学科领域具有全球影响力的领导者,哈佛大学由十所学院以及一个高等研究所构成,在文学、医学、法学、商学等多个领域拥有崇高的学术地位及广泛的影响力,在校本科生、硕士及博士研究生约为2万人。其在文学、医学、法学、商学等多个领域拥有崇高的学术地位及广泛的影响力,被公认为是当今世界最顶尖的高等教育机构之一。在世界各研究机构的排行榜中硕士,常年名列全球大学排名第一位。
哈佛大学博士后申请是通向学术顶峰的重要路径。作为全球学术界的中流砥柱,哈佛大学以其卓越的研究环境和世界一流的学术资源著称。申请者通过这一项目,得以与来自各个学科领域的顶尖学者共事,参与解决全球性和复杂性问题的前沿研究。
在哈佛大学的博士后项目中上海mba,跨学科的合作和全球化的视野被视为关键因素。申请者将有机会在多元化的学术氛围中拓展自己的研究兴趣和学术视野,探索跨学科研究的可能性,并在国际舞台上树立自己的学术声誉。
然而,这一路径也伴随着挑战,如适应高强度的学术压力、保持创新和领导力,以及在全球竞争中脱颖而出。通过克服这些挑战哈佛大学的博士后,申请者不仅能够在学术领域中取得卓越成就,还能为未来在教育、研究或行业领域的领导地位奠定坚实基础。
学术安排
1、学术安排
根据哈佛大学博士后/访问学者项目合作导师的需求,配置最佳科研资源。
学员有专门的国外博士生导师指导,为学员提供丰富学术研究的交流平台。
参加在国内或海外举办的国际学术研讨会。
学员在导师指导下展开学术研究博士,撰写博士后研究员/访问学者研究报告。
2、研学活动安排
哈佛大学学习访问一次或三次哈佛大学的博士后,哈佛大学博士后申请:通向学术顶峰的路径探索,前两次为集中讨论,第三次为论文答辩。
学制一年半至两年。
本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,请添加站长微信举报,一经查实,本站将立刻删除。
如若转载,请注明出处:https://www.guojishuobo.com/246195.html