跳转到主要内容
研究戴尔笔记本电脑的研究生

通过德克萨斯州排名第一的在线研究生项目探索可获得的学位。在线学习可以获得与在校同等质量的学位。

两个学生在白板上写方程式,上面有合适的文字

获取关于本科生、研究生和转校生的申请过程和资助机会的信息。

Ingenium的博主与其他组织领导人合影
Ingenium 我们的博客由学生写,为学生写

从工程学同学分享的经验和机会中获得灵感。

学生们竖起大拇指,举着德州农工大学未来农业工程师和工程的标志
PK-12外展 火花!

学生和组织可以为您的所在地带来实践活动或设计挑战,或者只是作为特邀演讲嘉宾访问。

大型服务器旁的数据和数字的抽象图像
该研究小组将减少数据集的规模,同时保留其中的重要信息,使研究人员能够更有效地处理实现科学目标所需的数据。|图片:盖蒂图片社

国家实验室或政府机构等科学用户设施每年产生的数据量可达数十亿gb每年。如此庞大的数据生成已经开始超过研究人员有效分析数据以实现科学目标的能力——这是实现新的科学进步的一个巨大问题。

为了开发新的数学和计算技术来减少这些数据集的规模,美国能源部(DOE)向9个项目拨款1370万美元,作为该计划的一部分高级科学计算研究(ASCR)计划2021年9月。一个由Byung-Jun Yoon博士他已经获得了240万美元,用于解决移动、存储和处理科学工作流产生和处理的大量数据集的挑战。

这个项目的首要原则是关注每个数据集的科学目标,并保持与目标相关的兴趣量(QoI)的保留。通过优化数据的表现形式,同时将重点放在手边的科学目标上,即使数据规模大幅减少,也能保留能够导致科学突破的重要信息。

尹永哲表示:“我们的想法是,不仅要大幅减少数据量,而且最终要保留数据所服务的目标。”“这就是为什么我们称它为科学工作流程的基于客观的数据简化。我们希望减少数据量,但不牺牲感兴趣的数量或质量。”

为了实现这一目标,Yoon的团队将采取的第一步是利用信息理论方法,通过利用语义和不变性来找到数据的紧凑表示。他们还将研究数据缩减如何影响最终目标的实现,在此基础上,他们将共同优化构成一般科学工作流程的模型。

我们的想法是,不仅要显著减少数据量,而且要最终保留数据所要服务的目标。

Byung-Jun Yoon博士

低温电子显微镜(cryo-EM)是一种广泛用于分子结构分析的方法,它可以说明大量数据如何变得难以管理。在低温电子显微镜下,典型的数据集由数千张显微照片组成,这些照片包含了数tb大小的分子在不同方向的投影图像。另一个例子是x射线散射实验,这是分析材料结构的常规方法。当在映射模式下执行时,x射线暴露是在样本的横截面上执行的,单个散射图是一个4D数据集,可能包含大约100亿值。

“我最兴奋的事情可能是,我们第一次从客观的角度来研究这个数据缩减问题,我相信这可能不是别人做的,”Yoon说。“我们提出了一个指标,可以用于基于客观的量化数据缩减的影响,然后通过使用这个指标优化数据缩减管道,这样我们就可以保留数据的可用性,以支持最终目标。”我们将这一理念应用到数据简化中所能带来的最终性能也非常令人兴奋。”

ASCR计划的任务是发现、发展和部署计算和网络能力,以分析、建模、模拟和预测对能源部和科学进步很重要的复杂现象。

除了Yoon,首席调查人员爱德华·多尔蒂博士博士Xiaoning钱来自德州农工大学电气与计算机工程系;这个项目还包括布鲁克海文国家实验室和伊利诺伊大学厄巴纳-香槟分校的合作者。