您当前位置: 首页 > 新闻中心 > 科学新闻 > 信息技术动态

NSF和NIH联手推动大数据核心技术研究

来源: 发布日期:2012-10-31

2012年3月底,美国国家科学基金会(NSF)和美国国立卫生研究院(NIH)联合启动了“推动大数据科学与工程的核心技术”项目(BIGDATA),并发布了项目招标指南。BIGDATA项目旨在促进可从大型、多样化、分布式异构数据集中提取、分析、可视化和管理有用信息的核心科学和技术方法的发展。申请提案应关注以下三方面:

1. 数据收集与管理

处理多源、异构、复杂的海量数据需要开发新的方法与工具。可能的研究领域包括但不限于:

(1)针对不断产生的数据以及共享和广泛分布的静态实时数据的新的数据存储、I/O系统和架构;

(2)计算、存储和通信资源的有效使用与优化;

(3)能持续收集和处理数据,并确保其精确性、可信性和完整性的容错系统;

(4)能利用语义和情境信息自动注释数据的新方法;

(5)面向先进数据架构(包括云)的新设计,可以解决极限容量、电源管理、实时控制等问题,同时确保可扩展性和可用性;

(6)新一代多核处理器架构,以及能最大程度地发挥该架构优势的新一代软件库。

2. 数据分析

数据分析、仿真、建模和注释领域的进展将产生重大影响,有助于促进科学现象发现,认识事件的因果关系、进行预测并提出行动建议。可能的研究领域包括但不限于:

(1)新的算法、编程语言、数据结构和数据预测工具的开发;

(2)理解海量数据集计算的重要特性所需的计算模型和基础数学与统计学理论;

(3)针对不断产生的数据集的实时处理技术,以及允许更灵活、更直观地研究数据的实时可视化和分析工具;

(4)能整合不同数据并将数据转化为知识,实现实时决策的技术。

3. e-Science合作环境

综合的“大数据”网络基础设施必不可少,它能使广大的科学家和工程师团体访问多样化的数据,以及最优秀、最实用的推理和可视化工具。可能的研究领域包括但不限于:

(1)有助于不同领域、不同地域的科研人员和学生互相协调工作,并大幅提高科学合作效率的新的合作环境;

(2)通过机器学习、数据挖掘和自动推理等方式实现科学发现过程的自动化;

(3)能管理多学科领域复杂和大规模科学成果流的新的数据管理技术;

(4)能促进科学工作流和新应用开发与使用的端对端系统。

除了关注以上三方面外,提案还必须包括能力建设方案,因为这对新兴科研教育领域的健康发展至关重要。此外,提案还可选择在某个国家优先领域开展大数据项目,例如医疗IT、应急响应、清洁能源、网路学习、材料基因组、国家安全、先进制造等领域。

分享到: