“以长期动态观测为基础的农业科学大数据研究应用工作的重要性日益凸显,特别是面临当前我国农业生产亟需破解信息化、智能化瓶颈用以支撑农业供给侧结构性改革的大背景下。”国家农业科技创新联盟秘书长、中国农科院副院长冯忠武表示。
数据驱动 科研进入大数据时代
随着信息技术带来科研信息化的进步,农业研究领域科研数据的产生和积累呈指数上升趋势,以长序列、体系性为特点的农业科学大数据已成为农业科研发展必需的重要工具。
中国热科院南亚所所长徐明岗研究员经常说:“我是与土疙瘩打交道的人,破解土壤密码,需要对全国各地的土壤‘望、闻、问、切’,必须要从海量的土壤科学数据寻找蕴含的潜在信息,而这些信息往往是重要科学决策的基础和来源,是农业长期演变趋势规律的脉搏。”30多年来,他从参与到引领,组建形成了我国29省份42个长期试验网、362个农户长期监测网络,积累连续监测数据150万条,累计保存土壤-植物样品9万个,正是这些数据、样品,支撑并推动了我国有机质提升技术难题的破解,科学施肥策略的广泛实施,使我国在耕地质量监测和土壤学研究原始创新等方面处于国际领先水平。
顶层设计 为大数据挖掘分析筑牢根基
“原农业部于2013年开始调研谋划农业基础性长期性科技工作,经过项目论证、方案制定确定了10个重点领域、77项重点观测监测任务,并于2017年正式启动实施,经过三年试运行,以‘国家农业科学数据总中心—国家农业科学数据中心—国家农业科学观测实验站’(以下分别简称数据总中心、数据中心、观测实验站)为框架的农业科学数据流体系已基本建设完成。”农业农村部科技教育司司长廖西元介绍说,“我们的观测工作绝不是为观测而观测,而是立足我国农业发展重大科技需求和政策需求,顶层设计并凝练若干重大科学问题、重大产业问题、重要方法问题,从而衍生出各项观测工作任务,在100个观测实验站中落实,在10~20个综合观测实验站中交融,最终有目的、有计划地获取各项科学数据。”
“农业基础性长期性科技工作大数据除了具备传统大数据5V(Volume数量,Variety种类,Value价值,Velocity速度,Veracity准确)特征外,还有因自身行业特殊性带来的三大特色。”国家农业科技创新联盟办公室主任、中国农科院科技局副局长周国民介绍,“一是面向农业科学的复杂系统性,该观测网络旨在全面跟踪获取我国不同耕地类型、水热条件、地理地貌、种植制度、经营管理、基础设施等因素下的农业科学数据,需要打造一个前所未有地涵盖多类别、多层次、多元素的农业专属性大数据系统。二是观测宽范围、长周期性。农业基础性长期性科技工作涉及种质资源、土壤质量、农业环境等多领域,一改以往观测网络各自为战,无法交融,以及各观测工作服从科研项目需求,三五年即中断的局面,长期、系统、全面的农业科学数据演变是我们所关注的。三是协同观测机制先进性。网络集聚了全国各级科研单位,通过数据中心的统一调度,组织观测实验站分工协作将数据连点成线、连线成面,可以便捷、高效地服务国家农业科学与产业需求,这种农业大数据组织获取方式是过去没有过的。”
国家农业科学数据总中心是农业基础性长期性科技工作的统一数据汇交、典藏与治理、运行技术支撑、智能数据分析的“枢纽”,为10个学科领域、100个国家农业观测实验站开展农业基础性长期性数据规范化采集、科学化治理、稳定化运行和智能化分析提供统一的平台。
“搭平台、强运行、精分析”是国家农业科学数据总中心主任、中国农科院信息所所长周清波研究员对总中心支撑作用的形象总结,“所谓打地基,就是在统一的整体技术框架、数据采集、汇交、治理等系列标准及工作规范前提下,把各数据中心凝练的每一项观测任务的数据需求的技术问题打通,我们在JAVA EE平台上,整合了众多符合农业科学数据特色的管理应用组件,建成了开放式的管理应用系统,为多学科、