“在数据爆炸的今天,人类一方面对知识充满渴求,另一方面为数据的复杂特征所困惑。有人问,我们快被海量数据‘淹死’了,‘救命’的‘稻草’在哪里?”日前在京召开的第二届数据学与数据科学国际研讨会上,作为第一个演讲者,中科院虚拟经济与数据科学研究中心常务副主任石勇一开始就提出了这个问题。
科学家们通过与数据相关的研究来寻找“救命稻草”。本次会议为期两天,吸引了来自美国、加拿大、澳大利亚、日本、西班牙等国的13位国际专家和20余位国内专家。中科院研究生院管理学院院长成思危担任本次会议的荣誉主席。各位学者从数据分析、数据结构、数据库管理、数据挖掘、知识发现、智能知识与知识管理等角度出发,各自发表专题报告,就最新的研究思想和学术成果进行研讨和交流。
记者从本次会议上获悉,一个基于数据挖掘、知识发现和数据管理的崭新研究领域——“数据科学”正在逐渐形成。本届研讨会的主题即为“探讨数据科学的原理、结构与应用”。
巨量的数据是否会形成一个有别于真实的自然界或人类社会的“数据自然界”?在本次会议上,石勇指出,巨量数据是真实世界某一方面的投影和反映,但是“数据自然界”可以从不同角度来进行理解和诠释。正像曾经盛极一时的虚拟游戏“第二人生”(Second life)一样,“数据自然界”如果存在,也是一个虚拟世界。其仅仅是“故事的一个侧面”而已,不会像真实世界一样丰富多彩、鲜活动态、不断进化。
但即便如此,“理解数据科学和理解真实世界一样困难重重”。石勇说。