数据科学

数据科学, 顾名思义即数据相关的科学研究, 它是一门利用数据学习知识的学科, 包含两方面--用数据的方法来研究科学和用科学的方法来研究数据。 其目标是通过从数据中提取出有价值的部分来生产数据产品, 结合了诸多领域中的理论和技术, 包括应用数学, 统计, 模式识别, 机器学习, 数据可视化, 数据库, 以及高性能计算。

数据科学的应用覆盖了医学与公共卫生, 工程, 法律, 教育, 设计, 商业, 经济, 政策规划等广泛的领域, 也将为这些领域带来巨大的变革与发展。

专业历史

数据科学在目前还算是一门新兴学科, 追溯其发展历史, 我们可以看到只有短短的40年时间, 而真正快速发展阶段也就10年左右时间。

1974年彼得诺尔 (Peter Naur) 发表文章首次提出“数据学“和“数据科学“的概念。 他认为“数据学“是计算机科学的延伸, 其研究对象是数码化的数据。

1996年在日本神户的一个国际会议上, 第一次正式在会议上使用“数据科学“这一名称。 1997年杰夫-吴 (Jeff Wu, 密西根大学) 在演讲中提出“统计学=数据科学“的命题并建议将统计学改名为数据科学, 统计学家改名为数据科学家。

2001年威廉-克里富兰 (William Cleveland) 第一次将数据科学作为由统计延伸出来的一个独立研究领域。 他认为应将统计学中与数据分析有关的技术层面 (区别于概率理论) 在6个方面扩展后形成一个新的, 独立的学科-“数据科学“。 这6个方面包括: (1) 多学科的联合研究 (Multidisciplinary Investigations) , (2) 数据模式和分析方法 (Models and Methods for Data) , (3) 数据计算 (Computing with Data) , (4) 数据科学教程 (Pedagogy) , (5) 工具评估 (Tool Evaluation) ,(6) 理论 (Theory)。

2002年国际科学委员会 (International Council for Science) 正式使用“数据科学“并创办了“数据科学杂志“ (Data Science Journal) 。 2003年哥伦比亚大学开办了数据科学杂志 (Journal of Data Science) , 为数据工作者建立了一个交流平台。

2007年2月美国北卡罗来纳州立大学 (North Carolina State University) 成立高级数据分析研究院 (IAA, Institute for Advanced Analytics) , 成为美国第一个正式的数据分析硕士研究生学位授予单位, 并开发了著名的决策支持大型集成信息系统SAS (Statistics Analysis System) 。

2012年3月, 时任美国总统奥巴马宣布启动「大数据研究与开发计划」 (Big Data Research and Development Initiative) , 标志着数据科学爆炸式发展时代的到来。

数据科学在我国的发展历史则更为短暂。

随着大数据时代的到来, 以及目前社会对于大数据研究人才的巨大需求, 国内高校也纷纷响应这一潮流。 在2014-2015年期间, 多所国内知名高校首先采取设立「大数据研究院」的形式, 从学校其他优势专业或相关专业选拔研究员和学生, 探索和规划数据科学专业的未来发展。 第一所建立研究院的是清华大学, 其后西南交通大学, 贵州大学, 北京大学, 中国人民大学等7所大学也相继设立。

除了高校自身对于数据科学这一领域的探索外, 各大互联网企业也对数据科学领域人才培养给予了多方面的支持。 2015年6月15日, 国内著名云计算服务商「阿里云」携手慧科教育集团, 启动了「阿里云大学合作项目」 (AUCP, Aliyun university cooperation program) , 联合高校开设云计算与数据科学专业方向。 通过产教融合的方式, 阿里云在AUCP中提供云计算, 大数据, 工程师以及生态圈伙伴等资源, 培养下一代数据科学家。 北京航空航天大学, 浙江大学, 复旦大学, 上海交通大学, 西安交通大学, 南京大学, 武汉大学, 华南理工大学共8所高校, 成为了阿里云大学合作计划的首批试点高校。

经过国内各高校与互联网企业不断地研究与探索, 「数据科学」成为一门独立专业的时机日渐成熟, 社会各行业对这一领域人才的需求也在不断扩大。 继2016年2月, 北京大学, 对外经济贸易大学和中南大学成为首批成功获批设立「数据科学与大数据技术」本科新专业的高校后, 2017年3月, 经教育部批准, 第二批共32所高校成功申请「数据科学与大数据技术」本科专业。


孔雀
合作院校