更新時間:2025-10-17 11:19:58作者:佚名
出自 MBA智庫百科()
數據科學(Data )
什么是數據科學
數據科學是一門研究數據的學科,它通過科學的方法,流程,算法和系統,從數據中挖掘價值,屬于一個跨學科領域。
數據科學的發展歷程
1974年,知名計算機科學家Peter Naur作為圖靈獎得主,在其著作《計算機方法的簡明調研》的引言里,首次清晰界定了數據科學這一術語,稱其為“以數據加工為基礎的學科”,同時指出了數據科學和數據研究各自的側重點——前者致力于處理數據(事項),后者則關注數據加工及其在學術界的實踐。

Peter Naur首次清晰闡述數據科學這一理念后,該領域的研究長期處于沉寂狀態。直到2001年,在貝爾實驗室任職的 S. 向學術期刊提交了一篇題為《數據科學——拓展統計學技術領域的行動計劃》的文章,強調數據科學是統計學的一個核心分支,從而使得統計學界重新關注起數據科學。
二零一三年,C A在《自然》上刊登了名為《計算——數據科學的愿景》的文章,Dhar V則在《美國計算機學會通訊》發表了題為《數據科學與預測》的論文,二者均從計算機領域和技術角度探討了數據科學的核心意義,促使該學科被歸入計算機科學與技術學科的研究體系之內。
然而數據科學專業,數據科學被更多人關注是因為后來發生了三個標志性事件:

Patil DJ與T H在2012年向哈佛商業評論投稿,文章標題為《數據科學家——21世紀最具吸引力的職業》;
其次,在2012年,數據挖掘理念初次用于總統選舉留學之路,幫助奧巴馬,戰勝了羅姆尼,得以再次當選。
三是美國白宮在2015年首次設置了數據科學家的職位,隨后聘請Patil DJ擔任白宮的首位首席數據科學家。
數據科學的各個分支發展程度不一:模擬和仿真的技術日漸成熟,有望很快應用于實踐;數據挖掘的方法或許將要式微;語音識別、模型維護、人機對話等技術已經脫離了初期的狂熱,正逐步進入實用階段;開放數據科學、模型生產線、算法交易、規則分析等領域正經歷迅猛發展。
數據科學的專業培養

數據挖掘、云計算等屬于數學、計算機、統計學和信息系統等學科的理論知識范疇數據科學專業,大數據就是這些高科技的成果,它的應用遍及社會科學和自然科學的諸多領域,數據科學與大數據技術專業致力于培養跨學科背景的大數據人才,著重提升人才在三個方面的高素質能力:
數據領域的職業路徑主要有三條,分別是數據洞察崗、數據實現崗和數據建設崗,常見的職位有數據專家和數據研究員等。
越來越多單位開始關注數據,無論是國防部門還是網絡新創企業及金融組織,都依靠數據項目推動革新,這就要求大量數據分析和技術操作人員。日常生活中,食品生產、交通監控、零售網商以及醫療設備等產業同樣依賴數據分析與操作技術,比如調節供需關系、改進倉庫管理、減少供應鏈開銷。

從事數據科學與大數據技術工作的人員,必須擁有扎實的數學基礎,并且需要掌握工作相關領域的專門知識。為此,該學科領域應開設計算思維、數據科學等與數學關聯的課程,另外還需設置數據獲取方法、云服務與數據中心、醫療領域數據應用等直接涉及大數據的課程。這個學科還要求掌握部分計算機領域的基本理論,例如大型數據庫運用,數據呈現方法,分布式海量數據存儲運用,數據保護,機器學習與模式識別,以及圖像視頻和非結構化數據加工方法等知識。
呂小光, 姜樂, 成青松. 對數據科學與大數據技術領域人才培育方法的研究. 淮海工學院學報:人文社會科學版, 2018
來自""