欧洲成人午夜精品无码区久久_久久精品无码专区免费青青_av无码电影一区二区三区_各种少妇正面着bbw撒尿视频_中文精品久久久久国产网址

學(xué)術(shù)刊物 生活雜志 SCI期刊 投稿指導(dǎo) 期刊服務(wù) 文秘服務(wù) 出版社 登錄/注冊 購物車(0)

首頁 > 精品范文 > 統(tǒng)計學(xué)的數(shù)據(jù)分析

統(tǒng)計學(xué)的數(shù)據(jù)分析精品(七篇)

時間:2023-09-12 17:03:20

序論:寫作是一種深度的自我表達。它要求我們深入探索自己的思想和情感,挖掘那些隱藏在內(nèi)心深處的真相,好投稿為您帶來了七篇統(tǒng)計學(xué)的數(shù)據(jù)分析范文,愿它們成為您寫作過程中的靈感催化劑,助力您的創(chuàng)作。

統(tǒng)計學(xué)的數(shù)據(jù)分析

篇(1)

關(guān)鍵詞:農(nóng)經(jīng)專業(yè);數(shù)據(jù)分析;教學(xué)改革

2019年12月,農(nóng)業(yè)農(nóng)村部、中央網(wǎng)絡(luò)安全和信息化委員會辦公室關(guān)于印發(fā)《數(shù)字農(nóng)業(yè)農(nóng)村發(fā)展規(guī)劃(2019-2025年)》的通知,部署了用數(shù)字化引領(lǐng)驅(qū)動農(nóng)業(yè)農(nóng)村現(xiàn)代化,加快農(nóng)業(yè)農(nóng)村生產(chǎn)經(jīng)營、管理服務(wù)的數(shù)字化改造的發(fā)展戰(zhàn)略,將全面提升農(nóng)業(yè)農(nóng)村生產(chǎn)智能化、經(jīng)營網(wǎng)絡(luò)化、管理高效化、服務(wù)便捷化水平作為農(nóng)業(yè)農(nóng)村發(fā)展的目標(biāo)[1]。農(nóng)業(yè)農(nóng)村的數(shù)字化建設(shè)離不開專業(yè)人才的培養(yǎng)。農(nóng)林經(jīng)濟管理專業(yè)畢業(yè)生的就業(yè)方向主要有農(nóng)業(yè)經(jīng)營單位、面向農(nóng)業(yè)農(nóng)村的政府管理部門、事業(yè)單位、科研院所等。隨著農(nóng)業(yè)農(nóng)村數(shù)字化發(fā)展戰(zhàn)略的推進,給傳統(tǒng)的農(nóng)經(jīng)人才培養(yǎng)帶來了一系列的挑戰(zhàn)[2]。在數(shù)字經(jīng)濟和智慧農(nóng)業(yè)的時展背景下,數(shù)據(jù)分析能力是農(nóng)經(jīng)專業(yè)學(xué)生重要的核心競爭力。如何提升農(nóng)經(jīng)專業(yè)學(xué)生數(shù)據(jù)分析能力,是農(nóng)經(jīng)專業(yè)人才培養(yǎng)中面臨的重要課題[3]。

1農(nóng)業(yè)農(nóng)村數(shù)字化發(fā)展戰(zhàn)略給農(nóng)經(jīng)人才培養(yǎng)帶來的挑戰(zhàn)

1.1對農(nóng)經(jīng)人才的數(shù)據(jù)思維的更高要求

在大數(shù)據(jù)時代,無論是農(nóng)業(yè)生產(chǎn)經(jīng)營活動,還是農(nóng)村的行政管理中都有大量的數(shù)據(jù)資源。農(nóng)業(yè)企業(yè)、農(nóng)業(yè)合作經(jīng)營組織、農(nóng)產(chǎn)品產(chǎn)銷數(shù)據(jù)、農(nóng)產(chǎn)品溯源數(shù)據(jù)為農(nóng)業(yè)經(jīng)營者提供了生產(chǎn)、物流、銷售環(huán)節(jié)大量的數(shù)據(jù)資源。經(jīng)營者需要認(rèn)識到數(shù)據(jù)是一種新的生產(chǎn)要素,要調(diào)動數(shù)據(jù)作為生產(chǎn)要素的屬性,讓數(shù)據(jù)分析為管理決策服務(wù)[4]。在數(shù)字中國的建設(shè)進程中,各級政府部門工作人員通過各級各部門的行政管理智能,收集了大量省、市、區(qū)、縣級的區(qū)域經(jīng)濟社會發(fā)展數(shù)據(jù)。社區(qū)網(wǎng)格化管理下收集了微觀層面的農(nóng)業(yè)經(jīng)營單位數(shù)據(jù)、農(nóng)村常住人口數(shù)據(jù)、醫(yī)保數(shù)據(jù)、扶貧數(shù)據(jù)、農(nóng)村小額信貸數(shù)據(jù)。這些數(shù)據(jù)資源是政府提高行政效率、提高政務(wù)服務(wù)質(zhì)量的寶貴資源。

1.2對農(nóng)經(jīng)人才的數(shù)據(jù)分析能力的更高要求

在大數(shù)據(jù)時代,每天都有海量數(shù)據(jù)生成,如何能更好地利用這些數(shù)據(jù),讓數(shù)據(jù)能發(fā)揮其為管理決策服務(wù)的功能,與數(shù)據(jù)使用者的數(shù)據(jù)分析能力是密切相關(guān)的。例如,農(nóng)業(yè)經(jīng)營單位在農(nóng)業(yè)生產(chǎn)環(huán)節(jié)的農(nóng)業(yè)投入數(shù)據(jù)、農(nóng)產(chǎn)品銷售數(shù)據(jù)、電商平臺的客戶反饋評論、農(nóng)產(chǎn)品庫存的動態(tài)數(shù)據(jù),如何整合分析這些數(shù)據(jù),要求農(nóng)業(yè)經(jīng)營者系統(tǒng)掌握數(shù)據(jù)分析、數(shù)據(jù)挖掘、文本分析等多元化的數(shù)據(jù)分析方法。政府管理部門掌握的農(nóng)業(yè)人口的遷移數(shù)據(jù)、農(nóng)村常住人口網(wǎng)格管理數(shù)據(jù)、農(nóng)村居民醫(yī)保數(shù)據(jù)、扶貧數(shù)據(jù)等,數(shù)據(jù)類型豐富,數(shù)據(jù)量龐雜,如何實現(xiàn)數(shù)據(jù)庫的整合,要求政府部門工作人員掌握數(shù)據(jù)庫管理、大數(shù)據(jù)分析技術(shù)。

2農(nóng)經(jīng)專業(yè)數(shù)據(jù)分析課程群建設(shè)中存在的問題

2.1課程之間連貫性不足

以筆者所在的高校為例,為農(nóng)經(jīng)專業(yè)本科生開設(shè)的數(shù)據(jù)分析類課程,見表1。數(shù)據(jù)分析課程群包括了通識教育、專業(yè)教育和實踐教育。從目前的課程設(shè)置來看,涵蓋了數(shù)據(jù)庫、統(tǒng)計學(xué)、經(jīng)濟計量學(xué)、多元統(tǒng)計、大數(shù)據(jù)分析等領(lǐng)域,內(nèi)容豐富。數(shù)據(jù)庫應(yīng)用由計算機學(xué)院開設(shè),是一門通識教育課程,在授課時教師往往將其視為一門計算機類的入門課程,在教學(xué)中沒有針對農(nóng)經(jīng)專業(yè)學(xué)生的特質(zhì),將數(shù)據(jù)庫的教學(xué)與其在農(nóng)經(jīng)領(lǐng)域的應(yīng)用結(jié)合起來。學(xué)生在學(xué)習(xí)中往往會覺得該課程與專業(yè)聯(lián)系不夠緊密,教學(xué)內(nèi)容枯燥,缺乏學(xué)習(xí)興趣。

2.2學(xué)生學(xué)習(xí)的軟件種類繁多,但不夠深入

在統(tǒng)計學(xué)和多元統(tǒng)計課程中,學(xué)生將學(xué)習(xí)EXCEL、SPSS或者R語言的應(yīng)用,在經(jīng)濟計量學(xué)課程中學(xué)生將學(xué)習(xí)Eviews或STATA的應(yīng)用,在數(shù)據(jù)挖掘與大數(shù)據(jù)分析課程中學(xué)生將學(xué)習(xí)Python語言的應(yīng)用。在每一門課程中學(xué)習(xí)的軟件都不同,對于軟件的學(xué)習(xí)缺乏連貫性和延續(xù)性,雖然學(xué)生接觸的軟件種類多,但是由于學(xué)時所限,每一種軟件都只是入門級的介紹,無法進入到深度學(xué)習(xí)。

2.3與專業(yè)課學(xué)習(xí)聯(lián)系不夠緊密,缺乏應(yīng)用機會

學(xué)生缺乏在專業(yè)課學(xué)習(xí)中運用數(shù)據(jù)分析類課程所學(xué)知識的機會。數(shù)據(jù)分析類課程主要介紹數(shù)據(jù)分析方法和軟件的應(yīng)用,但大部分都安排在第5學(xué)期和第6學(xué)期。學(xué)生在學(xué)習(xí)了數(shù)據(jù)分析方法后,缺少在專業(yè)學(xué)習(xí)領(lǐng)域里運用這些方法的機會。例如學(xué)生若要完成產(chǎn)業(yè)經(jīng)濟學(xué)、農(nóng)業(yè)技術(shù)經(jīng)濟學(xué)、農(nóng)產(chǎn)品國際貿(mào)易學(xué)的專題研究、課程論文,需要用到統(tǒng)計學(xué)、經(jīng)濟計量學(xué)、大數(shù)據(jù)分析的方法,但在第2-4學(xué)期開設(shè)大量專業(yè)課的學(xué)期,數(shù)據(jù)分析類課程還沒有開設(shè)。若能將數(shù)據(jù)分析類課程盡量靠前安排,學(xué)生可以在后續(xù)的專業(yè)學(xué)習(xí)、課題研究中運用所學(xué)的方法,一方面夯實數(shù)據(jù)分析技能,另一方面也可以增加學(xué)生對專業(yè)課的學(xué)習(xí)興趣。

2.4排課不夠科學(xué)

在大三階段,學(xué)生可以選修多元統(tǒng)計、數(shù)據(jù)挖掘與大數(shù)據(jù)分析、Python語言三門選修課。但到了大三,學(xué)生專業(yè)課的學(xué)習(xí)任務(wù)重,選修課種類考慮繁多,學(xué)生選課可能出于興趣、學(xué)分安排或者準(zhǔn)備考研保研考慮,并不是每一位同學(xué)都會選修上述課程。尤其是計算機能力不太強、對數(shù)學(xué)類課程感到困難的同學(xué),會傾向于選擇難度小的課程。

3基于項目驅(qū)動式教學(xué)理念的數(shù)據(jù)分析課程群改革

3.1開展項目驅(qū)動式教學(xué)的意義

項目驅(qū)動教學(xué)法是基于行動導(dǎo)向的探究式教學(xué)方法,是將真實的或模擬的項目轉(zhuǎn)化為教學(xué)項目,結(jié)合課程內(nèi)容將項目分解為若干工作任務(wù),創(chuàng)設(shè)工作情境,引導(dǎo)學(xué)生完成任務(wù),進而實現(xiàn)項目教學(xué)目標(biāo)的教學(xué)活動[4-5]。項目驅(qū)動式教學(xué)法最顯著的特點是“以項目為主線、教師為主導(dǎo)、學(xué)生為主體”,改變了以往“教師講,學(xué)生聽”被動的教學(xué)模式,完善了學(xué)生主動參與、自主協(xié)作、探索創(chuàng)新的新型教學(xué)模式。與傳統(tǒng)教學(xué)方法相比,教學(xué)實施過程中,學(xué)生的目標(biāo)更清晰明確,可避免傳統(tǒng)課堂教學(xué)的被動性,進而提高學(xué)生學(xué)習(xí)知識的興趣和主動性[6]。在數(shù)據(jù)分析課程群中引入項目驅(qū)動教學(xué),一方面能讓學(xué)生運用所學(xué)的數(shù)據(jù)分析方法分析現(xiàn)實問題,創(chuàng)設(shè)數(shù)據(jù)分析情境,加深對所學(xué)方法的理解和運用,激發(fā)學(xué)習(xí)興趣,培養(yǎng)自主學(xué)習(xí)能力;另一方面也可以有針對性地創(chuàng)設(shè)圍繞“三農(nóng)”問題的數(shù)據(jù)分析項目,讓學(xué)生從數(shù)據(jù)分析中加深對“三農(nóng)”問題的感性認(rèn)識,培養(yǎng)對農(nóng)經(jīng)專業(yè)學(xué)習(xí)的興趣,提升對農(nóng)經(jīng)專業(yè)的認(rèn)同度。具體來講,可以從以下方面開展對數(shù)據(jù)分析課程群的改革[7]。

3.2統(tǒng)籌規(guī)劃教學(xué)內(nèi)容,加強課程間的連貫和遞進

農(nóng)經(jīng)專業(yè)數(shù)據(jù)分析課程群目前主要包括必修課數(shù)據(jù)庫應(yīng)用、統(tǒng)計學(xué)和經(jīng)濟計量學(xué),選修課多元統(tǒng)計、數(shù)據(jù)挖掘與大數(shù)據(jù)分析,以及實踐課R語言與統(tǒng)計應(yīng)用、Python語言。統(tǒng)計學(xué)教學(xué)的重點在于對基礎(chǔ)性的統(tǒng)計方法的運用,經(jīng)濟計量學(xué)教學(xué)的重點在于讓學(xué)生掌握經(jīng)濟計量分析的范式,如何利用經(jīng)濟計量模型開展實證分析。多元統(tǒng)計強調(diào)對復(fù)雜多維數(shù)據(jù)信息的提煉。數(shù)據(jù)挖掘與大數(shù)據(jù)分析教學(xué)的重點在于大數(shù)據(jù)時代數(shù)據(jù)挖掘方法的應(yīng)用。此外,針對于目前學(xué)生所學(xué)的軟件門類過多,軟件操作不夠熟練,建議在統(tǒng)計學(xué)、多元統(tǒng)計、數(shù)據(jù)挖掘大數(shù)據(jù)分析中統(tǒng)一采用R語言進行教學(xué),讓學(xué)生通過幾門課程的學(xué)習(xí),能夠熟練掌握一種統(tǒng)計分析軟件。

3.3基于項目驅(qū)動對教學(xué)內(nèi)容進行整合及優(yōu)化,調(diào)動學(xué)生主動參與

例如統(tǒng)計學(xué)課程介紹了基礎(chǔ)性的統(tǒng)計分析方法,在后續(xù)課程經(jīng)濟計量學(xué)、多元統(tǒng)計、數(shù)據(jù)挖掘與大數(shù)據(jù)分析中引導(dǎo)學(xué)生運用基礎(chǔ)性統(tǒng)計分析方法,對數(shù)據(jù)進行初步的統(tǒng)計分析和整理,為經(jīng)濟計量分析、多元統(tǒng)計、數(shù)據(jù)挖掘做好數(shù)據(jù)處理上的準(zhǔn)備,讓學(xué)生體會到關(guān)聯(lián)課程中所學(xué)知識的聯(lián)結(jié)。鼓勵學(xué)生積極參與“三下鄉(xiāng)”活動,開展田野調(diào)查實踐,圍繞“三農(nóng)”開展調(diào)研,運用統(tǒng)計和計量方法對調(diào)研數(shù)據(jù)進行分析,鼓勵學(xué)生參與到教學(xué)中來,培養(yǎng)學(xué)生的學(xué)習(xí)興趣,學(xué)以致用。

3.4建設(shè)“項目驅(qū)動”實踐教學(xué)模塊

結(jié)合農(nóng)經(jīng)專業(yè)課程體系,建設(shè)數(shù)據(jù)分析課程群“項目驅(qū)動”實踐教學(xué)模塊。在農(nóng)經(jīng)專業(yè)的課程體系中開設(shè)的農(nóng)業(yè)經(jīng)濟學(xué)、農(nóng)產(chǎn)品貿(mào)易、農(nóng)村社會學(xué)等專業(yè)性課程對大量的“三農(nóng)”問題進行了探討,這類課程中涉及的城鄉(xiāng)差異問題、收入和消費問題、農(nóng)產(chǎn)品價格波動、農(nóng)產(chǎn)品貿(mào)易等現(xiàn)實問題的研究,都離不開基于現(xiàn)實數(shù)據(jù)的定量分析。因此,在農(nóng)經(jīng)專業(yè)的數(shù)據(jù)分析課程群中可以結(jié)合教學(xué)內(nèi)容引導(dǎo)學(xué)生對專業(yè)課學(xué)習(xí)中熱點問題的研究,圍繞課程教學(xué)大綱,建設(shè)“項目驅(qū)動”實踐教學(xué)模塊,理論聯(lián)系實際,讓學(xué)生在研究項目中運用所學(xué)的數(shù)據(jù)分析方法,加深對專業(yè)知識的理解。

4農(nóng)經(jīng)專業(yè)數(shù)據(jù)分析課程群優(yōu)化方案

在大數(shù)據(jù)時代,數(shù)據(jù)分析能力是學(xué)生的核心競爭力之一。數(shù)據(jù)分析類課程在建設(shè)中要強調(diào)理論與實踐的結(jié)合,不能只是將教學(xué)停留在課堂上,引入體現(xiàn)專業(yè)特色的實踐教學(xué)環(huán)節(jié)。可以從以下幾方面開展數(shù)據(jù)分析課程群的優(yōu)化:第一,數(shù)據(jù)分析基礎(chǔ)類必修課安排在大一學(xué)年。在第1學(xué)期,可以安排R入門、Python入門、數(shù)據(jù)可視化課程,讓學(xué)生盡早接觸當(dāng)前主流的數(shù)據(jù)分析軟件,激發(fā)學(xué)生對R或Python的學(xué)習(xí)興趣,讓學(xué)生自我拓展學(xué)習(xí)空間。R入門、Python入門、或者數(shù)據(jù)可視化課程都屬于數(shù)據(jù)分析的基礎(chǔ)課程,無需其他先修課程。在這一時期,讓學(xué)生開始接觸數(shù)據(jù)分析軟件,學(xué)習(xí)數(shù)據(jù)可視化的分析工具,有利于培養(yǎng)學(xué)生的數(shù)據(jù)思維、數(shù)據(jù)意識和軟件實操能力。第二,將與農(nóng)經(jīng)專業(yè)課有關(guān)的專業(yè)必修課統(tǒng)計學(xué)、經(jīng)濟計量學(xué)安排在第3-4學(xué)期學(xué)習(xí)。統(tǒng)計學(xué)課程需要學(xué)生先行修讀高等數(shù)學(xué)和概率論課程,經(jīng)濟計量學(xué)需要學(xué)生先行修讀微觀經(jīng)濟學(xué)、宏觀經(jīng)濟學(xué),因此可安排在第3-4學(xué)期。讓學(xué)生在掌握了一定經(jīng)濟管理專業(yè)知識后,可以更好地體會統(tǒng)計學(xué)、經(jīng)濟計量學(xué)方法論學(xué)科的應(yīng)用價值。第三,將數(shù)據(jù)分析進階類選修課多元統(tǒng)計、大數(shù)據(jù)分析、數(shù)據(jù)挖掘、機器學(xué)習(xí)等課程安排在第5-6學(xué)期。為高年學(xué)生提供豐富的數(shù)據(jù)分析類選修課,讓學(xué)生結(jié)合自己的興趣、未來的發(fā)展規(guī)劃學(xué)習(xí)更加多元化的數(shù)據(jù)分析技術(shù)。鼓勵學(xué)生能在專業(yè)論文習(xí)作、學(xué)科競賽中有更多的機會運用自己所學(xué)的數(shù)據(jù)分析方法,增加學(xué)生的收獲感和成就感,挖掘?qū)W生的學(xué)習(xí)潛力。第四,改革課程考核評價體系,采用項目式管理和評估的思路,由學(xué)生自主開展一個數(shù)據(jù)分析項目,從收集數(shù)據(jù)、提出問題、分析數(shù)據(jù)到提煉研究結(jié)論,開展小組團隊成員互評。教師跟蹤學(xué)生的項目開展過程,從學(xué)生的學(xué)習(xí)態(tài)度、投入程度、數(shù)據(jù)分析質(zhì)量等綜合評價學(xué)生的學(xué)習(xí)效果。

5結(jié)束語

將項目驅(qū)動教學(xué)引入到農(nóng)經(jīng)專業(yè)數(shù)據(jù)分析課程群的建設(shè),讓學(xué)生參與到教學(xué)中去,突破傳統(tǒng)教學(xué)中“教師教學(xué)生學(xué)”的局面,讓學(xué)生通過參與項目,運用數(shù)據(jù)分析方法解決項目中的實際問題,激發(fā)學(xué)生的學(xué)習(xí)興趣和潛能,讓學(xué)生體會到所學(xué)知識的應(yīng)用價值,讓學(xué)生不再對數(shù)據(jù)分析類課程望而生畏。本文的研究對于農(nóng)經(jīng)專業(yè)學(xué)生數(shù)據(jù)分析能力的培養(yǎng)有重要的意義,強調(diào)理論與實踐的結(jié)合,提高學(xué)生數(shù)據(jù)分析的高階能力,也能為同類課程開展項目驅(qū)動教學(xué)提供借鑒。

參考文獻:

[1]農(nóng)業(yè)農(nóng)村部中央網(wǎng)絡(luò)安全和信息化委員會辦公室關(guān)于印發(fā)《數(shù)字農(nóng)業(yè)農(nóng)村發(fā)展規(guī)劃(2019-2025年)》的通知[EB/OL].(2019-12-25)[2020-4-14].

[2]李虹賢.農(nóng)業(yè)經(jīng)濟管理專業(yè)人才培養(yǎng)模式創(chuàng)新研究與實踐[J].智慧農(nóng)業(yè)導(dǎo)刊,2022,2(7):110-112.

[3]馮開文,陶冶.農(nóng)業(yè)經(jīng)濟管理專業(yè)實踐教學(xué)改革———以中國農(nóng)業(yè)大學(xué)經(jīng)濟管理學(xué)院為例[J].教育現(xiàn)代化,2017,4(23):54-56+63.

[4]杜洪燕,陳俊紅.鄉(xiāng)村振興背景下中國數(shù)字農(nóng)業(yè)高質(zhì)量發(fā)展路徑研究[J].南方農(nóng)業(yè),2021,15(21):213-214.

[5]金娥.基于項目式學(xué)習(xí)的《現(xiàn)代教育技術(shù)應(yīng)用》課程學(xué)習(xí)框架的設(shè)計與實踐研究[D].武漢:華中師范大學(xué),2021.

[6]胡靜,王昌鳳.基于應(yīng)用型本科人才培養(yǎng)目標(biāo)的項目式教學(xué)模式構(gòu)建[J].教書育人(高教論壇),2022(9):59-64.

篇(2)

關(guān)鍵詞:統(tǒng)計測度;統(tǒng)計學(xué);大數(shù)據(jù);數(shù)據(jù)科學(xué);

作者簡介:李金昌,男,50歲,浙江義烏人。浙江財經(jīng)大學(xué)校長,統(tǒng)計學(xué)教授,博士生導(dǎo)師。研究方向為經(jīng)濟統(tǒng)計學(xué),統(tǒng)計理論與方法,抽樣技術(shù),政府統(tǒng)計等。

最近兩年,統(tǒng)計學(xué)界對大數(shù)據(jù)問題所進行的理論探討逐漸增多,視角也各有千秋,引起了一些共鳴。圍繞大數(shù)據(jù)問題,由統(tǒng)計學(xué)、計算機科學(xué)、人工智能、數(shù)學(xué)等學(xué)科共同支撐的數(shù)據(jù)科學(xué)開始形成。但大數(shù)據(jù)畢竟是一個新課題,因此遠未達到對其有一個系統(tǒng)完整的認(rèn)識,仍然需要從不同的方面加以研究,其中有一個重要但又容易被忽視的問題,即統(tǒng)計測度問題,值得去探討。

一、什么是統(tǒng)計測度

漢語上,測度是指猜測、揣度、估計。數(shù)學(xué)上,測度是一個函數(shù),它對一個給定集合的某些子集指定一個數(shù),這個數(shù)可以比作大小、體積、概率等等。通俗地說,測度把每個集合映射到非負(fù)實數(shù)來規(guī)定這個集合的大小:空集的測度是0;集合變大時測度至少不會減小(因為要加上變大的部分的測度,而它是非負(fù)的)。

除了數(shù)學(xué)角度的測度論,查閱國內(nèi)文獻資料,帶有測度這個詞匯的文獻不少,但專門針對統(tǒng)計測度(或測度)內(nèi)涵的討論幾乎沒有。一些對社會經(jīng)濟現(xiàn)象進行分析測度的文獻,例如新型工業(yè)化進程測度、貨幣流動性測度、全面小康社會發(fā)展進程測度、收入分配公平性測度、技術(shù)效率測度、人力資本測度、金融風(fēng)險測度、產(chǎn)業(yè)關(guān)聯(lián)測度等等,所做的測度都是再測度,均不對測度本身進行討論。查閱國外文獻資料(關(guān)鍵詞:measurement),也同樣存在這樣的問題,只能收集到一些比較零散的表述。LudwikFinkelstein(1975)[1]認(rèn)為,在我們對事物或現(xiàn)象進行描述時,測度可以被定義為對現(xiàn)實世界中某一現(xiàn)象的個體屬性或特征進行量化的過程。JamesT.Townsend和F.GregoryAshby(1984)[2]認(rèn)為,如果按照極端的觀點,那么統(tǒng)計分析中的基本測度理論的含義仍然是存在爭議的。LudwikFinkelstein(2003)[3]指出,測度在那些原來尚未得到卓有成效或廣泛應(yīng)用的領(lǐng)域,也已取得了明顯的進步,社會、政治、經(jīng)濟和行為科學(xué)正在更大程度地利用定量技術(shù);測度是現(xiàn)代思維的一種實際有效的工具,是我們借以描述世界的一種方法。GiovanniBattistaRossi(2007)[4]認(rèn)為,用以表示測度結(jié)果的,是數(shù)字或者數(shù)字符號。LucaMari(2013)[5]認(rèn)為,測度的基礎(chǔ)特征是被公認(rèn)為世界上獲取并正式表達信息的基本方法,這讓它成為一種跨學(xué)科的工具。LudwikFinkelstein(2014)[6]指出,在自然科學(xué)技術(shù)中,測度的重要性不可否認(rèn),它是科學(xué)調(diào)查和發(fā)現(xiàn)必不可少的工具,它可將宇宙中的復(fù)雜現(xiàn)象用精確、簡潔和普遍的數(shù)學(xué)語言來描述。

那么,到底什么是統(tǒng)計測度呢?目前沒有一個統(tǒng)一的定義。本文認(rèn)為,統(tǒng)計測度具有不同于測度的意義,并且大大超越數(shù)學(xué)上的界定,即它具有數(shù)學(xué)定義的一般屬性,但又不受制于函數(shù)表現(xiàn)形式,因為統(tǒng)計測度所要面對的是現(xiàn)實世界,實際問題要比理論上可以定義的問題復(fù)雜得多。按照我們的理解,統(tǒng)計測度就是用一定的符號和數(shù)字,用一定的形式和載體,對所研究的現(xiàn)象或事物的特征進行量化反映,表現(xiàn)為可用于統(tǒng)計分析的數(shù)據(jù)的過程。它應(yīng)該具有這樣一些屬性:以實際現(xiàn)象為測度對象,測度結(jié)果具有實際意義;以量化為目的,把信息轉(zhuǎn)化為數(shù)量,提供人們?nèi)菀桌斫獾亩拷Y(jié)論;個體特征的測度符合形成總體定量結(jié)論的要求,同時能夠體現(xiàn)個體差異。可以發(fā)現(xiàn),統(tǒng)計測度需要借用數(shù)學(xué)工具,但更重要的是對具體測度現(xiàn)象本質(zhì)特征的認(rèn)識和掌握。

統(tǒng)計測度可以從若干不同角度進行分類。邱東教授(2012)[7]曾在“宏觀測度的邊界悖律及其意義”一文中,從邊界的角度對宏觀測度進行了分類:一是因事物本身可測度性而形成的邊界,即本體論意義上的測度邊界;再一是由人的認(rèn)知能力而形成的邊界,即認(rèn)識論意義上的測度邊界;第三則是由統(tǒng)計相關(guān)性偏好和投入約束而形成的邊界,即操作意義上的測度邊界。這三條測度邊界,應(yīng)該以本體論意義的測度邊界最大,認(rèn)識論意義的測度邊界次之,而操作意義的測度邊界最小。這樣的分類,對于我們正確理解統(tǒng)計測度的內(nèi)涵很有幫助。受此啟發(fā),筆者認(rèn)為統(tǒng)計測度還可以有如下分類:

1.從測度的實現(xiàn)形式看,可以分為原始測度和再測度。原始測度也可以稱為直接測度,它通過對測度對象進行直接測度來獲取數(shù)據(jù),例如清點庫存物品數(shù)量、丈量作物播種面積、觀察培育細(xì)菌數(shù)目、檢測藥物成分等獲得的數(shù)據(jù),以及各種登記、記錄的原始數(shù)據(jù)等等。再測度也稱為間接測度,它以其他已知的測度數(shù)據(jù)為基礎(chǔ)去計算、推算或預(yù)測所需的未知數(shù)據(jù),例如根據(jù)GDP和人口數(shù)測度人均GDP、根據(jù)人口普查分年齡人口數(shù)據(jù)測度老齡化系數(shù)和社會負(fù)擔(dān)系數(shù)、根據(jù)相關(guān)指標(biāo)數(shù)據(jù)測度CPI的變化等等。復(fù)雜的再測度則需要借助相應(yīng)的統(tǒng)計模型作為工具,因為它實際上是對相關(guān)變量之間的關(guān)系進行定量反映。從兩者關(guān)系上看,原始測度是基礎(chǔ),是根本,沒有科學(xué)的原始測度就不會有可靠的再測度;再測度則是測度功能提升的必然要求,以解決原始測度不能解決的問題。

2.從測度的計量方式看,可以分為自然測度、物理測度、化學(xué)測度、時間測度和價值測度。自然測度是利用現(xiàn)象的自然屬性所進行的一種統(tǒng)計測度,例如人口規(guī)模、企業(yè)數(shù)量等的測度,采用自然計量單位;物理測度是利用現(xiàn)象的物理屬性所進行的一種統(tǒng)計測度,例如公路長度、作物播種面積、天然氣產(chǎn)量等的測度,采用物理計量單位;化學(xué)測度是利用現(xiàn)象的化學(xué)屬性所進行的一種統(tǒng)計測度,例如醫(yī)學(xué)、生物學(xué)中化學(xué)合成物的成分結(jié)構(gòu)測度,采用百分?jǐn)?shù)、千分?jǐn)?shù)或特定標(biāo)識為計量單位;時間測度是利用現(xiàn)象的時間屬性所進行的一種統(tǒng)計測度,例如勞動用工、閑暇時間等測度,采用時間計量單位;價值測度是利用現(xiàn)象的價值屬性所進行的一種統(tǒng)計測度,例如勞動報酬、經(jīng)濟活動成果等測度,采用貨幣計量單位。在這些測度計量方式中,價值測度因最具有綜合功能而應(yīng)用最為廣泛。

3.從測度的方法看,可以分為計數(shù)測度、測量測度、實驗測度、定義測度和模型測度。計數(shù)測度是一種通過觀測計數(shù)來獲得數(shù)據(jù)的方法,最為簡單,一般用于自然測度或時間測度;測量測度是一種根據(jù)物理或化學(xué)規(guī)制對現(xiàn)象進行測量、測算來獲得數(shù)據(jù)的方法,一般用于物理測度或化學(xué)測度;實驗測度是一種按照科學(xué)實驗原理、通過觀察實驗對象在既定條件下的反應(yīng)來獲得數(shù)據(jù)的方法,一般與測量測度相結(jié)合,用于獲取科學(xué)研究數(shù)據(jù);定義測度也可以稱之為指標(biāo)測度,是一種通過探究現(xiàn)象的本質(zhì)特征和活動規(guī)律、歸納出表現(xiàn)其數(shù)量特征的范疇、給出統(tǒng)計指標(biāo)定義(包括內(nèi)容、口徑、計算方法和表現(xiàn)形式等)來獲取數(shù)據(jù)的方法,最常用于價值測度,也用于其他形式的測度??梢哉f,定義測度方法應(yīng)用最為廣泛,但也最為困難。模型測度是一種根據(jù)現(xiàn)象與現(xiàn)象之間的內(nèi)在聯(lián)系關(guān)系、或者現(xiàn)象自身的發(fā)展變化規(guī)律,通過建立一定的方程模型來獲取數(shù)據(jù)的方法。前面三種統(tǒng)計測度方法基本上都屬于直接測度,定義測度既可能是直接測度、也可能是間接測度,而模型測度都屬于間接測度方法。

4.從測度的維度看,可以分為單一測度與多維測度。單一測度是指采用單一的方式方法對所研究現(xiàn)象或事物進行單一角度的測度,獲得單一的數(shù)據(jù)。多維測度是指對所研究現(xiàn)象或事物進行多角度的測度,測度過程中可能需要采用多種測度方法和計量方式,例如多指標(biāo)綜合評價就需要借助統(tǒng)計指標(biāo)體系對評價對象進行多角度的測度。顯然,單一測度是多維測度的基礎(chǔ)。

二、統(tǒng)計測度是統(tǒng)計學(xué)的立足之本

首先,從統(tǒng)計學(xué)的發(fā)展歷史看,是統(tǒng)計測度使統(tǒng)計學(xué)破繭而出。為什么主流觀點認(rèn)為政治算術(shù)是統(tǒng)計學(xué)的起源而不是國勢學(xué)?正是因為威廉·配第首次采用統(tǒng)計測度的方式進行了國家實力的統(tǒng)計分析和有關(guān)推算,得出了令人信服的結(jié)論。威廉·配第在1693年出版的《政治算術(shù)》[8]中寫道“因為和只使用比較級或最高級的詞匯以及單純作思維的論證相反,我卻采用了這樣的方法(作為我很久以來就想建立的政治算術(shù)的一個范例),即用數(shù)字、重量和尺度的詞匯來表達我自己想說的問題,只進行能訴諸人們的感官的論證和考察在性質(zhì)上有可見的根據(jù)的原因”,這一觀點在統(tǒng)計學(xué)的發(fā)展過程中產(chǎn)生了非常重要的影響。他的這段話雖然沒有出現(xiàn)測度一詞,但卻道出了測度的本質(zhì),即讓事物變得明白、變得有根據(jù),因為“數(shù)字、重量和尺度”就是測度、就是根據(jù),用“數(shù)字、重量和尺度的詞匯來表達想說的問題”就是一種測度的思想,盡管測度的方式方法還很簡單。相反,國勢學(xué)雖然提出了歸納法這一統(tǒng)計學(xué)的基本方法并首創(chuàng)了統(tǒng)計學(xué)一詞,但由于沒有采用統(tǒng)計測度的方式進行國勢問題的研究而難以修成正果。正如邱東教授[7]所說:“在配第之前,統(tǒng)計學(xué)的研究對象雖然是國家的態(tài)勢,但它在方法論上只是定性言說。一個國家的財富總量在本體論意義上是可以測度的。然而只是到了配第時期,人類才想到了要測度它,并發(fā)明了如何測度的基本方法。政治算術(shù),即開創(chuàng)期的經(jīng)濟統(tǒng)計學(xué),實現(xiàn)了從無到有的轉(zhuǎn)變,大大擴展了宏觀測度的認(rèn)識論邊界,因而才具有了統(tǒng)計學(xué)范式創(chuàng)新的革命性意義。”同樣,格朗特的《關(guān)于死亡表的自然觀察和政治觀察》也是人口統(tǒng)計測度方面的經(jīng)典之作,無論是原始測度還是再測度,都給后人留下了寶貴的財富。之后,統(tǒng)計學(xué)就是沿著如何更加科學(xué)、準(zhǔn)確測度世界這一主線而發(fā)展的。筆者曾在“從政治算術(shù)到大數(shù)據(jù)分析”一文[9],對數(shù)據(jù)的變化與統(tǒng)計分析方法的發(fā)展進行了粗淺的歸納,其主題實際上就是統(tǒng)計測度問題。

其次,從統(tǒng)計學(xué)的研究對象上看,統(tǒng)計測度是體現(xiàn)統(tǒng)計學(xué)數(shù)量性特征的前提條件。統(tǒng)計學(xué)的研究對象是現(xiàn)象的數(shù)量方面,或者說統(tǒng)計學(xué)是關(guān)于如何收集和分析數(shù)據(jù)的科學(xué)。統(tǒng)計數(shù)據(jù)從何而來?從統(tǒng)計測度中來。數(shù)據(jù)不同于數(shù)字,數(shù)字是統(tǒng)計測度的符號,數(shù)據(jù)是統(tǒng)計測度的結(jié)果,這也正是統(tǒng)計學(xué)區(qū)別于數(shù)學(xué)之處。所以說,數(shù)據(jù)的本質(zhì)問題就是統(tǒng)計測度問題,故此統(tǒng)計測度是統(tǒng)計學(xué)的基本問題。這里重點討論兩個問題:一是統(tǒng)計測度與統(tǒng)計指標(biāo)的關(guān)系,二是統(tǒng)計測度面臨的新問題。關(guān)于第一個問題,本文認(rèn)為統(tǒng)計測度與統(tǒng)計指標(biāo)是一個事物的兩個方面,這個事物就是數(shù)據(jù)。統(tǒng)計指標(biāo)法是統(tǒng)計學(xué)的基本方法之一,盡管前面對統(tǒng)計測度從方式方法上進行了分類,但從廣義上說所有統(tǒng)計測度都是定義測度,都表現(xiàn)為指標(biāo)。也就是說,任何統(tǒng)計測度———不論是直接測度還是間接測度,最終目的是獲得能夠讓人明白的數(shù)據(jù),而表現(xiàn)數(shù)據(jù)的最主要形式就是統(tǒng)計指標(biāo),其他表現(xiàn)數(shù)據(jù)的形式都是派生出來的。所以,統(tǒng)計測度就是根據(jù)所設(shè)定的統(tǒng)計指標(biāo)去獲得所需的數(shù)據(jù)。關(guān)于第二個問題,與后文所要論及的大數(shù)據(jù)有關(guān),就是定性測度問題。在統(tǒng)計學(xué)中,數(shù)據(jù)可以分為兩類———定性數(shù)據(jù)與定量數(shù)據(jù),其中定性數(shù)據(jù)又包括定類數(shù)據(jù)與定序數(shù)據(jù)兩種,它們屬于非結(jié)構(gòu)化或半結(jié)構(gòu)化數(shù)據(jù)。相應(yīng)地,統(tǒng)計測度也可分為定性測度與定量測度。很顯然,只有定性測度與定量測度方法得到同步發(fā)展,統(tǒng)計學(xué)才能更加完善。總體上看,定量數(shù)據(jù)的統(tǒng)計測度已經(jīng)比較完善,但定性數(shù)據(jù)的統(tǒng)計測度還有很多問題尚待解決,難點就在于測度的切入點———如何提取有效的信息、如何最終轉(zhuǎn)化為統(tǒng)計指標(biāo)。盡管關(guān)于定性數(shù)據(jù)分析的論著已經(jīng)不少,但還沒有從理論方法上建立起定性數(shù)據(jù)統(tǒng)計測度的體系,因此統(tǒng)計學(xué)在這方面的任務(wù)依然很重。

第三,從統(tǒng)計學(xué)的永恒主題看,通過科學(xué)的數(shù)據(jù)分析、得出有效的結(jié)論是其不變的追求,而數(shù)據(jù)分析過程就是綜合的統(tǒng)計測度過程。獲得數(shù)據(jù)的目的是為了發(fā)現(xiàn)隱含其中的有價值的信息,即發(fā)現(xiàn)數(shù)據(jù)背后的數(shù)據(jù),讓數(shù)據(jù)再生數(shù)據(jù),從而滿足人們認(rèn)識事物、掌握規(guī)律、科學(xué)決策的需要。除了總量、結(jié)構(gòu)等基本信息外,更重要的是通過數(shù)據(jù)分析來呈現(xiàn)現(xiàn)象的變化規(guī)律與相互關(guān)系。不難發(fā)現(xiàn),這種數(shù)據(jù)分析的過程,就是不斷進行各種統(tǒng)計測度的過程,所以最終的統(tǒng)計分析結(jié)果實際上就是各環(huán)節(jié)、各方面的各種類型的統(tǒng)計測度的疊加結(jié)果,或者說是統(tǒng)計測度不斷放大的過程。大量針對社會經(jīng)濟現(xiàn)象進行分析研究的文獻(不論是否冠以“測度”兩字),只要有數(shù)據(jù)分析,都是如此??梢哉f,統(tǒng)計測度貫穿于統(tǒng)計數(shù)據(jù)分析的全過程。但是,為什么很多統(tǒng)計數(shù)據(jù)分析并沒有得出有效的結(jié)論呢?本文認(rèn)為原因就出在統(tǒng)計測度上,尤其是沒有首先解決好原始統(tǒng)計測度問題。應(yīng)該說,圍繞數(shù)據(jù)分析已經(jīng)建立起一整套比較完整的統(tǒng)計方法體系,很多方法也都身經(jīng)百戰(zhàn)、行之有效,但一旦原始統(tǒng)計測度有問題、數(shù)據(jù)不準(zhǔn)確或不真實,那么任何方法都只是擺設(shè)。仔細(xì)研讀很多所謂的實證分析文獻,其重點均在于構(gòu)建什么樣的模型或運用什么樣的方法,雖然有的文獻也必須要討論選擇什么樣的變量(指標(biāo))這個問題,但并不是系統(tǒng)地從測度的角度進行闡述,因此所用的模型越來越復(fù)雜,但所得的結(jié)論卻離實際情況越來越遠。學(xué)界總是有這樣一種觀念:變量越多、符號越新奇、模型越復(fù)雜的文章才越有水平,似乎這樣分析所得的結(jié)論才越可靠。殊不知,不以科學(xué)可靠的原始統(tǒng)計測度為基礎(chǔ),任何數(shù)據(jù)分析都會成為無源之水、無本之木,所得的結(jié)論也只是更精確的錯誤而已。本文認(rèn)為,任何脫離科學(xué)統(tǒng)計測度的統(tǒng)計分析都是毫無意義的,充其量是一種數(shù)字游戲而已。應(yīng)該樹立這樣一種觀念:科學(xué)的統(tǒng)計數(shù)據(jù)分析首先取決于科學(xué)的統(tǒng)計測度,而不是首先取決于什么樣的分析模型,雖然模型也很重要。這也再一次證明,統(tǒng)計測度問題是統(tǒng)計學(xué)的根本問題。其實,歸根結(jié)底看,在統(tǒng)計數(shù)據(jù)分析過程中,每一步分析都以前一步的測度為原始測度,每一步所用的方法都是統(tǒng)計測度方法,因此所有的統(tǒng)計分析方法都是統(tǒng)計測度方法。甚至可以說,統(tǒng)計學(xué)方法體系就是統(tǒng)計測度方法體系。

當(dāng)然,在實際的統(tǒng)計分析中,統(tǒng)計測度往往遇到一些困難,即有些指標(biāo)數(shù)據(jù)由于各種原因無法獲得,這就不得不采用替代這種途徑。例如,綠色GDP核算的概念已經(jīng)提出很多年,但為什么還沒有哪個國家真正公布綠色GDP數(shù)據(jù),原因就是自然資源價值、生態(tài)環(huán)境價值等的統(tǒng)計測度目前還面臨著很大的困難,其背后存在著一系列有待進一步研究和解決的理論與實踐問題,因此不少學(xué)者進行了替代測度的探討。這一方面說明統(tǒng)計測度的重要性,另一方面說明統(tǒng)計測度替代的無奈性。但是,替代測度必須遵守相應(yīng)的規(guī)則與邏輯,要經(jīng)得起推敲。有的文獻明明知道有關(guān)變量無法測度、有關(guān)數(shù)據(jù)無法獲得,卻隨意地、不符合邏輯地進行所謂的替代,結(jié)果是最后的結(jié)論不知替代成什么樣了,很難理解它的意義。關(guān)于替代測度的有效性問題,邱東教授[7]已有精辟的論述,在此不再展開討論。

三、統(tǒng)計測度是數(shù)據(jù)科學(xué)的基礎(chǔ)

籠統(tǒng)地講,數(shù)據(jù)科學(xué)就是以大數(shù)據(jù)為研究對象的科學(xué),需要多學(xué)科交叉融合、共同支撐。由于大數(shù)據(jù)是快速增長的復(fù)雜數(shù)據(jù),因此大數(shù)據(jù)分析僅有統(tǒng)計思維與統(tǒng)計分析方法是不夠的,還需要強大的數(shù)據(jù)處理能力與計算能力。只有把統(tǒng)計思維、統(tǒng)計方法與計算技術(shù)結(jié)合起來,才有可能真正挖掘出大數(shù)據(jù)中的有價值信息。本文認(rèn)為統(tǒng)計思維、統(tǒng)計方法與計算技術(shù)相結(jié)合的基礎(chǔ)就是科學(xué)的統(tǒng)計測度。

首先,大數(shù)據(jù)技術(shù)不能自行解決其計算和分析應(yīng)從何處著手的問題。現(xiàn)代信息技術(shù)與互聯(lián)網(wǎng)、物聯(lián)網(wǎng)技術(shù)的快速發(fā)展,使人類進入大數(shù)據(jù)時代,也有人說進入到數(shù)聯(lián)網(wǎng)時代,這意味著我們一方面被各種越來越多、越來越復(fù)雜的數(shù)據(jù)所包圍,另一方面又被數(shù)據(jù)中巨大的信息價值所吸引,想從中挖掘出可供決策之用的信息。如何挖掘大數(shù)據(jù)?人們已經(jīng)進行了艱苦的探索,發(fā)展了很多專門的方法技術(shù),并已嘗到了不少甜頭,但遠未達到充分利用大數(shù)據(jù)中有效信息的目的,因為已有的大數(shù)據(jù)分析研究主要集中于計算機科學(xué)與技術(shù)、軟件工程、計算數(shù)學(xué)等領(lǐng)域,重點是計算能力與算法研究,而很少從統(tǒng)計學(xué)的角度進行有針對的探討,還沒有真正進入數(shù)據(jù)分析的深層。這里面實際上忽略了最基礎(chǔ)的統(tǒng)計測度問題。如果說,計算技術(shù)的發(fā)展能夠解決數(shù)據(jù)儲存與計算的能力問題,算法模型的改進能夠解決大數(shù)據(jù)分析的綜合能力問題,那么它們?nèi)匀徊荒芙鉀Q對誰進行計算與分析的問題,也即從何處著手的問題。無論是傳統(tǒng)的結(jié)構(gòu)型數(shù)據(jù),還是現(xiàn)在的包含大量非結(jié)構(gòu)型數(shù)據(jù)的大數(shù)據(jù),要對它們進行分析都必須找到正確的切入口,即分析的基本元素是什么,或者說需要測度什么。當(dāng)然,還有如何測度的問題。然后,才能進行分組、綜合和構(gòu)建模型,否則大數(shù)據(jù)分析不會達到人們的預(yù)期。

其次,大數(shù)據(jù)之所以催生數(shù)據(jù)科學(xué),就是為了通過多學(xué)科交叉融合來共同解決大數(shù)據(jù)分析中存在的問題,其中包括統(tǒng)計測度問題,這一點對于非結(jié)構(gòu)化數(shù)據(jù)尤為突出。實際上,大數(shù)據(jù)的本質(zhì)就是非結(jié)構(gòu)化數(shù)據(jù),一是體量大、比重高(超過95%),二是變化快、形式多,三是內(nèi)容雜、不確定。通過各種社交網(wǎng)絡(luò)、自媒體、富媒體,以及人機對話和機器感應(yīng)記錄等產(chǎn)生的各種非結(jié)構(gòu)化數(shù)據(jù),例如各種文字、各種表情符號、各種聲音、各種圖像,到底表示什么?綜合在一起能體現(xiàn)什么規(guī)律?如何綜合各種信息?存在著大量有待研究的問題。其實,文字的長短、用詞、表達形式(敘述式、議論式、散文式、詩歌式,等)甚至字體大小與顏色,表情類型與偏好,聲音高低、頻率與情緒,圖像顏色等等,都是有特定意義的,即在特定環(huán)境條件下的反應(yīng)。所以,一句話或一段聲音的意義并非文字本身的意思,一個表情符號的意義并非符號表征的意思,一個圖像的意義并非圖像內(nèi)容與色彩本身的意思,因為背后有太多的未知。人們?yōu)g覽檢索各種信息的習(xí)慣、收看與回復(fù)郵件等信息的習(xí)慣、參與信息網(wǎng)絡(luò)的習(xí)慣、購物習(xí)慣與支付習(xí)慣等等,也是如此。更何況,同樣的網(wǎng)絡(luò)詞匯在不同的時間代表著不同的語義。這背后隱藏著的是人們的行為與社會關(guān)系,既具有個性又具有共性,極其復(fù)雜。所以對這樣的數(shù)據(jù)進行分析,首先絕非是計算問題,也不是用什么模型問題,而首先是從何處著手、如何選取關(guān)鍵詞、如何選定關(guān)聯(lián)詞、可以用什么樣的指標(biāo)來綜合、可以用什么樣的表式來表現(xiàn)等問題,一句話就是統(tǒng)計測度問題。非結(jié)構(gòu)化數(shù)據(jù)的統(tǒng)計測度將主要是定義測度,這些問題不解決,分析模型也是難以構(gòu)建的,或者難以得出令人信服的結(jié)論。

例如,關(guān)于《紅樓夢》前80回與后40回是否同一作者的爭論,韋博成[10]進行了綜合性的比較研究并提出了自己的觀點,他指出已有美國威斯康辛大學(xué)華裔學(xué)者陳炳藻教授(1980)[11]、我國華東師范大學(xué)陳大康教授(1987年)[12]和復(fù)旦大學(xué)李賢平教授(1987年)[13]等學(xué)者從統(tǒng)計學(xué)的角度進行過專門的研究,但卻得出了不同的結(jié)論:陳炳藻教授認(rèn)為前80回與后40回均是曹雪芹所著;陳大康教授認(rèn)為前80回與后40回為不同人所著;李賢平教授認(rèn)為前80回是曹雪芹根據(jù)《石頭記》增刪而成,后40回是曹雪芹親友搜集整理原稿加工補寫而成。此外,還有其他一些學(xué)者進行過類似的研究,也有一些不同的結(jié)論。為什么都通過提取關(guān)聯(lián)詞和統(tǒng)計的方法卻得出不同的結(jié)論?原因就在于用以分析的關(guān)聯(lián)詞不同,即統(tǒng)計測度的切入點不同,當(dāng)然也有統(tǒng)計方法上的差異,但前者是根本。至少存在幾個統(tǒng)計測度上的問題:提取單一維度的關(guān)聯(lián)詞還是多維度的關(guān)聯(lián)詞?提取什么類型的關(guān)聯(lián)詞(例如:關(guān)聯(lián)詞是名詞、形容詞還是動詞;是花卉、樹木、飲食、醫(yī)藥還是詩詞)?這些關(guān)聯(lián)詞可以綜合為什么樣的指標(biāo)?等等。由此可見,原始統(tǒng)計測度代表著數(shù)據(jù)分析的方向。

相比《紅樓夢》,大數(shù)據(jù)分析要復(fù)雜得多、困難得多。所以,數(shù)據(jù)科學(xué)除了需要數(shù)學(xué)、統(tǒng)計學(xué)、計算機科學(xué)與技術(shù)、人工智能等學(xué)科的交叉融合外,還需要與行為科學(xué)、語言學(xué)、社會學(xué)、經(jīng)濟學(xué)等學(xué)科相結(jié)合,以便能很好地解決作為數(shù)據(jù)分析之前提的統(tǒng)計測度問題。

第三,數(shù)據(jù)科學(xué)將進一步拓展統(tǒng)計測度的邊界,并提出更高的要求。伴隨著人類認(rèn)識世界的范圍的不斷拓展,統(tǒng)計測度的范圍也不斷擴大,從自然現(xiàn)象統(tǒng)計測度到人口現(xiàn)象、經(jīng)濟現(xiàn)象統(tǒng)計測度,再到社會現(xiàn)象、環(huán)境現(xiàn)象、政治現(xiàn)象等統(tǒng)計測度,幾乎已經(jīng)滲透到了所有可以想象到的領(lǐng)域。相應(yīng)地,統(tǒng)計數(shù)據(jù)分析也從少量數(shù)據(jù)的分析進入到了大數(shù)據(jù)分析。大數(shù)據(jù)的復(fù)雜性、不確定性和涌現(xiàn)性(王元卓等,2013)[14],意味著統(tǒng)計測度的內(nèi)容大大增加,原來一些不能測度的數(shù)據(jù)被納入到了統(tǒng)計測度的范圍,按照邱東教授的說法就是統(tǒng)計測度的邊界大大擴展了。統(tǒng)計測度邊界的擴大,必須以統(tǒng)計測度能力的提升為前提,即要求統(tǒng)計學(xué)借助現(xiàn)代信息技術(shù)進一步提升處理和分析數(shù)據(jù)的能力———對大數(shù)據(jù)“化繁為簡”、“變厚為薄”的能力,這就必須以科學(xué)準(zhǔn)確的大數(shù)據(jù)統(tǒng)計測度為前提,既改變統(tǒng)計思維,又創(chuàng)新統(tǒng)計分析方法,其中就包括統(tǒng)計測度思維、統(tǒng)計測度方法與統(tǒng)計測度標(biāo)準(zhǔn)。面對大量繁雜的數(shù)據(jù),如果沒有更好的統(tǒng)計測度思路與方法,包括個體標(biāo)志定義方法、最小數(shù)據(jù)細(xì)胞分組與聚類方法、關(guān)聯(lián)詞含義的時間影響計量方法、定性測度指標(biāo)篩選方法、再測度路徑與方法、大數(shù)據(jù)統(tǒng)計測度評價標(biāo)準(zhǔn)等,那么統(tǒng)計學(xué)在數(shù)據(jù)科學(xué)發(fā)展過程中就難以發(fā)揮應(yīng)有的作用,數(shù)據(jù)科學(xué)也將裹足不前。這就是統(tǒng)計學(xué)邁向數(shù)據(jù)科學(xué)的重要挑戰(zhàn)之一。

綜上所述,統(tǒng)計測度的基礎(chǔ)性問題從統(tǒng)計學(xué)延伸到了數(shù)據(jù)科學(xué),是兩者的共同基礎(chǔ),并且對于數(shù)據(jù)科學(xué)而言顯得更為重要。大數(shù)據(jù)的復(fù)雜性、不確定性和涌現(xiàn)性導(dǎo)致了統(tǒng)計測度的難度猛增,亟需建立面向大數(shù)據(jù)分析的統(tǒng)計測度理論與方法。要通過研究大數(shù)據(jù)的復(fù)雜性、不確定性和涌現(xiàn)性特征的基本因素,以及這些因素之間的內(nèi)在聯(lián)系、外在指標(biāo)和測度方法,進而研究基于先進計算技術(shù)的大數(shù)據(jù)度量模型,構(gòu)建尋找面向計算的數(shù)據(jù)內(nèi)核或者數(shù)據(jù)邊界的基本方法??傊?,建立有效易行的數(shù)據(jù)表示方法,即科學(xué)的統(tǒng)計測度方法,是數(shù)據(jù)科學(xué)必須解決的基礎(chǔ)問題之一。

四、創(chuàng)新與完善大數(shù)據(jù)統(tǒng)計測度方法

如前所述,統(tǒng)計學(xué)研究對象已經(jīng)從結(jié)構(gòu)化數(shù)據(jù)延伸到了包括非結(jié)構(gòu)化數(shù)據(jù)在內(nèi)的一切數(shù)據(jù),統(tǒng)計測度邊界得到了大大的擴展。按照邱東教授[7]曾經(jīng)引用過的海德格爾的話:“界限并不表示某一事物的發(fā)展到此為止,而是像希臘人所認(rèn)知的那樣,界限是某種事物開始展現(xiàn)的地方”,預(yù)示著統(tǒng)計學(xué)在數(shù)據(jù)科學(xué)發(fā)展階段的新起點已經(jīng)展現(xiàn)在我們面前。新的統(tǒng)計測度邊界催生統(tǒng)計測度方法的創(chuàng)新,統(tǒng)計測度方法的創(chuàng)新促進統(tǒng)計測度邊界的拓展,兩者相輔相成,共同推動統(tǒng)計學(xué)與數(shù)據(jù)科學(xué)的發(fā)展。為此,我們要系統(tǒng)梳理統(tǒng)計測度方法的發(fā)展歷程,面對大數(shù)據(jù)提出的新挑戰(zhàn),大膽探索統(tǒng)計測度的新思路、新理論和新方法,為數(shù)據(jù)科學(xué)奠定堅實的統(tǒng)計學(xué)基礎(chǔ)。為此提出如下幾點建議:

首先,要緊密結(jié)合現(xiàn)象的本質(zhì)去探求更科學(xué)的統(tǒng)計測度方法。本質(zhì)決定一切,既然統(tǒng)計測度的目的是獲得客觀反映現(xiàn)象本質(zhì)的數(shù)據(jù),那么深入到現(xiàn)象本質(zhì)、認(rèn)識和掌握現(xiàn)象的本質(zhì),是科學(xué)統(tǒng)計測度的關(guān)鍵,也是探求新的統(tǒng)計方法的出發(fā)點。換句話說,科學(xué)的統(tǒng)計測度方法能夠體現(xiàn)出數(shù)據(jù)的真正意義。例如,要探求社交網(wǎng)絡(luò)數(shù)據(jù)的統(tǒng)計分析和測度方法,就必須了解社交網(wǎng)絡(luò)的產(chǎn)生背景、構(gòu)成要素、表現(xiàn)形式與基本特征,既要研究它的共性問題,又要研究它的個性問題與差異性,同時還要研究它的變化趨勢。只有這樣,才能掌握社交網(wǎng)絡(luò)數(shù)據(jù)的構(gòu)成要件或元素,才能建立起科學(xué)的、能有效體現(xiàn)社交網(wǎng)絡(luò)數(shù)據(jù)意義的統(tǒng)計測度方法。再如,要分析研究電子商務(wù)數(shù)據(jù),也必須先弄清楚什么是電子商務(wù),尤其是弄清楚它與傳統(tǒng)的商業(yè)模式有什么不同(包括物流、資金流與信息流)、有哪些新生事物(包括時空特征、法律監(jiān)管)等等,否則統(tǒng)計測度無從下手或者抓不住要害。同時,作為一個新的研究領(lǐng)域,數(shù)據(jù)科學(xué)的理論基礎(chǔ)將與計算機科學(xué)、統(tǒng)計學(xué)、人工智能、數(shù)學(xué)、社會科學(xué)等有關(guān),離不開對相關(guān)學(xué)科領(lǐng)域知識與研究方法的借鑒,因此對相關(guān)領(lǐng)域的知識與研究方法的學(xué)習(xí)十分重要。否則,就會嚴(yán)重扭曲統(tǒng)計測度方法,胡亂設(shè)置測度標(biāo)志,這需要引起高度關(guān)注。

其次,要緊密結(jié)合大數(shù)據(jù)的特點去創(chuàng)新統(tǒng)計測度方法。大數(shù)據(jù)的特點是復(fù)雜性、不確定性和涌現(xiàn)性并存,構(gòu)成了多維的數(shù)據(jù)空間,里面蘊藏著豐富的信息資源,這是傳統(tǒng)的統(tǒng)計數(shù)據(jù)不可比擬的。那么該從何處進入這樣的數(shù)據(jù)空間?怎么進去?又怎么出來?這歸根結(jié)底還是統(tǒng)計測度方法問題。因此,在開展大數(shù)據(jù)分析之前,首先要研究大數(shù)據(jù)的基礎(chǔ)性問題,包括大數(shù)據(jù)的內(nèi)在機理(包括大數(shù)據(jù)的演化與傳播機制、生命周期),數(shù)據(jù)科學(xué)與社會學(xué)、經(jīng)濟學(xué)、行為科學(xué)等之間的互動機制,以及大數(shù)據(jù)的結(jié)構(gòu)與效能的規(guī)律性等等,為創(chuàng)新統(tǒng)計測度方法提供導(dǎo)向。本文認(rèn)為,再復(fù)雜的數(shù)據(jù)也有共性,再不確定的數(shù)據(jù)也有規(guī)律,再涌現(xiàn)的數(shù)據(jù)也有軌跡。網(wǎng)絡(luò)大數(shù)據(jù)背后的網(wǎng)絡(luò)平均路徑長度、度分布、聚集系數(shù)、核數(shù)、介數(shù)等具有共性的特征與參數(shù),是開展復(fù)雜網(wǎng)絡(luò)數(shù)據(jù)分析的基礎(chǔ)(李國杰、程學(xué)旗,2012)[15];大數(shù)據(jù)在時空維度上的分布形式、內(nèi)在結(jié)構(gòu)、動態(tài)變化和相關(guān)聯(lián)的規(guī)律,是找到大數(shù)據(jù)分析切入口、進而簡化大數(shù)據(jù)表征的前提;大數(shù)據(jù)的涌現(xiàn)性軌跡(包括模式涌現(xiàn)性、行為涌現(xiàn)性和智慧涌現(xiàn)性),是研究更多的社會網(wǎng)絡(luò)模型和理解網(wǎng)絡(luò)瓦解失效原因,理解人們網(wǎng)絡(luò)行為涌現(xiàn)特征(例如人們發(fā)郵件數(shù)量的時間分布特征),以及探求大量自發(fā)個體語義融合連接形成有特定意義的通用語義之過程的路徑(靳小龍等,2013)[16]。也就是說,這些共性、規(guī)律和軌跡就是統(tǒng)計測度的主要依據(jù),也是重點內(nèi)容。發(fā)展和創(chuàng)新能夠準(zhǔn)確發(fā)現(xiàn)大數(shù)據(jù)的共性、規(guī)律和軌跡的定量方法,其實就是發(fā)展和創(chuàng)新大數(shù)據(jù)統(tǒng)計測度方法。

第三,要緊密結(jié)合現(xiàn)代信息技術(shù)以完善統(tǒng)計測度方法。復(fù)雜、多變和不斷涌現(xiàn)的大數(shù)據(jù),不僅需要借助現(xiàn)代信息技術(shù)(包括硬件與軟件)來解決極其復(fù)雜的分析計算問題,也需要利用現(xiàn)代信息技術(shù)來解決其繁雜多樣的統(tǒng)計測度問題。對于大數(shù)據(jù),不論是原始統(tǒng)計測度還是再測度,其復(fù)雜性或難度都不是傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)所能相提并論的,哪怕是基本的關(guān)聯(lián)詞計數(shù)、分類與匯總,其工作量之大也超乎想象,不借用現(xiàn)代信息技術(shù)幾乎是不可能完成的。而事實上,有些統(tǒng)計測度的內(nèi)容與方法本身也是以數(shù)據(jù)處理能力的提升為前提的??梢哉f,脫離現(xiàn)代信息技術(shù),人們難以承受大數(shù)據(jù)的統(tǒng)計測度與分析任務(wù);要把統(tǒng)計測度思想變?yōu)榭蓪崿F(xiàn)的統(tǒng)計測度方法,必須借助現(xiàn)代信息技術(shù)。為此,要充分利用各種信息技術(shù)和手段,把統(tǒng)計測度與數(shù)據(jù)清洗相結(jié)合、與數(shù)據(jù)分析模型相結(jié)合、與計算方法相結(jié)合,努力建立融自動搜索統(tǒng)計測度、動態(tài)演化統(tǒng)計測度和自主優(yōu)選統(tǒng)計測度為一體的大數(shù)據(jù)統(tǒng)計測度方法體系。

篇(3)

【關(guān)鍵詞】統(tǒng)計學(xué);統(tǒng)計思想;認(rèn)識

1關(guān)于統(tǒng)計學(xué)

統(tǒng)計學(xué)是一門實質(zhì)性的社會科學(xué),既研究社會生活的客觀規(guī)律,也研究統(tǒng)計方法。統(tǒng)計學(xué)是繼承和發(fā)展基礎(chǔ)統(tǒng)計的理論成果,堅持統(tǒng)計學(xué)的社會科學(xué)性質(zhì),使統(tǒng)計理論研究更接近統(tǒng)計工作實際,在國家和社會得到廣泛發(fā)展。

2 統(tǒng)計學(xué)中的幾種統(tǒng)計思想

2.1 統(tǒng)計思想的形成

統(tǒng)計思想不是天然形成的,需要經(jīng)歷統(tǒng)計觀念、統(tǒng)計意識、統(tǒng)計理念等階段。統(tǒng)計思想是根據(jù)人類社會需求的變化而開展各種統(tǒng)計實踐、統(tǒng)計理論研究與概括,才能逐步形成系統(tǒng)的統(tǒng)計思想。

2.2 比較常用的幾種統(tǒng)計思想

所謂統(tǒng)計思想,就是統(tǒng)計實際工作、統(tǒng)計學(xué)理論及應(yīng)用研究中必須遵循的基本理念和指導(dǎo)思想。統(tǒng)計思想主要包括:均值思想、變異思想、估計思想、相關(guān)思想、擬合思想、檢驗思想?,F(xiàn)分述如下:

2.2.1 均值思想

均值是對所要研究對象的簡明而重要的代表。均值概念幾乎涉及所有統(tǒng)計學(xué)理論,是統(tǒng)計學(xué)的基本思想。均值思想也要求從總體上看問題,但要求觀察其一般發(fā)展趨勢,避免個別偶然現(xiàn)象的干擾,故也體現(xiàn)了總體觀。

2.2.2 變異思想

統(tǒng)計研究同類現(xiàn)象的總體特征,它的前提則是總體各單位的特征存在著差異。統(tǒng)計方法就是要認(rèn)識事物數(shù)量方面的差異。統(tǒng)計學(xué)反映變異情況較基本的概念是方差,是表示“變異”的“一般水平”的概念。平均與變異都是對同類事物特征的抽象和宏觀度量。

2.2.3 估計思想

估計以樣本推測總體,是對同類事物的由此及彼式的認(rèn)識方法。使用估計方法有一個預(yù)設(shè):樣本與總體具有相同的性質(zhì)。樣本才能代表總體。但樣本的代表性受偶然因素影響,在估計理論對置信程度的測量就是保持邏輯嚴(yán)謹(jǐn)?shù)谋匾襟E。

2.2.4 相關(guān)思想

事物是普遍聯(lián)系的,在變化中,經(jīng)常出現(xiàn)一些事物相隨共變或相隨共現(xiàn)的情況,總體又是由許多個別事務(wù)所組成,這些個別事物是相互關(guān)聯(lián)的,而我們所研究的事物總體又是在同質(zhì)性的基礎(chǔ)上形成。因而,總體中的個體之間、這一總體與另一總體之間總是相互關(guān)聯(lián)的。

2.2.5 擬合思想

擬合是對不同類型事物之間關(guān)系之表象的抽象。任何一個單一的關(guān)系必須依賴其他關(guān)系而存在,所有實際事物的關(guān)系都表現(xiàn)得非常復(fù)雜,這種方法就是對規(guī)律或趨勢的擬合。擬合的成果是模型,反映一般趨勢。趨勢表達的是“事物和關(guān)系的變化過程在數(shù)量上所體現(xiàn)的模式和基于此而預(yù)示的可能性”。

2.2.6 檢驗思想

統(tǒng)計方法總是歸納性的,其結(jié)論永遠帶有一定的或然性,基于局部特征和規(guī)律所推廣出來的判斷不可能完全可信,檢驗過程就是利用樣本的實際資料來檢驗事先對總體某些數(shù)量特征的假設(shè)是否可信。

2.3 統(tǒng)計思想的特點

作為一門應(yīng)用統(tǒng)計學(xué),它從數(shù)理統(tǒng)計學(xué)派汲取新的營養(yǎng),并且越來越廣泛的應(yīng)用數(shù)學(xué)方法,聯(lián)系也越來越密切,但在統(tǒng)計思想的體現(xiàn)上與通用學(xué)派相比,還有著自己的特別之處。其基本特點能從以下四個方面體現(xiàn)出:(1)統(tǒng)計思想強調(diào)方法性與應(yīng)用性的統(tǒng)一;(2)統(tǒng)計思想強調(diào)科學(xué)性與藝術(shù)性的統(tǒng)一;(3)統(tǒng)計思想強調(diào)客觀性與主觀性的統(tǒng)一;(4)統(tǒng)計思想強調(diào)定性分析與定量分析的統(tǒng)一。

3 對統(tǒng)計思想的一些思考

3.1 要更正當(dāng)前存在的一些不正確的思想認(rèn)識

英國著名生物學(xué)家、統(tǒng)計學(xué)家高爾頓曾經(jīng)說過:“統(tǒng)計學(xué)具有處理復(fù)雜問題的非凡能力,當(dāng)科學(xué)的探索者在前進的過程中荊棘載途時,唯有統(tǒng)計學(xué)可以幫助他們打開一條通道”。但事實并非這么簡單,因為我們所面臨的現(xiàn)實問題可能要比想象的復(fù)雜得多。此外,有些人認(rèn)為方法越復(fù)雜越科學(xué),在實際的分析研究中,喜歡簡單問題復(fù)雜化,似乎這樣才能顯示其科學(xué)含量。其實,真正的科學(xué)是使復(fù)雜的問題簡單化而不是追求復(fù)雜化。與此相關(guān)聯(lián)的是,有些人認(rèn)為只有推斷統(tǒng)計才是科學(xué),描述統(tǒng)計不是科學(xué),并延伸擴大到只有數(shù)理統(tǒng)計是科學(xué)、社會經(jīng)濟統(tǒng)計不是科學(xué)這樣的認(rèn)識。這種認(rèn)識是極其錯誤的,至少是對社會經(jīng)濟統(tǒng)計的無知。比利時數(shù)學(xué)家凱特勒不僅研究概率論,并且注重于把統(tǒng)計學(xué)應(yīng)用于人類事物,試圖把統(tǒng)計學(xué)創(chuàng)建成改良社會的一種工具。經(jīng)濟學(xué)和人口統(tǒng)計學(xué)中的某些近代概念,如GNP、人口增長率等等,均是凱特勒及其弟子們的遺產(chǎn)。

3.2要不斷拓展統(tǒng)計思維方式

統(tǒng)計學(xué)是以歸納推理或歸納思維為主要的邏輯方式的。眾所周知,邏輯推理方式主要有兩種:歸納推理和演繹推理。歸納推理是基于觀測到的數(shù)據(jù)信息(尤其是不完全甚至劣質(zhì)的信息)去產(chǎn)生新的知識或去驗證一個假設(shè),即以所掌握的數(shù)據(jù)信息為依據(jù),歸納得出具有一般特征的結(jié)論。歸納推理是要在數(shù)據(jù)信息的基礎(chǔ)上透過偶然性去發(fā)現(xiàn)必然性。演繹推理是對統(tǒng)計認(rèn)識能力的深化,尤其是在根據(jù)必然性去研究和認(rèn)識偶然性方面,具有很大的作用。

3.3深化對數(shù)據(jù)分析的認(rèn)識

任何統(tǒng)計研究都離不開數(shù)據(jù)分析。因為這是得到統(tǒng)計研究結(jié)論的必要環(huán)節(jié)。雖然統(tǒng)計分析的形式隨時代的推移而變化著,但是“從數(shù)據(jù)中提取一切信息”或者“歸納和揭示”作為統(tǒng)計分析的目的卻一直沒有改變。對統(tǒng)計數(shù)據(jù)分析的原因有以下三個方面:一是基于同樣的數(shù)據(jù)會得出不同、甚至相反的分析結(jié)論;二是我們所面對的分析數(shù)據(jù)有時是缺損的或存在不真實性;三是我們所面對的分析數(shù)據(jù)有時則又是海量的,讓人無從下手。雖然統(tǒng)計數(shù)據(jù)分析已經(jīng)經(jīng)歷了描述性數(shù)據(jù)分析(DDA)、推斷性數(shù)據(jù)分析(IDA)和探索性數(shù)據(jù)分析(EDA)等階段,分析的方法技術(shù)已經(jīng)有了質(zhì)的飛躍,但與人類不斷提高的要求相比,存在的問題似乎也越來越多。所以,我們必須深化對數(shù)據(jù)分析的認(rèn)識,圍繞“準(zhǔn)確解答特定問題并且從數(shù)據(jù)中獲取一切有效信息”這一目的,不斷拓展研究思路,繼續(xù)開展數(shù)據(jù)分析方法技術(shù)的研究。

參考文獻:

[1] 陳福貴.統(tǒng)計思想雛議[J]北京統(tǒng)計, 2004,(05) .

[2] 龐有貴.統(tǒng)計工作及統(tǒng)計思想[J]科技情報開發(fā)與經(jīng)濟, 2004,(03) .

[3] 范文正.幾種基本統(tǒng)計思想的現(xiàn)實意義[J]統(tǒng)計與決策, 2007,(08) .

篇(4)

【關(guān)鍵詞】統(tǒng)計學(xué);統(tǒng)計思想;認(rèn)識

1關(guān)于統(tǒng)計學(xué)

統(tǒng)計學(xué)是一門實質(zhì)性的社會科學(xué),既研究社會生活的客觀規(guī)律,也研究統(tǒng)計方法。統(tǒng)計學(xué)是繼承和發(fā)展基礎(chǔ)統(tǒng)計的理論成果,堅持統(tǒng)計學(xué)的社會科學(xué)性質(zhì),使統(tǒng)計理論研究更接近統(tǒng)計工作實際,在國家和社會得到廣泛發(fā)展。

2 統(tǒng)計學(xué)中的幾種統(tǒng)計思想

2.1 統(tǒng)計思想的形成

統(tǒng)計思想不是天然形成的,需要經(jīng)歷統(tǒng)計觀念、統(tǒng)計意識、統(tǒng)計理念等階段。統(tǒng)計思想是根據(jù)人類社會需求的變化而開展各種統(tǒng)計實踐、統(tǒng)計理論研究與概括,才能逐步形成系統(tǒng)的統(tǒng)計思想。

2.2 比較常用的幾種統(tǒng)計思想

所謂統(tǒng)計思想,就是統(tǒng)計實際工作、統(tǒng)計學(xué)理論及應(yīng)用研究中必須遵循的基本理念和指導(dǎo)思想。統(tǒng)計思想主要包括:均值思想、變異思想、估計思想、相關(guān)思想、擬合思想、檢驗思想?,F(xiàn)分述如下:

2.2.1 均值思想

均值是對所要研究對象的簡明而重要的代表。均值概念幾乎涉及所有統(tǒng)計學(xué)理論,是統(tǒng)計學(xué)的基本思想。均值思想也要求從總體上看問題,但要求觀察其一般發(fā)展趨勢,避免個別偶然現(xiàn)象的干擾,故也體現(xiàn)了總體觀。

2.2.2 變異思想

統(tǒng)計研究同類現(xiàn)象的總體特征,它的前提則是總體各單位的特征存在著差異。統(tǒng)計方法就是要認(rèn)識事物數(shù)量方面的差異。統(tǒng)計學(xué)反映變異情況較基本的概念是方差,是表示“變異”的“一般水平”的概念。平均與變異都是對同類事物特征的抽象和宏觀度量。

2.2.3 估計思想

估計以樣本推測總體,是對同類事物的由此及彼式的認(rèn)識方法。使用估計方法有一個預(yù)設(shè):樣本與總體具有相同的性質(zhì)。樣本才能代表總體。但樣本的代表性受偶然因素影響,在估計理論對置信程度的測量就是保持邏輯嚴(yán)謹(jǐn)?shù)谋匾襟E。

2.2.4 相關(guān)思想

事物是普遍聯(lián)系的,在變化中,經(jīng)常出現(xiàn)一些事物相隨共變或相隨共現(xiàn)的情況,總體又是由許多個別事務(wù)所組成,這些個別事物是相互關(guān)聯(lián)的,而我們所研究的事物總體又是在同質(zhì)性的基礎(chǔ)上形成。因而,總體中的個體之間、這一總體與另一總體之間總是相互關(guān)聯(lián)的。

2.2.5 擬合思想

擬合是對不同類型事物之間關(guān)系之表象的抽象。任何一個單一的關(guān)系必須依賴其他關(guān)系而存在,所有實際事物的關(guān)系都表現(xiàn)得非常復(fù)雜,這種方法就是對規(guī)律或趨勢的擬合。擬合的成果是模型,反映一般趨勢。趨勢表達的是“事物和關(guān)系的變化過程在數(shù)量上所體現(xiàn)的模式和基于此而預(yù)示的可能性”。

2.2.6 檢驗思想

統(tǒng)計方法總是歸納性的,其結(jié)論永遠帶有一定的或然性,基于局部特征和規(guī)律所推廣出來的判斷不可能完全可信,檢驗過程就是利用樣本的實際資料來檢驗事先對總體某些數(shù)量特征的假設(shè)是否可信。

2.3 統(tǒng)計思想的特點

作為一門應(yīng)用統(tǒng)計學(xué),它從數(shù)理統(tǒng)計學(xué)派汲取新的營養(yǎng),并且越來越廣泛的應(yīng)用數(shù)學(xué)方法,聯(lián)系也越來越密切,但在統(tǒng)計思想的體現(xiàn)上與通用學(xué)派相比,還有著自己的特別之處。其基本特點能從以下四個方面體現(xiàn)出:(1)統(tǒng)計思想強調(diào)方法性與應(yīng)用性的統(tǒng)一;(2)統(tǒng)計思想強調(diào)科學(xué)性與藝術(shù)性的統(tǒng)一;(3)統(tǒng)計思想強調(diào)客觀性與主觀性的統(tǒng)一;(4)統(tǒng)計思想強調(diào)定性分析與定量分析的統(tǒng)一。

3 對統(tǒng)計思想的一些思考

3.1 要更正當(dāng)前存在的一些不正確的思想認(rèn)識

英國著名生物學(xué)家、統(tǒng)計學(xué)家高爾頓曾經(jīng)說過:“統(tǒng)計學(xué)具有處理復(fù)雜問題的非凡能力,當(dāng)科學(xué)的探索者在前進的過程中荊棘載途時,唯有統(tǒng)計學(xué)可以幫助他們打開一條通道”。但事實并非這么簡單,因為我們所面臨的現(xiàn)實問題可能要比想象的復(fù)雜得多。此外,有些人認(rèn)為方法越復(fù)雜越科學(xué),在實際的分析研究中,喜歡簡單問題復(fù)雜化,似乎這樣才能顯示其科學(xué)含量。其實,真正的科學(xué)是使復(fù)雜的問題簡單化而不是追求復(fù)雜化。與此相關(guān)聯(lián)的是,有些人認(rèn)為只有推斷統(tǒng)計才是科學(xué),描述統(tǒng)計不是科學(xué),并延伸擴大到只有數(shù)理統(tǒng)計是科學(xué)、社會經(jīng)濟統(tǒng)計不是科學(xué)這樣的認(rèn)識。這種認(rèn)識是極其錯誤的,至少是對社會經(jīng)濟統(tǒng)計的無知。比利時數(shù)學(xué)家凱特勒不僅研究概率論,并且注重于把統(tǒng)計學(xué)應(yīng)用于人類事物,試圖把統(tǒng)計學(xué)創(chuàng)建成改良社會的一種工具。經(jīng)濟學(xué)和人口統(tǒng)計學(xué)中的某些近代概念,如gnp、人口增長率等等,均是凱特勒及其弟子們的遺產(chǎn)。

3.2要不斷拓展統(tǒng)計思維方式

統(tǒng)計學(xué)是以歸納推理或歸納思維為主要的邏輯方式的。眾所周知,邏輯推理方式主要有兩種:歸納推理和演繹推理。歸納推理是基于觀測到的數(shù)據(jù)信息(尤其是不完全甚至劣質(zhì)的信息)去產(chǎn)生新的知識或去驗證一個假設(shè),即以所掌握的數(shù)據(jù)信息為依據(jù),歸納得出具有一般特征的結(jié)論。歸納推理是要在數(shù)據(jù)信息的基礎(chǔ)上透過偶然性去發(fā)現(xiàn)必然性。演繹推理是對統(tǒng)計認(rèn)識能力的深化,尤其是在根據(jù)必然性去研究和認(rèn)識偶然性方面,具有很大的作用。

3.3深化對數(shù)據(jù)分析的認(rèn)識

任何統(tǒng)計研究都離不開數(shù)據(jù)分析。因為這是得到統(tǒng)計研究結(jié)論的必要環(huán)節(jié)。雖然統(tǒng)計分析的形式隨時代的推移而變化著,但是“從數(shù)據(jù)中提取一切信息”或者“歸納和揭示”作為統(tǒng)計分析的目的卻一直沒有改變。對統(tǒng)計數(shù)據(jù)分析的原因有以下三個方面:一是基于同樣的數(shù)據(jù)會得出不同、甚至相反的分析結(jié)論;二是我們所面對的分析數(shù)據(jù)有時是缺損的或存在不真實性;三是我們所面對的分析數(shù)據(jù)有時則又是海量的,讓人無從下手。雖然統(tǒng)計數(shù)據(jù)分析已經(jīng)經(jīng)歷了描述性數(shù)據(jù)分析(dda)、推斷性數(shù)據(jù)分析(ida)和探索性數(shù)據(jù)分析(eda)等階段,分析的方法技術(shù)已經(jīng)有了質(zhì)的飛躍,但與人類不斷提高的要求相比,存在的問題似乎也越來越多。所以,我們必須深化對數(shù)據(jù)分析的認(rèn)識,圍繞“準(zhǔn)確解答特定問題并且從數(shù)據(jù)中獲取一切有效信息”這一目的,不斷拓展研究思路,繼續(xù)開展數(shù)據(jù)分析方法技術(shù)的研究。

參考文獻:

[1] 陳福貴.統(tǒng)計思想雛議[j]北京統(tǒng)計, 2004,(05) .

[2] 龐有貴.統(tǒng)計工作及統(tǒng)計思想[j]科技情報開發(fā)與經(jīng)濟, 2004,(03) .

篇(5)

關(guān)鍵詞:統(tǒng)計學(xué);教育改革;大數(shù)據(jù)

一、引言

最早提出大數(shù)據(jù)時代到來的機構(gòu)是全球知名的麥肯錫咨詢公司,該公司在一份研究報告中指出:“數(shù)據(jù)已經(jīng)滲透到當(dāng)今每一個行業(yè)和業(yè)務(wù)職能領(lǐng)域,成為重要的生產(chǎn)因素,人們對于海量數(shù)據(jù)的挖掘和運用,預(yù)示著新一波生產(chǎn)率增長和消費者盈余浪潮的到來”。

大數(shù)據(jù)是隨著互聯(lián)網(wǎng)技術(shù)的廣泛應(yīng)用帶來的數(shù)據(jù)量和數(shù)據(jù)類型激增而衍生出來的一種現(xiàn)象,但大數(shù)據(jù)一詞不僅指規(guī)模大、種類多的數(shù)據(jù)集,還包括對這種數(shù)據(jù)集進行采集、處理與分析以提取有價值信息和直接創(chuàng)造價值的技術(shù)構(gòu)架和技術(shù)過程。大數(shù)據(jù)的第一個特征是數(shù)據(jù)量巨大。截止到2012年,數(shù)據(jù)量已經(jīng)從TB(1024GB=1TB)級別躍升到PB(1024TB=1PB)、EB(1024PB=1EB)乃至ZB(1024EB=1ZB)級別。第二個特征是數(shù)據(jù)類型繁多、異構(gòu)性突出,包括網(wǎng)絡(luò)日志、音頻、視頻、圖片、地理位置信息等等。第三個特征是數(shù)據(jù)價值密度較低,數(shù)據(jù)中存在大量重復(fù)性和無價值性信息或噪聲。如何通過強大的計算技術(shù)和統(tǒng)計分析等方法迅速完成數(shù)據(jù)的價值提純,是大數(shù)據(jù)時代亟待解決的難題。第四個特征是處理速度快、時效性要求高。這是大數(shù)據(jù)區(qū)分于傳統(tǒng)數(shù)據(jù)挖掘最顯著的特征。

目前,不同的學(xué)科領(lǐng)域?qū)Υ髷?shù)據(jù)概念有著不盡相同的解釋,但各種解釋中大致可以從兩個方面去理解。首先,大數(shù)據(jù)概念體現(xiàn)在數(shù)據(jù)量的巨大、種類的眾多及產(chǎn)生速度的飛快,同時產(chǎn)生的數(shù)據(jù)集極有可能包含著各種半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù);其次,大數(shù)據(jù)概念還體現(xiàn)在對數(shù)據(jù)進行處理的手段和流程方面,由于數(shù)據(jù)量的龐大和類型復(fù)雜,利用常規(guī)的統(tǒng)計軟件已經(jīng)無法對當(dāng)今的數(shù)據(jù)進行及時有效的存儲、分析及處理。因此,所謂的大數(shù)據(jù)并不是單純指數(shù)據(jù)流量的巨大,還指其結(jié)構(gòu)的復(fù)雜和種類的多樣,在數(shù)據(jù)處理和分析上需要采用高端計算平臺或高級統(tǒng)計軟件,以及海量數(shù)據(jù)中存在著可挖掘的潛在的大量價值信息與知識。

近年來,隨著高速計算機的應(yīng)用、信息技術(shù)的快速發(fā)展,特別是云計算技術(shù)的發(fā)展,使大數(shù)據(jù)的存儲和分析技術(shù)得到迅速發(fā)展,目前的核心技術(shù)有MapReduce、GFS、BigTable、Hadoop,以及數(shù)據(jù)可視化等。在數(shù)據(jù)搜集上,可方便地通過在線互聯(lián)網(wǎng)數(shù)據(jù)庫獲取二手?jǐn)?shù)據(jù)或一手實時數(shù)據(jù)。在數(shù)據(jù)分析上,傳統(tǒng)統(tǒng)計學(xué)方法采取的是基于統(tǒng)計模型的樣本數(shù)據(jù)分析,而大數(shù)據(jù)分析技術(shù)則是通過高端計算平臺,對大數(shù)據(jù)中的信息進行挖掘。

統(tǒng)計學(xué)作為對數(shù)據(jù)進行處理和分析的科學(xué),必然受到大數(shù)據(jù)的影響。在大數(shù)據(jù)時代,統(tǒng)計學(xué)教育必須與時俱進,跟上時展步伐。近年來,有不少文獻討論了大數(shù)據(jù)環(huán)境下我國統(tǒng)計學(xué)教育的改革問題(例如[1]-[5]),本文在分析大數(shù)據(jù)時代特征的前提下,進一步討論我國統(tǒng)計學(xué)教育的現(xiàn)狀與挑戰(zhàn)、統(tǒng)計學(xué)教育改革的內(nèi)容、方法、借鑒和適應(yīng)時代要求的變革問題。

二、統(tǒng)計學(xué)教育的現(xiàn)狀與挑戰(zhàn)

2013年,教育部對我國統(tǒng)計學(xué)專業(yè)設(shè)置進行一次新的調(diào)整,將原來的既可授予理學(xué)學(xué)位,也可授予經(jīng)濟學(xué)學(xué)位的統(tǒng)計學(xué)專業(yè)劃分為統(tǒng)計學(xué)、應(yīng)用統(tǒng)計學(xué)和經(jīng)濟統(tǒng)計學(xué)三個本科專業(yè)[6]。根據(jù)教育部高等學(xué)校統(tǒng)計類專業(yè)教學(xué)指導(dǎo)委員會2013年11月公布的數(shù)據(jù),當(dāng)時全國有194所高校開設(shè)了統(tǒng)計學(xué)專業(yè),156所高校開設(shè)了應(yīng)用統(tǒng)計學(xué)專業(yè),164所高校開設(shè)了經(jīng)濟統(tǒng)計學(xué)專業(yè)[6]。目前,全國開設(shè)這三個統(tǒng)計學(xué)專業(yè)的高校個數(shù)和在校學(xué)生人數(shù)與2013年相比都有不少的增加。

面對大數(shù)據(jù)時代,我們目前的統(tǒng)計學(xué)教育無論在培養(yǎng)目標(biāo)和教學(xué)內(nèi)容上,還是在教育方式和人才培養(yǎng)模式上,都存在著亟待解決的挑戰(zhàn)性問題。例如,在專業(yè)培養(yǎng)目標(biāo)和人才培養(yǎng)過程中,我們比較重視課程層面上的評價,比較輕視專業(yè)層面上的整體評價,缺乏對學(xué)生綜合能力的反饋機制。

關(guān)于教學(xué)內(nèi)容,目前三個統(tǒng)計學(xué)專業(yè)在統(tǒng)計理論和應(yīng)用統(tǒng)計兩個方面有不同的側(cè)重。統(tǒng)計理論主要包括:抽樣理論、實驗設(shè)計、估汁理論、假設(shè)險驗、決策理論、貝葉斯統(tǒng)計、半?yún)?shù)和非參數(shù)統(tǒng)計、序貫分析、多元統(tǒng)計分析、時間序列分析、小樣本理論和大樣本理論等。在數(shù)據(jù)分析中,現(xiàn)今的統(tǒng)計方法基本以結(jié)構(gòu)化數(shù)據(jù)為主要處理對象,而對非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)的分析和工具涉及較少。因此,現(xiàn)今統(tǒng)計學(xué)課程及內(nèi)容已不能滿足從事非結(jié)構(gòu)型和半結(jié)構(gòu)型的大數(shù)據(jù)研究和商業(yè)應(yīng)用對人才培養(yǎng)的需要,必須進行必要的改革。

對于教育方式,鑒于大數(shù)據(jù)時代要求,統(tǒng)計分析人員需要具備較高的數(shù)學(xué)和現(xiàn)代統(tǒng)計學(xué)基礎(chǔ),具有較高的軟件操作能力,掌握一定的大數(shù)據(jù)收集、整理、分析、處理和挖掘數(shù)據(jù)的技能。日本學(xué)者城田真琴認(rèn)為:“數(shù)據(jù)科學(xué)家要有計算機科學(xué)專業(yè)背景,數(shù)學(xué)、統(tǒng)計方面的素養(yǎng)和使用數(shù)據(jù)挖掘軟件的技能,善于利用數(shù)據(jù)可視化的手法展現(xiàn)晦澀難懂的信息,而且具備相應(yīng)的專業(yè)知識、眼界和視野,具有適應(yīng)社會發(fā)展和創(chuàng)造價值的能力”。現(xiàn)今的統(tǒng)計學(xué)教育方式還不能很好適應(yīng)大數(shù)據(jù)時代數(shù)據(jù)科學(xué)人才培養(yǎng)需要,必須進行必要及時的調(diào)整和變革。

對人才培養(yǎng)模式,大數(shù)據(jù)時代不僅要求培養(yǎng)具有數(shù)據(jù)處理和分析所需的基本素質(zhì)與技能,更重視培養(yǎng)從海量數(shù)據(jù)中發(fā)現(xiàn)和挖掘價值信息、把握市場機遇、創(chuàng)造利潤的潛在能力。面對大數(shù)據(jù)時代的諸多挑戰(zhàn),現(xiàn)代統(tǒng)計技術(shù)、數(shù)據(jù)挖掘方法、計算機信息技術(shù)、軟件工具和理念的日新月異,培養(yǎng)統(tǒng)計人才的教育模式也需要相應(yīng)變化,統(tǒng)計學(xué)教育只有與時俱進,主動做出全面的調(diào)整和變革才能適應(yīng)新時代知識進步和激烈人才市場競爭的需要,積極迎接大數(shù)據(jù)時代的挑戰(zhàn)。

大數(shù)據(jù)時代對統(tǒng)計學(xué)教師有更高的要求,統(tǒng)計學(xué)教師需要與時俱進,跟上時代步伐。隨著互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、云計算等信息技術(shù)的發(fā)展,對數(shù)據(jù)的分析和處理的技術(shù)也隨之要求更高,統(tǒng)計學(xué)教師固有的知識體系已不能滿足培養(yǎng)現(xiàn)代統(tǒng)計人才的需要,必須進一步深化和更新原有的統(tǒng)計學(xué)理論知識,而且還需要學(xué)習(xí)掌握計算機技術(shù)、互聯(lián)網(wǎng)、數(shù)據(jù)庫和信息科學(xué)等有關(guān)知識和技術(shù),同時還要熟悉處理非結(jié)構(gòu)型和半結(jié)構(gòu)型數(shù)據(jù)的知識和技能,以適應(yīng)現(xiàn)代統(tǒng)計學(xué)教育對教師的知識結(jié)構(gòu)和基本素質(zhì)的要求。

大數(shù)據(jù)時代對統(tǒng)計專業(yè)的學(xué)生也提出了更高的要求,他們不僅需要掌握現(xiàn)代統(tǒng)計理論、統(tǒng)計方法和專業(yè)統(tǒng)計軟件,還要學(xué)會如何分析、處理來自互聯(lián)網(wǎng)或各種實際問題中的海量數(shù)據(jù),如何利用統(tǒng)計軟件和互聯(lián)網(wǎng)技術(shù)進行數(shù)據(jù)操作,如何借助軟件技術(shù)和統(tǒng)計準(zhǔn)則判斷數(shù)據(jù)質(zhì)量,如何進行模型選擇和評價模型方法的有效性,如何準(zhǔn)確清晰地呈現(xiàn)統(tǒng)計分析結(jié)果和結(jié)論,等等。

2014年11月,美國統(tǒng)計學(xué)會了統(tǒng)計學(xué)本科專業(yè)指導(dǎo)性教學(xué)綱要 [7],該教學(xué)綱要對統(tǒng)計學(xué)專業(yè)提出四個方面的要求:(1)具有扎實的數(shù)學(xué)和統(tǒng)計學(xué)基礎(chǔ)、強大的統(tǒng)計計算和編程能力,熟練使用統(tǒng)計軟件和數(shù)據(jù)庫;(2)分析來自現(xiàn)實問題的真實數(shù)據(jù),真實數(shù)據(jù)是統(tǒng)計專業(yè)教育的重要組成部分;(3)掌握多樣化的統(tǒng)計模型方法;(4)具有通過語言、圖表和動畫等方式解釋數(shù)據(jù)分析結(jié)果的能力。美國是統(tǒng)計學(xué)教育和人才培養(yǎng)最先進的國家之一,該指導(dǎo)性教學(xué)綱要代表著美國統(tǒng)計學(xué)專業(yè)培養(yǎng)人才的基本要求和發(fā)展方向,對我國統(tǒng)計教育的改革具有重要的參考價值。以該指導(dǎo)性教學(xué)綱要為參考依據(jù),對照我國目前的統(tǒng)計學(xué)本科專業(yè)教育,無論是在培養(yǎng)目標(biāo)和課程設(shè)置方面,還是在教學(xué)內(nèi)容和教學(xué)方法方面,都存在著亟待解決的挑戰(zhàn)性問題。

三、統(tǒng)計學(xué)教育的改革

大數(shù)據(jù)時代的統(tǒng)計學(xué)教育不僅是各種統(tǒng)計方法、數(shù)據(jù)挖掘方法和信息技術(shù)手段的延續(xù)或發(fā)展,更主要的是這些方法的集成應(yīng)用和在實際數(shù)據(jù)分析中的真實體驗。過去,企業(yè)數(shù)據(jù)庫價格昂貴,在統(tǒng)計學(xué)教育的教學(xué)案例或?qū)嶒炚n教學(xué)中,很少采用真實和海量的數(shù)據(jù)庫資源,基本都是采用過時或虛擬的數(shù)據(jù)。今天,像百度大數(shù)據(jù)引擎這樣的數(shù)據(jù)庫的逐步對外開放,將有助于開展“線上大數(shù)據(jù)統(tǒng)計實驗”教學(xué)。為了適應(yīng)大數(shù)據(jù)時代要求,有必要利用網(wǎng)絡(luò)資源以及各種數(shù)據(jù)處理軟件,搭建線上大數(shù)據(jù)分析實驗教學(xué)平臺,全面開展大數(shù)據(jù)統(tǒng)計實驗教學(xué)的改革。實際上,借助大數(shù)據(jù)分析平臺,本科階段的統(tǒng)計學(xué)教育就可以融人聯(lián)機分析和數(shù)據(jù)的可視化教學(xué)。其次,要時刻關(guān)注大數(shù)據(jù)分析理論的進展,及時將新理論新方法融入課堂教學(xué)內(nèi)容。

需要指出的是,在大數(shù)據(jù)時代,經(jīng)典統(tǒng)計理論和方法并沒有過時,但需要進行改進和進一步發(fā)展。這是因為,網(wǎng)上采集的巨型數(shù)據(jù)集往往存在大量的重復(fù)性和無價值數(shù)據(jù)信息,使得大數(shù)據(jù)價值密度降低。在對這些數(shù)據(jù)進行分析處理之前往往需要通過去噪、分層、截斷、聚類等方法的預(yù)處理,將其變成便于進行分析處理的小數(shù)據(jù),繼而借助于經(jīng)典統(tǒng)計方法進行分析和處理。因而在大數(shù)據(jù)時代仍然需要采用傳統(tǒng)統(tǒng)計學(xué)的小樣本理論和方法。所以,即便是在大數(shù)據(jù)時代,經(jīng)典統(tǒng)計方法仍然是進行統(tǒng)計分析的基石,其核心地位不可動搖。所以,在大數(shù)據(jù)時代仍然要強化統(tǒng)計學(xué)的基本理論和方法,尤其是在長期發(fā)展和實踐應(yīng)用中經(jīng)過驗證的、成熟有效的經(jīng)典和現(xiàn)代統(tǒng)計方法,在大數(shù)據(jù)時代仍然沒有過時,但需要結(jié)合大數(shù)據(jù)分析的需要對經(jīng)典統(tǒng)計方法進行必要的發(fā)展和改進。

大數(shù)據(jù)科學(xué)需要統(tǒng)計學(xué)與數(shù)學(xué)、計算機等學(xué)科的結(jié)合。亞馬遜大數(shù)據(jù)科學(xué)家John Rauser 認(rèn)為:“數(shù)據(jù)科學(xué)家是統(tǒng)計學(xué)家和計算機工程師的結(jié)合體”。為了滿足大數(shù)據(jù)時代的要求,統(tǒng)計學(xué)專業(yè)的課程設(shè)置需要進行必要的調(diào)整。應(yīng)根據(jù)新時代人才培養(yǎng)的要求,增設(shè)與大數(shù)據(jù)前沿領(lǐng)域發(fā)展相關(guān)的課程,如計算機網(wǎng)絡(luò)和大數(shù)據(jù)相關(guān)的軟件應(yīng)用,同時要加大實驗課和社會實踐課的比重,引導(dǎo)學(xué)生理解和掌握大數(shù)據(jù)概念、理論、技術(shù)和方法,培養(yǎng)其運用大數(shù)據(jù)的相關(guān)分析工具解決實際問題的能力。對于理論課程,除基本統(tǒng)計理論外,還應(yīng)開設(shè)一些較為現(xiàn)代和深入的課程,如現(xiàn)代貝葉斯方法、神經(jīng)網(wǎng)絡(luò)、數(shù)據(jù)挖掘、應(yīng)用隨機過程論等。另外,還應(yīng)開設(shè)與大數(shù)據(jù)分析相關(guān)的關(guān)聯(lián)規(guī)則、決策樹、機器學(xué)習(xí)、支持向量機等課程。

為了培養(yǎng)與時代適應(yīng)的統(tǒng)計學(xué)人才,統(tǒng)計學(xué)專業(yè)教師應(yīng)不斷更新自身的知識結(jié)構(gòu)和價值觀念,改變認(rèn)識數(shù)據(jù)、收集數(shù)據(jù)和分析數(shù)據(jù)的思維,主動學(xué)習(xí)和補充互聯(lián)網(wǎng)、現(xiàn)代數(shù)據(jù)分析技術(shù)、數(shù)據(jù)庫和數(shù)據(jù)挖掘技術(shù),使自己的知識體系不斷更新和提升,跟上時展的步伐。

在大數(shù)據(jù)時代,要注意培養(yǎng)學(xué)生適應(yīng)社會的能力。統(tǒng)計專業(yè)人才培養(yǎng)模式應(yīng)以提高本專業(yè)學(xué)生數(shù)據(jù)分析方面的能力,開闊他們的視野,培養(yǎng)其適應(yīng)社會的能力。應(yīng)積極引導(dǎo)學(xué)生進入實訓(xùn)場所動手操作和鍛煉,嘗試以企事業(yè)單位的財政、金融、保險、統(tǒng)計、咨詢和信息公司等部門為主構(gòu)建專業(yè)性教育實踐基地。鼓勵學(xué)生到大數(shù)據(jù)相關(guān)的機構(gòu)部門、產(chǎn)業(yè)園區(qū)和企業(yè)中去調(diào)查研究和實踐。此外,統(tǒng)計專業(yè)應(yīng)積極同其他專業(yè)進行合作,聯(lián)合培養(yǎng)適應(yīng)新時代要求的數(shù)據(jù)分析人才。鑒于大數(shù)據(jù)對數(shù)據(jù)分析人員在計算機技術(shù)、行業(yè)認(rèn)知、業(yè)務(wù)知識、數(shù)據(jù)分析工具和方法的要求提高,統(tǒng)計學(xué)科應(yīng)主動與計算機、經(jīng)濟學(xué)、管理學(xué)等相關(guān)學(xué)科合作,培養(yǎng)學(xué)生的計算機能力、專業(yè)素質(zhì)和業(yè)務(wù)修養(yǎng)。

“它山之石可以攻玉”,關(guān)于統(tǒng)計學(xué)專業(yè)的課程設(shè)置,可以參考和借鑒美國統(tǒng)計學(xué)會公布的統(tǒng)計學(xué)本科專業(yè)指導(dǎo)性教學(xué)綱要。根據(jù)該教學(xué)綱要,統(tǒng)計專業(yè)的課程設(shè)置應(yīng)該涵蓋五個模塊[7]:(1)統(tǒng)計方法與統(tǒng)計理論。建立統(tǒng)計模型并對模型的輸出結(jié)果進行評價,熟悉統(tǒng)計推斷,能夠從數(shù)據(jù)分析中得出恰當(dāng)?shù)慕Y(jié)論。(2)數(shù)據(jù)操作和統(tǒng)計計算。熟練使用一款專業(yè)統(tǒng)計軟件進行探索性數(shù)據(jù)分析,發(fā)現(xiàn)和清洗數(shù)據(jù)中的錯誤記錄,具有編程能力和算法思維,可以進行各種數(shù)據(jù)操作,還應(yīng)掌握統(tǒng)計計算技術(shù),能夠進行模擬研究。(3)數(shù)學(xué)基礎(chǔ)。熟練掌握微積分、線性代數(shù)、矩陣論、概率論和數(shù)理統(tǒng)計的基礎(chǔ)知識。(4)實踐訓(xùn)練和表達能力。具有良好的表達和交流能力,善于通過圖示和動畫等聽眾易于理解的方式展示分析結(jié)論,并且具有團隊合作精神和項目領(lǐng)導(dǎo)能力。(5)特定領(lǐng)域的知識。掌握特定應(yīng)用領(lǐng)域的知識,并用統(tǒng)計學(xué)特有的思維方法來分析和解決特定領(lǐng)域的實際問題。

大數(shù)據(jù)時代是以數(shù)據(jù)為中心的時代,統(tǒng)計學(xué)專業(yè)的教育改革必須適應(yīng)這個時代的要求。統(tǒng)計數(shù)據(jù)分析中軟件應(yīng)用能力至關(guān)重要。在眾多統(tǒng)計軟件中推薦使用R和SAS軟件,因為R是免費開源軟件,其統(tǒng)計建模、統(tǒng)計計算和可視化功能強大,更新迅速,是最新統(tǒng)計方法的主要平臺,非常有利于培養(yǎng)學(xué)生的編程能力和知識更新能力,而SAS軟件被很多公司用于數(shù)據(jù)管理和數(shù)據(jù)分析,在實際應(yīng)用領(lǐng)域具有長期而深遠的影響,是數(shù)據(jù)分析不可或缺的專業(yè)統(tǒng)計軟件。當(dāng)然,教學(xué)中也可以嘗試使用其他專業(yè)統(tǒng)計軟件,例如經(jīng)濟統(tǒng)計專業(yè)學(xué)生也可使用SPSS軟件,但最好會使用SAS或R軟件。在加強軟件使用和編程能力的基礎(chǔ)上,應(yīng)加強學(xué)生統(tǒng)計計算和統(tǒng)計模擬能力的培養(yǎng)。在大數(shù)據(jù)時代,強調(diào)統(tǒng)計計算的重要性是大勢所趨。統(tǒng)計模擬技術(shù)是伴隨著高速計算機和信息技術(shù)的快速發(fā)展而廣泛應(yīng)用的現(xiàn)代技術(shù),可用來解決傳統(tǒng)學(xué)科領(lǐng)域中無法解決的問題。例如,在計算技術(shù)飛速發(fā)展的今天,貝葉斯統(tǒng)計方法過去曾經(jīng)面臨的計算瓶頸正在逐漸消失,基于馬爾科夫鏈蒙特卡洛(MCMC)技術(shù)的統(tǒng)計模擬方法在數(shù)據(jù)分析中的強大威力正在日益顯現(xiàn)[8]。

參考文獻:

[1] 劉春杰,大數(shù)據(jù)時代對當(dāng)代統(tǒng)計學(xué)教育的挑戰(zhàn),統(tǒng)計與決策,2015年,第8期。

[2] 孟生旺,袁衛(wèi),大數(shù)據(jù)時代的統(tǒng)計教育,統(tǒng)計研究,2015年,第32卷4期。

[3] 葛虹,韓偉,大數(shù)據(jù)時代統(tǒng)計教育變革的SWOT分析與發(fā)展策略,統(tǒng)計與決策,2015年,第4期。

[4] 張海波,黃世祥,統(tǒng)計學(xué)專業(yè)學(xué)生大數(shù)據(jù)分析能力的培養(yǎng)方式選擇,統(tǒng)計與決策,2014年,第24期。

[5] 李衛(wèi)東,大數(shù)據(jù)對統(tǒng)計學(xué)科發(fā)展的影響,統(tǒng)計與決策,2014年,第13.期。

[6] 教育部高等學(xué)校統(tǒng)計類專業(yè)教學(xué)指導(dǎo)委員會.統(tǒng)計學(xué)專業(yè)教學(xué)單位.http:///category/信息公開/教學(xué)單位,2013-11-15.

篇(6)

【關(guān)鍵詞】數(shù)據(jù)分析;實踐;統(tǒng)計 

中圖分類號:G635.5 文獻標(biāo)識碼:A 文章編號:1671-0568(2015)36-0122-01 

我國相關(guān)教學(xué)制度規(guī)定,在數(shù)學(xué)教學(xué)中,必須重視對學(xué)生空間觀念、數(shù)據(jù)分析觀念及推理觀念等的培養(yǎng)。數(shù)據(jù)能夠幫助學(xué)生正確判斷學(xué)習(xí)及生活中的相關(guān)問題,從而做出正確抉擇,數(shù)據(jù)現(xiàn)已充斥著整個社會,因此,現(xiàn)代公民必須重視對數(shù)據(jù)分析、數(shù)據(jù)收集及數(shù)據(jù)整理等能力及觀念的培養(yǎng),從而提升自身決策的合理性與準(zhǔn)確性,實現(xiàn)數(shù)據(jù)的有效傳輸與表達。 

一、數(shù)據(jù)分析觀念內(nèi)涵 

數(shù)據(jù)分析觀念主要是指現(xiàn)實生活中人們在解決相應(yīng)的問題時,需要對與問題相關(guān)的數(shù)據(jù)等進行調(diào)查研究,同時,通過對相關(guān)數(shù)據(jù)的分析理解其中的內(nèi)涵,找到解決問題的方法。在數(shù)據(jù)分析過程中,同樣的數(shù)據(jù)有多種數(shù)據(jù)分析方法,這就需要相關(guān)人員根據(jù)相關(guān)問題的具體要求選擇合理的分析方法。數(shù)據(jù)分析是統(tǒng)計的核心要素,因此,數(shù)據(jù)分析內(nèi)的相關(guān)要素及相關(guān)內(nèi)涵主要包含以下幾個方面: 

1. 具有數(shù)據(jù)相關(guān)意識 

數(shù)據(jù)的應(yīng)用充斥著人們的現(xiàn)實生活與學(xué)習(xí),要合理、準(zhǔn)確地解決現(xiàn)實問題需要有數(shù)據(jù)意識。在解決問題之前,需要對信息及數(shù)據(jù)進行收集,同時,學(xué)生根據(jù)數(shù)據(jù)提煉內(nèi)部的相關(guān)信息及有效數(shù)據(jù),幫助學(xué)生高效解決相關(guān)問題。 

2. 選擇合理的數(shù)據(jù)搜集與分析方法 

分析與整理相同數(shù)據(jù)具有多種分析方法,這就需要學(xué)生對相關(guān)問題進行分析從而選擇最合理的方法。例如,在對數(shù)據(jù)統(tǒng)計中的統(tǒng)計圖表進行繪制時,往往具有多種圖表表現(xiàn)形式,但是學(xué)生在進行相關(guān)統(tǒng)計圖表選擇時會選用最佳的統(tǒng)計圖表,如在對相關(guān)數(shù)據(jù)中的數(shù)量關(guān)系進行統(tǒng)計時,則可選用條形統(tǒng)計圖,若表現(xiàn)各數(shù)據(jù)在整體數(shù)據(jù)中所占比例時,則可選用扇形統(tǒng)計圖。 

3. 通過數(shù)據(jù)分析體驗隨機特征 

數(shù)據(jù)的隨機性主要是指在解決同一問題時,其收集到的數(shù)據(jù)可能存在差異性,另一方面是指足夠的數(shù)據(jù)中具有相關(guān)規(guī)律。例如,探究數(shù)學(xué)學(xué)習(xí)中關(guān)于學(xué)習(xí)知識點需要用多長時間時,就可以對數(shù)據(jù)進行統(tǒng)計。在統(tǒng)計過程中,會發(fā)現(xiàn)每天的知識點、學(xué)習(xí)時間具有差異性,但在多次試驗之后便可發(fā)現(xiàn)其中的相關(guān)規(guī)律。數(shù)據(jù)雖然具有隨機性,但在多次試驗驗證后其數(shù)據(jù)又具有相對穩(wěn)定性。 

二、在統(tǒng)計教學(xué)中培養(yǎng)學(xué)生數(shù)據(jù)分析觀念的途徑分析 

1. 引導(dǎo)學(xué)生基于現(xiàn)實參與數(shù)據(jù)收集及分析活動 

在統(tǒng)計學(xué)教學(xué)中,教師可以積極引導(dǎo)學(xué)生參與數(shù)據(jù)收集及分析活動,促進學(xué)生數(shù)據(jù)分析意識及分析觀念的形成。學(xué)生數(shù)據(jù)分析觀念的養(yǎng)成首先需要數(shù)據(jù)分析意識的養(yǎng)成,學(xué)生在遇到困難時,可產(chǎn)生利用數(shù)據(jù)解決問題的意識,因此,教師在具體教學(xué)中可依照實際生活設(shè)計具有現(xiàn)實意義的數(shù)學(xué)實際情境,這樣可以最大限度地激發(fā)學(xué)生完全投入到統(tǒng)計活動中,使學(xué)生通過實際情景對數(shù)據(jù)進行收集、整理、分析并做出解決問題的最終決策,通過在活動中的實際體會逐步促進自身數(shù)據(jù)分析觀念與分析思維模式的養(yǎng)成與提升。 

2. 重視情感作用,激發(fā)學(xué)生的求知欲望 

在統(tǒng)計教學(xué)中,學(xué)生良好的學(xué)習(xí)情緒以及強烈的求知欲對其學(xué)習(xí)進步以及智力開發(fā)具有非常重要的影響,在數(shù)據(jù)分析觀念的培養(yǎng)過程中,重視對學(xué)生情感的教育與引導(dǎo)可使學(xué)生盡快進入學(xué)習(xí)狀態(tài),營造輕松、和諧的教學(xué)氛圍,將學(xué)生帶入教學(xué)情境中,不僅有利于教學(xué)工作的開展與教學(xué)任務(wù)的實現(xiàn),同時還有利于良好師生關(guān)系的形成。 

在“統(tǒng)計”課程教學(xué)之前,教師在課堂中可以進行情境創(chuàng)設(shè)。例如,周末組織班級學(xué)生外出郊游,要求學(xué)生思考郊游的地點及郊游活動應(yīng)怎樣選擇。此時,學(xué)生因聽到有關(guān)游玩的話題比較興奮,便積極地展開討論,教師再對學(xué)生進行統(tǒng)計課程帶入教學(xué),這樣,不僅使得課堂變得生動、活躍,使學(xué)生的積極性增強,為課程的展開創(chuàng)造了良好的環(huán)境,使教學(xué)內(nèi)容更易開展。 

3. 引導(dǎo)學(xué)生掌握數(shù)據(jù)收集、整理及分析等方法 

在數(shù)學(xué)統(tǒng)計學(xué)教學(xué)中,常用的數(shù)據(jù)收集方法一般為直接獲取數(shù)據(jù)的方法,包括實驗、調(diào)查,等等,同時也包括資料翻閱等間接獲取方法。收集數(shù)據(jù)工作結(jié)束之后,需要對看似雜亂的數(shù)據(jù)進行整理、分類,在對數(shù)據(jù)進行描述時,常用的方式主要有計數(shù)、統(tǒng)計圖等,因此,需要學(xué)生認(rèn)識條形統(tǒng)計圖、扇形統(tǒng)計圖及折線統(tǒng)計圖等統(tǒng)計方法,并運用以上方法對數(shù)據(jù)進行有效分類,同時還可運用自身語言知識解釋其含義,分析數(shù)據(jù)主要是指對數(shù)據(jù)進行簡繁分析并達到交流作用。數(shù)據(jù)分析過程是復(fù)雜的思維分析過程,在問題解決的過程中,教師應(yīng)引導(dǎo)學(xué)生根據(jù)問題的具體情況選擇合理的分析方式,從而使學(xué)生在學(xué)習(xí)中不斷完善自身的想法并實現(xiàn)對數(shù)據(jù)分析方法的有效掌握。 

例如,對班級學(xué)生身高進行分析與相關(guān)問題探討:某小學(xué)某班級中學(xué)生的身高在134~160cm之間,學(xué)生根據(jù)班級身高記錄單對班級中學(xué)生的身高進行分析統(tǒng)計,從而得出學(xué)生中最低身高為134cm,最高身高為160cm,若要選擇參與跳高的運動員時,學(xué)生可以通過數(shù)據(jù)進行探討,并對學(xué)生的身高按照從高到低的順序進行排列后選出多名身高最高的學(xué)生,之后再對整理數(shù)據(jù)的作用進行相應(yīng)分析。 

4. 引導(dǎo)學(xué)生重視數(shù)據(jù)隨機性,使學(xué)生全面認(rèn)識數(shù)據(jù) 

教師在對學(xué)生進行數(shù)據(jù)分析觀念的培養(yǎng)中,需要選擇適當(dāng)?shù)膯栴}對學(xué)生進行數(shù)據(jù)隨機性體驗。例如,在對學(xué)校校門口一天之內(nèi)各個時段的人流量統(tǒng)計活動中,教師可引導(dǎo)學(xué)生選用合適的方式進行人流量的統(tǒng)計與記錄,同時在開展該活動中,學(xué)生還應(yīng)考慮數(shù)據(jù)的有效性及數(shù)據(jù)所需時間,等等,引導(dǎo)學(xué)生在所監(jiān)測的不同數(shù)據(jù)中找尋相應(yīng)規(guī)律,最終順利解決問題。 

在數(shù)學(xué)統(tǒng)計教學(xué)中,學(xué)生數(shù)據(jù)分析觀念的培養(yǎng),是統(tǒng)計學(xué)與概率學(xué)教學(xué)的開展基礎(chǔ),同時也是數(shù)學(xué)問題解決的有效觀念之一。在對學(xué)生進行數(shù)據(jù)分析觀念的培養(yǎng)中,教師應(yīng)重視對學(xué)生具體實踐教學(xué)的開展及數(shù)據(jù)統(tǒng)計方法的教授,使學(xué)生選用最合理的數(shù)據(jù)整理、分析等方法,從而促使學(xué)生數(shù)據(jù)分析統(tǒng)計思維的養(yǎng)成,實現(xiàn)數(shù)學(xué)教學(xué)的最終目標(biāo)。 

參考文獻: 

[1] 范明明.中小學(xué)生數(shù)據(jù)分析能力的培養(yǎng)研究[D].武漢:華中師范大學(xué),2014. 

篇(7)

一、大數(shù)據(jù)及其意義

大部分傳統(tǒng)的統(tǒng)計方法只適合分析單個計算機存儲的數(shù)據(jù)。而目前大數(shù)據(jù)的環(huán)境包括以下要素。1.流數(shù)據(jù):數(shù)據(jù)快速地不斷涌來,現(xiàn)有存儲設(shè)備和計算能力難以應(yīng)付這種數(shù)據(jù)流(比如歐洲高能粒子對撞機所產(chǎn)生的數(shù)據(jù),每秒鐘可以達到500TB)。2.磁盤存儲限制:數(shù)據(jù)已不能完全存儲在內(nèi)存中,需要硬盤存儲。3.分布存儲狀態(tài):數(shù)據(jù)分布存儲在多個計算機中。4.多線條狀態(tài):數(shù)據(jù)存儲在一個計算機中,多個處理器共享內(nèi)存。大數(shù)據(jù)的發(fā)展就是對數(shù)據(jù)產(chǎn)生的機制進行探索,將所產(chǎn)生的數(shù)據(jù)轉(zhuǎn)變?yōu)槿藗兯枰闹R,進而對相關(guān)政策的制定產(chǎn)生影響。這個過程是一個漫長的過程。一個小孩子隨著年齡的增長可能會掌握更多的單詞,但是根據(jù)一個孩子的年齡確定他掌握的單詞多少則并不科學(xué)。進一步來說,大數(shù)據(jù)有記錄保存自然與社會現(xiàn)狀的功能。現(xiàn)在大家收集著海量數(shù)據(jù),盡管他們還不清楚如何分析大量的數(shù)據(jù),但是他們相信需要保存現(xiàn)今社會經(jīng)濟高速發(fā)展的過程,期待著今后能夠分析和解釋這段歷史。還有些人將百歲老人的血液和其他各種生物的標(biāo)本等存放在冰箱里,他們認(rèn)為當(dāng)今的技術(shù)還不足以測試和分析這些資源,期待今后更先進的測試技術(shù)能夠做到。大數(shù)據(jù)就如同自然和社會的血液那樣記錄著社會的現(xiàn)狀和發(fā)展過程。17世紀(jì)望遠鏡以及顯微鏡的發(fā)明使人類看到了以前從來沒有看到過的宇宙空間和微生物,擴大了人類對自然的基本認(rèn)識。大數(shù)據(jù)就像“望眼鏡”和“顯微鏡”那樣,使得人們能夠通過數(shù)據(jù)來觀察和分析自然、經(jīng)濟、社會的現(xiàn)象。借助于互聯(lián)網(wǎng)數(shù)據(jù),可以及時了解疾病的疫情、科學(xué)的動態(tài)、社會的動態(tài)。谷歌借助頻繁檢索的詞條能及時判斷流感從哪傳播,哪些人可能已經(jīng)感染了流感。大數(shù)據(jù)將形成自然和人文社會的歷史長河,不但能用于探索當(dāng)代的科學(xué)問題,將來也可以用于研究人們食用轉(zhuǎn)基因食品對子孫后代的影響等追蹤研究問題,為未來留下當(dāng)前的歷史資料。

二、大數(shù)據(jù)帶來的變革

時代的進步有賴于大數(shù)據(jù)的發(fā)展,大數(shù)據(jù)的發(fā)展給時代變革增加了更多的不確定性。就當(dāng)前研究來看,數(shù)據(jù)的搜集很大程度上依靠所研究問題的出現(xiàn)來推動其向前發(fā)展。不過在不久的將來,隨著大數(shù)據(jù)時代的到來,人們對于問題的研究將會由“數(shù)據(jù)”來驅(qū)動。例如,如果我們想去某地旅行或出差,會首先查詢目的地的交通情況、天氣情況以及住宿情況等信息,但是將來我們可以根據(jù)所查詢的數(shù)據(jù)信息來決定所要去的目的地。在古希臘時代,當(dāng)時的哲學(xué)家無所不知,號稱百科全書,到了文藝復(fù)興時代,隨著學(xué)科的不斷細(xì)化,不同學(xué)科出現(xiàn)了各自的專家。隨著大數(shù)據(jù)時代的到來,大百科全書式的人物將有可能再次出現(xiàn),而不同領(lǐng)域的專家的權(quán)威性將被逐步消弱,隨著大數(shù)據(jù)的不斷發(fā)展,很有可能會逐漸將學(xué)科專家消亡掉。例如,隨著計算機專家和統(tǒng)計學(xué)家對數(shù)據(jù)的搜集越來越多并且處理能力不斷增強,他們將逐步成為生命科學(xué)方面的專家。再比如,如果我們掌握了足夠數(shù)量的相關(guān)專業(yè)書籍和日文譯本,就算我們對日文一無所知,我們也可以采取有效的方法將所需要的中文翻譯成為日文,因為我們有很多非??煽康姆g軟件,如谷歌翻譯軟件等。大數(shù)據(jù)已經(jīng)在各個領(lǐng)域和學(xué)科得到了應(yīng)用,例如醫(yī)療領(lǐng)域,大數(shù)據(jù)可以指導(dǎo)人們健康飲食,適時進行身體檢查,并且確定檢查項目,幫助醫(yī)生對患者進行疾病診斷等。

三、大數(shù)據(jù)時代統(tǒng)計學(xué)專業(yè)教學(xué)現(xiàn)狀

隨著科技的不斷發(fā)展和進步,人們獲取信息和數(shù)據(jù)的途徑也發(fā)生了很大的變化,電子商務(wù)的發(fā)展和各種多媒體信息技術(shù)的飛速發(fā)展和應(yīng)用,給傳統(tǒng)的統(tǒng)計學(xué)應(yīng)用和教學(xué)帶來了機遇的同時也帶來了非常大的挑戰(zhàn)。一方面,由于各種信息和數(shù)據(jù)的不斷涌入,人們在被動搜集著各種數(shù)據(jù)。統(tǒng)計學(xué)的教學(xué)也需要不斷探索新的模式。另一方面,人們在被動接受數(shù)據(jù)的同時也在主動搜集數(shù)據(jù)信息,不同學(xué)科有不同的數(shù)據(jù)需要。例如經(jīng)濟學(xué)領(lǐng)域的專家每天都在搜集各自的調(diào)查數(shù)據(jù)和觀察數(shù)據(jù),而自然科學(xué)領(lǐng)域的專家學(xué)者則不僅搜集宏觀天文數(shù)據(jù),還在搜集微觀基因數(shù)據(jù)。不同的人們搜集數(shù)據(jù)的方法也各不相同,有的在實驗室通過試驗進行數(shù)據(jù)搜集,有的人則通過網(wǎng)絡(luò)進行數(shù)據(jù)搜集和研究。對于當(dāng)前大數(shù)據(jù)給統(tǒng)計學(xué)帶來的挑戰(zhàn),美國科學(xué)院“大數(shù)據(jù)分析委員會”給出了分析,他們認(rèn)為這些挑戰(zhàn)在于對不同格式和結(jié)構(gòu)的數(shù)據(jù)的處理方面、對于數(shù)據(jù)來源的追蹤方面、對于共享數(shù)據(jù)的安全性問題和完整性問題方面、對于樣本異質(zhì)性和偏倚性處理方面、在對問題進行處理時的決策和分析方面以及對分布式和并行式在開發(fā)時的算法方面的問題等。國內(nèi)相關(guān)部門也對這一問題進行了研討,最早一次是2012年5月在香山召開的“大數(shù)據(jù)科學(xué)與工程”會議,第二次是在2013年5月召開的對于大數(shù)據(jù)原理以及發(fā)展前景的探討會,并同時制定了相關(guān)的科研計劃。但關(guān)于大數(shù)據(jù)背景下統(tǒng)計學(xué)專業(yè)教學(xué)的探索還非常稀缺。

四、統(tǒng)計學(xué)專業(yè)課程改革

針對以上所述大數(shù)據(jù)時代的特點和變革意義以及目前統(tǒng)計學(xué)專業(yè)教學(xué)的現(xiàn)狀,本文進行了相應(yīng)的初步探索。

(一)改革的總體思路

將現(xiàn)有的統(tǒng)計學(xué)頂級雜志或著名文獻中的成熟的大數(shù)據(jù)分析方法逐步凝練,形成教學(xué)內(nèi)容;將使用R軟件中的函數(shù)包實現(xiàn)這些大數(shù)據(jù)分析方法。

(二)改革的具體內(nèi)容

1.在《數(shù)據(jù)挖掘原理與方法》課程中引入大數(shù)據(jù)分析方法及其R語言的代碼實現(xiàn)。2.在《非參數(shù)統(tǒng)計》課程中引入多元非參數(shù)統(tǒng)計方法(諸如多元符號、多元秩、多元符號秩等)、非參數(shù)回歸模型、半?yún)?shù)回歸模型及其R語言的代碼實現(xiàn)。3.在《回歸分析》課程中引入回歸樹、boosting回歸、bagging回歸、隨機森林回歸等用來處理大數(shù)據(jù)的回歸方法、高維回歸變量選擇方法(比如LASSO回歸、動態(tài)LASSO回歸等)及其R語言的代碼實現(xiàn)。4.在《多元統(tǒng)計分析》課程中引入高維統(tǒng)計分析方法及其R語言的代碼實現(xiàn)。5.在工科《概率論與數(shù)理統(tǒng)計》課程中引入R語言的代碼實現(xiàn)。

(三)改革的主要創(chuàng)新點