首頁 > 精品范文 > 統(tǒng)計學抽樣方法
時間:2023-08-17 17:34:21
序論:寫作是一種深度的自我表達。它要求我們深入探索自己的思想和情感,挖掘那些隱藏在內(nèi)心深處的真相,好投稿為您帶來了七篇統(tǒng)計學抽樣方法范文,愿它們成為您寫作過程中的靈感催化劑,助力您的創(chuàng)作。
關鍵詞:大數(shù)據(jù);統(tǒng)計學;數(shù)據(jù)分析;抽樣理論;理論
重構隨著信息科學技術的高速度發(fā)展,當代獲取和儲存數(shù)據(jù)信息的能力不斷增強而成本不斷下降,這為大數(shù)據(jù)的應用提供了必要的技術環(huán)境和可能.應用大數(shù)據(jù)技術的優(yōu)勢愈來愈明顯,它的應用能夠幫助人類獲取真正有價值的數(shù)據(jù)信息.近年來,專家學者有關大數(shù)據(jù)技術問題進行了大量的研究工作[1],很多領域也都受到了大數(shù)據(jù)分析的影響.這個時代將大數(shù)據(jù)稱為未來的石油,它必將對這個時代和未來的社會經(jīng)濟以及科學技術的發(fā)展產(chǎn)生深遠的意義和影響.目前對于大數(shù)據(jù)概念,主要是從數(shù)據(jù)來源和數(shù)據(jù)的處理工具與處理難度方面考慮,但國內(nèi)外專家學者各有各的觀點,并沒有給出一致的精確定義.麥肯錫全球數(shù)據(jù)分析研究所指出大數(shù)據(jù)是數(shù)據(jù)集的大小超越了典型數(shù)據(jù)庫工具集合、存儲、管理和分析能力的數(shù)據(jù)集,大數(shù)據(jù)被Gartner定義為極端信息管理和處理一個或多個維度的傳統(tǒng)信息技術問題[23].目前得到專家們認可的一種觀點,即:“超大規(guī)?!笔荊B級數(shù)據(jù),“海量”是TB級數(shù)據(jù),而“大數(shù)據(jù)”是PB及其以上級別數(shù)據(jù)[2].
一些研究學者把大數(shù)據(jù)特征進行概括,稱其具有數(shù)據(jù)規(guī)模巨大、類型多樣、可利用價值密度低和處理速度快等特征,同時特別強調(diào)大數(shù)據(jù)區(qū)別于其他概念的最重要特征是快速動態(tài)變化的數(shù)據(jù)和形成流式數(shù)據(jù).大數(shù)據(jù)技術發(fā)展所面臨的問題是數(shù)據(jù)存儲、數(shù)據(jù)處理和數(shù)據(jù)分析、數(shù)據(jù)顯示和數(shù)據(jù)安全等.大數(shù)據(jù)的數(shù)據(jù)量大、多樣性、復雜性及實時性等特點,使得數(shù)據(jù)存儲環(huán)境有了很大變化[45],而大部分傳統(tǒng)的統(tǒng)計方法只適合分析單個計算機存儲的數(shù)據(jù),這些問題無疑增加了數(shù)據(jù)處理和整合的困難.數(shù)據(jù)分析是大數(shù)據(jù)處理的核心過程,同時它也給傳統(tǒng)統(tǒng)計學帶來了巨大的挑戰(zhàn)[6].產(chǎn)生大數(shù)據(jù)的數(shù)據(jù)源通常情況下具有高速度性和實時性,所以要求數(shù)據(jù)處理和分析系統(tǒng)也要有快速度和實時性特點,而傳統(tǒng)統(tǒng)計分析方法通常不具備快速和實時等特點.基于大數(shù)據(jù)的特點,傳統(tǒng)的數(shù)據(jù)統(tǒng)計理論已經(jīng)不能適應大數(shù)據(jù)分析與研究的范疇,傳統(tǒng)統(tǒng)計學面臨著巨大的機遇與挑戰(zhàn),然而為了適應大數(shù)據(jù)這一新的研究對象,傳統(tǒng)統(tǒng)計學必須進行改進,以繼續(xù)和更好的服務于人類.目前國內(nèi)外將大數(shù)據(jù)和統(tǒng)計學相結合的研究文獻并不多.本文對大數(shù)據(jù)時代這一特定環(huán)境背景,統(tǒng)計學的抽樣理論和總體理論的存在價值、統(tǒng)計方法的重構及統(tǒng)計結果的評價標準的重建等問題進行分析與研究.
1傳統(tǒng)意義下的統(tǒng)計學
廣泛的統(tǒng)計學包括三個類型的統(tǒng)計方法:①處理大量隨機現(xiàn)象的統(tǒng)計方法,比如概率論與數(shù)理統(tǒng)計方法.②處理非隨機非概率的描述統(tǒng)計方法,如指數(shù)編制、社會調(diào)查等方法.③處理和特定學科相關聯(lián)的特殊方法,如經(jīng)濟統(tǒng)計方法、環(huán)境科學統(tǒng)計方法等[7].受收集、處理數(shù)據(jù)的工具和能力的限制,人們幾乎不可能收集到全部的數(shù)據(jù)信息,因此傳統(tǒng)的統(tǒng)計學理論和方法基本上都是在樣本上進行的.或者即使能夠得到所有數(shù)據(jù),但從實際角度出發(fā),因所需成本過大,也會放棄搜集全部數(shù)據(jù).然而,選擇最佳的抽樣方法和統(tǒng)計分析方法,也只能最大程度還原總體一個特定方面或某些方面的特征.事實上我們所察覺到的數(shù)據(jù)特征也只是總體大量特征中的一小部分,更多的其他特征尚待發(fā)掘.總之,傳統(tǒng)統(tǒng)計學是建立在抽樣理論基礎上,以點帶面的統(tǒng)計分析方法,強調(diào)因果關系的統(tǒng)計分析結果,推斷所測對象的總體本質(zhì)的一門科學,是通過搜集、整理和分析研究數(shù)據(jù)從而探索數(shù)據(jù)內(nèi)部存在規(guī)律的一門科學.
2統(tǒng)計學是大數(shù)據(jù)分析的核心
數(shù)的產(chǎn)生基于三個要素,分別是數(shù)、量和計量單位.在用數(shù)來表示事物的特征并采用了科學的計量單位后,就產(chǎn)生了真正意義上的數(shù)據(jù),即有根據(jù)的數(shù).科學數(shù)據(jù)是基于科學設計,通過使用觀察和測量獲得的數(shù)據(jù),認知自然現(xiàn)象和社會現(xiàn)象的變化規(guī)律,或者用來檢驗已經(jīng)存在的理論假設,由此得到了具有實際意義和理論意義的數(shù)據(jù).從數(shù)據(jù)中獲得科學數(shù)據(jù)的理論,即統(tǒng)計學理論.科學數(shù)據(jù)是通過統(tǒng)計學理論獲得的,而統(tǒng)計學理論是為獲得科學數(shù)據(jù)而產(chǎn)生的一門科學.若說數(shù)據(jù)是傳達事物特征的精確語言,進行科學研究的必備條件,認知世界的重要工具,那么大數(shù)據(jù)分析就是讓數(shù)據(jù)最大限度地發(fā)揮功能,充分表達并有效滿足不同需求的基本要求.基于統(tǒng)計學的發(fā)展史及在數(shù)據(jù)分析中的作用,完成將數(shù)據(jù)轉化為知識、挖掘數(shù)據(jù)內(nèi)在規(guī)律、通過數(shù)據(jù)發(fā)現(xiàn)并解決實際問題、預測可能發(fā)生的結果等是研究大數(shù)據(jù)的任務,而這必然離不開統(tǒng)計學.以大數(shù)據(jù)為研究對象,通過數(shù)據(jù)挖掘、提取、分析等手段探索現(xiàn)象內(nèi)在本質(zhì)的數(shù)據(jù)科學必須在繼承或改進統(tǒng)計學理論的基礎上產(chǎn)生.
統(tǒng)計數(shù)據(jù)的發(fā)展變化經(jīng)歷了一系列過程,從只能收集到少量的數(shù)據(jù)到盡量多地收集數(shù)據(jù),到科學利用樣本數(shù)據(jù),再到綜合利用各類數(shù)據(jù),以至于發(fā)展到今天的選擇使用大數(shù)據(jù)的過程.而統(tǒng)計分析為了適應數(shù)據(jù)可觀察集的不斷增大,也經(jīng)歷了相應的各個不同階段,產(chǎn)生了統(tǒng)計分組法、大量觀察法、歸納推斷法、綜合指標法、模型方程法和數(shù)據(jù)挖掘法等分析方法,并且借助計算機以及其他軟件的程度也越來越深.300多年來,隨著數(shù)據(jù)量以指數(shù)速度的不斷增長,統(tǒng)計學圍繞如何搜集、整理和分析數(shù)據(jù)而展開,合理構建了應用方法體系,幫助各個學科解決了許多復雜問題.現(xiàn)在進入了大數(shù)據(jù)時代,統(tǒng)計學依舊是數(shù)據(jù)分析的靈魂,大數(shù)據(jù)分析是數(shù)據(jù)科學賦予統(tǒng)計學的新任務.對于統(tǒng)計學而言,來自新時代的數(shù)據(jù)科學挑戰(zhàn)有可能促使新思想、新方法和新技術產(chǎn)生,這一挑戰(zhàn)也意味著對于統(tǒng)計學理論將面臨巨大的機遇.
3統(tǒng)計學在大數(shù)據(jù)時代下必須改革
傳統(tǒng)統(tǒng)計學是通過對總體進行抽樣來搜索數(shù)據(jù),對樣本數(shù)據(jù)進行整理、分析、描述等,從而推斷所測對象的總體本質(zhì),甚至預測總體未來的一門綜合性學科.從研究對象到統(tǒng)計結果的評判標準都是離不開樣本的抽取,完全不能適應大數(shù)據(jù)的4V特點,所以統(tǒng)計學為適應大數(shù)據(jù)技術的發(fā)展,必須進行改革.從學科發(fā)展角度出發(fā),大數(shù)據(jù)對海量數(shù)據(jù)進行存儲、整合、處理和分析,可以看成是一種新的數(shù)據(jù)分析方法.數(shù)據(jù)關系的內(nèi)在本質(zhì)決定了大數(shù)據(jù)和統(tǒng)計學之間必然存在聯(lián)系,大數(shù)據(jù)對統(tǒng)計學的發(fā)展提出了挑戰(zhàn),體現(xiàn)在大樣本標準的調(diào)整、樣本選取標準和形式的重新確定、統(tǒng)計軟件有待升級和開發(fā)及實質(zhì)性統(tǒng)計方法的大數(shù)據(jù)化.但是也提供了一個機遇,體現(xiàn)在統(tǒng)計質(zhì)量的提高、統(tǒng)計成本的下降、統(tǒng)計學作用領域的擴大、統(tǒng)計學科體系的延伸以及統(tǒng)計學家地位的提升[7].
3.1大數(shù)據(jù)時代抽樣和總體理論存在價值
傳統(tǒng)統(tǒng)計學中的樣本數(shù)據(jù)來自總體,而總體是客觀存在的全體,可以通過觀測到的或經(jīng)過抽樣而得到的數(shù)據(jù)來認知總體.但是在大數(shù)據(jù)時代,不再是隨機樣本,而是全部的數(shù)據(jù),還需要假定一個看不見摸不著的總體嗎?如果將大數(shù)據(jù)看成一個高維度的大樣本集合,針對樣本大的問題,按照傳統(tǒng)統(tǒng)計學的方法,可以采用抽樣的方法來減少樣本容量,并且可以達到需要的精度;對于維度高的問題,可以采取對變量進行選擇、降維、壓縮、分解等方法來降低數(shù)據(jù)的復雜程度.但實際上很難做得到,大數(shù)據(jù)涵蓋多學科領域、多源、混合的數(shù)據(jù),各學科之間的數(shù)據(jù)融合,學科邊界模糊,各范疇的數(shù)據(jù)集互相重疊,合成一體,而且大數(shù)據(jù)涉及到各種數(shù)據(jù)類型.因此想要通過抽樣而使數(shù)據(jù)量達到傳統(tǒng)統(tǒng)計學的統(tǒng)計分析能力范圍是一件相當困難或是一件不可能的事.大量的結構數(shù)據(jù)和非結構數(shù)據(jù)交織在一起,系統(tǒng)首先要認清哪個是有價值的信息,哪個是噪聲,以及哪些不同類型的數(shù)據(jù)信息來自于同一個地址的數(shù)據(jù)源,等等,傳統(tǒng)的統(tǒng)計學是無法做到的.在大數(shù)據(jù)時代下,是否需要打破傳統(tǒng)意義的抽樣理論、總體及樣本等概念和關系,是假設“樣本=總體”,還是“樣本趨近于總體”,還是不再使用總體和樣本這兩個概念,而重新定義一個更合適的概念,等等.人們該怎樣“安排”抽樣、總體及樣本等理論,或人們該怎樣修正抽樣、總體、樣本的“公理化”定義,這個問題是大數(shù)據(jù)時代下,傳統(tǒng)統(tǒng)計學面臨改進的首要問題.
3.2統(tǒng)計方法在大數(shù)據(jù)時代下的重構問題
在大數(shù)據(jù)時代下,傳統(tǒng)的高維度表達、結構描述和群體行為分析方法已經(jīng)不能精確表達大數(shù)據(jù)在異構性、交互性、時效性、突發(fā)性等方面的特點,傳統(tǒng)的“假設-模型-檢驗”的統(tǒng)計方法受到了質(zhì)疑,而且從“數(shù)據(jù)”到“數(shù)據(jù)”的統(tǒng)計模式還沒有真正建立,急切需要一個新的理論體系來指引,從而建立新的分析模型.去除數(shù)據(jù)噪聲、篩選有價值的數(shù)據(jù)、整合不同類型的數(shù)據(jù)、快速對數(shù)據(jù)做出分析并得出分析結果等一系列問題都有待于研究.大數(shù)據(jù)分析涉及到三個維度,即時間維度、空間維度和數(shù)據(jù)本身的維度,怎樣才能全面、深入地分析大數(shù)據(jù)的復雜性與特性,掌握大數(shù)據(jù)的不確定性,構建高效的大數(shù)據(jù)計算模型,變成了大數(shù)據(jù)分析的突破口.科學數(shù)據(jù)的演變是一個從簡單到復雜的各種形式不斷豐富、相互包容的過程,是一個循序漸進的過程,而不是簡單的由一種形式取代另一種形式.研究科學數(shù)據(jù)的統(tǒng)計學理論也是一樣,也是由簡單到復雜的各種形式相互包容、不斷豐富的發(fā)展過程,而絕不是完全否定一種理論、由另一種理論形式所代替.大數(shù)據(jù)時代的到來統(tǒng)計學理論必須要進行不斷的完善和發(fā)展,以適應呈指數(shù)增長的數(shù)據(jù)量的大數(shù)據(jù)分析的需要.
3.3如何構建大數(shù)據(jù)時代下統(tǒng)計結果的評價標準框架
大數(shù)據(jù)時代下,統(tǒng)計分析評價的標準又該如何變化?傳統(tǒng)統(tǒng)計分析的評價標準有兩個方面,一是可靠性評價,二是有效性評價,然而這兩種評價標準都因抽樣而生.可靠性評價是指用樣本去推斷總體有多大的把握程度,一般用概率來衡量.可靠性評價有時表現(xiàn)為置信水平,有時表現(xiàn)為顯著性水平[8].怎么確定顯著性水平一直是個存在爭議的問題,特別是在模型擬合度評價和假設檢驗中,因為各自參照的分布類型不一樣,其統(tǒng)計量就不一樣,顯著性評價的臨界值也就不一樣,可是臨界值又與顯著性水平的高低直接相關.而大數(shù)據(jù)在一定程度上是全體數(shù)據(jù),因此不存在以樣本推斷總體的問題,那么在這種情況下,置信水平、可靠性問題怎么確定?依據(jù)是什么?有效性評價指的是真實性,即為誤差的大小,它與準確性、精確性有關.通常準確性是指觀察值與真實值的吻合程度,一般是無法衡量的,而精確性用抽樣分布的標準差來衡量.顯然,精確性是針對樣本數(shù)據(jù)而言的,也就是說樣本數(shù)據(jù)有精確性問題,同時也有準確性問題.抽樣誤差和非抽樣誤差都可能存在于樣本數(shù)據(jù)中,抽樣誤差可以計算和控制,但是非抽樣誤差只能通過各種方式加以識別或判斷[910].大多數(shù)情況下,對于樣本量不是太大的樣本,非抽樣誤差可以得到較好的防范,然而對于大數(shù)據(jù)的全體數(shù)據(jù)而言,沒有抽樣誤差問題,只有非抽樣誤差問題,也就是說大數(shù)據(jù)的真實性只表現(xiàn)為準確性.但是由于大數(shù)據(jù)特有的種種特性,使得大數(shù)據(jù)的非抽樣誤差很難進行防范、控制,也很難對其進行準確性評價.總之,對于大數(shù)據(jù)分析來說,有些統(tǒng)計分析理論是否還有意義,確切說有哪些統(tǒng)計學中的理論可以適用于大數(shù)據(jù)分析,而哪些統(tǒng)計學中的理論需要改進,哪些統(tǒng)計學中的理論已不再適用于大數(shù)據(jù)統(tǒng)計研究,等等,都有待于研究.所以大數(shù)據(jù)時代的統(tǒng)計學必是在繼承中求改進,改進中求發(fā)展,重構適應大數(shù)據(jù)時代的新統(tǒng)計學理論.
4結論
來自于社會各種數(shù)據(jù)源的數(shù)據(jù)量呈指數(shù)增長,大數(shù)據(jù)對社會發(fā)展的推動力呈指數(shù)效應,大數(shù)據(jù)已是生命活動的主要承載者.一個新事物的出現(xiàn),必然導致傳統(tǒng)觀念和傳統(tǒng)技術的變革.對傳統(tǒng)統(tǒng)計學來說,大數(shù)據(jù)時代的到來無疑是一個挑戰(zhàn),雖然傳統(tǒng)統(tǒng)計學必須做出改變,但是占據(jù)主導地位的依然會是統(tǒng)計學,它會引領人類合理分析利用大數(shù)據(jù)資源.大數(shù)據(jù)給統(tǒng)計學帶來了機遇和挑戰(zhàn),統(tǒng)計學家們應該積極學習新事物,適應新環(huán)境,努力為大數(shù)據(jù)時代創(chuàng)造出新的統(tǒng)計方法,擴大統(tǒng)計學的應用范圍.
參考文獻:
[1]陳冬玲,曾文.頻繁模式挖掘中基于CFP的應用模型[J]沈陽大學學報(自然科學版),2015,27(4):296300.
[3]卞友江.“大數(shù)據(jù)”概念考辨[J].新聞研究導刊,2013,35(5):2528.
[5]靳小龍,王元卓,程學旗.大數(shù)據(jù)的研究體系與現(xiàn)狀[J].信息通信技術,2013(6):3543.
[6]覃雄派,王會舉,杜小勇,等.大數(shù)據(jù)分析:Rdbms與Mapreduce的競爭與共生[J].軟件學報,2012,23(1):32-45.
[7]游士兵,張佩,姚雪梅.大數(shù)據(jù)對統(tǒng)計學的挑戰(zhàn)和機遇[J].珞珈管理評論,2013(2):165171.
[8]李金昌.大數(shù)據(jù)與統(tǒng)計新思維[J].統(tǒng)計研究,2014,31(1):1017.
一、統(tǒng)計及其基本思想與方法
1 什么是統(tǒng)計學
問:一般認為,統(tǒng)計學這個詞來源于拉丁語的國情學,原是國家管理人員感興趣的事情?!洞蟛涣蓄嵃倏迫珪穼y(tǒng)計學下的定義是:“統(tǒng)計學是關于收集和分析數(shù)據(jù)的科學和藝術。”陳希孺院士認為:“統(tǒng)計學是有關收集和分析帶有隨機性誤差的數(shù)據(jù)的科學和藝術?!?/p>
史寧中教授,作為統(tǒng)計學家,您是如何認識統(tǒng)計學的?
史教授:我們先來簡單地回顧統(tǒng)計學的歷史是有益處的。正如拉丁語所說,統(tǒng)計原本就是收集和分析國家管理中需要的各種數(shù)據(jù),比如國民收入、各種稅收。為了直觀,人們才發(fā)明了各種報表、直方圖、扇形圖,等等??梢钥吹?,這種傳統(tǒng)意義上的統(tǒng)計學現(xiàn)在仍然是非常重要的,這也是我們現(xiàn)在小學統(tǒng)計教學中的主要內(nèi)容之一。后來到了14世紀左右,隨著航海業(yè)在歐洲興起,航海保險業(yè)開始出現(xiàn)。為了合理地確定保險金與賠償金,需要了解不同季節(jié)、不同路線航海出現(xiàn)事故的可能性大小,需要收集相關的數(shù)據(jù),根據(jù)數(shù)據(jù)進行分析和判斷,這被稱為近代統(tǒng)計學的發(fā)端。到了19世紀末20世紀初,人們把數(shù)學、特別是概率論的有關知識引入到統(tǒng)計學,構建了統(tǒng)計學的基礎。與古典統(tǒng)計學相比,雖然二者都是對數(shù)據(jù)的收集和分析,但卻有本質(zhì)的不同,因為后者進行分析的基礎是“不確定性”,我們稱之為“隨機”。
到了現(xiàn)代,人們發(fā)現(xiàn),對于大量數(shù)據(jù)的分析,采用隨機的方法不僅方便而且準確。比如,對于國民收入,我們可以動用大量的人力來收集數(shù)據(jù),但是誰都知道這樣的數(shù)據(jù)不可能是準確的,遠不如我們依據(jù)某種原則規(guī)劃分出地區(qū)和人群,然后抽樣、加權求和準確。再比如,對于股票市場,一天交易之后,可以得到精確的交易總量,但是人們寧可用部分核心企業(yè)的股票交易量來反映股票的變化,這便是“恒生指數(shù)”“上證指數(shù)”,等等。特別是到了2l世紀,銀行、保險、電信,以及材料科學、基因組學等新興學科的實驗中涉及大量數(shù)據(jù),其分析更需要借助隨機方法了。我想,大概就是因為這些原因,國家才決定在現(xiàn)在中小學數(shù)學的教學中加入統(tǒng)計學的內(nèi)容。
因此,你們談到的關于統(tǒng)計學的定義都是可以的。但是,要把握統(tǒng)計學的根本思想方法卻是非常困難的。
問:那么,您認為統(tǒng)計學的基本思想方法是什么呢?
史教授:這是一個不容易回答的問題。對于統(tǒng)計學的掌握很大程度上依賴于感悟,需要比較長的時間的理解與實踐。我們先來回顧一下中小學傳統(tǒng)數(shù)學的教學內(nèi)容。這些內(nèi)容主要是對日常生活中見到的圖形和數(shù)量的抽象,研究的問題是圖形的變化和計算法則,研究的基礎是定義和假設,研究的方法主要是歸納、遞歸、類比和演繹推理。
統(tǒng)計學則不同。如我上面談到的,統(tǒng)計學是通過數(shù)據(jù)來進行分析和推斷的。因此,統(tǒng)計研究的基礎是數(shù)據(jù)。這些數(shù)據(jù)的特點是,對于每一個數(shù)據(jù)而言,都具有不確定性,我們需要抽取一定數(shù)量的數(shù)據(jù),才能從中獲取信息。因此,統(tǒng)計學的研究依賴于對數(shù)的感悟,甚至是對一堆看似雜亂無章的數(shù)的感悟。通過對數(shù)據(jù)的歸納整理、分析判斷,可以發(fā)現(xiàn)其中隱藏的規(guī)律。因為可以用各種方法對數(shù)據(jù)進行歸納整理、分析判斷,所以,得到的結論也可能是不同的。而且,我們很難說哪一種方法是對的,哪一種方法是錯的,我們只能說,能夠更客觀地反映實際背景的方法要更好一些。比如,我們希望知道某公司員工的收入情況,可以用平均數(shù)也可以用中位數(shù),很難說哪個方法錯。事實上,如果收入比較均衡,用平均數(shù)要好一些;如果收入比較極端,用中位數(shù)要好一些。當然,最好的方法是對收入。情況進行分類,但是分類的方法又有好壞之分。我們可以看到,統(tǒng)計學關心更多的是好與不好,而中小學傳統(tǒng)數(shù)學關心更多的是對與錯。
因此,統(tǒng)計學的基本思路是,根據(jù)所關心的問題尋求最好的方法,對數(shù)據(jù)進行分析和判斷,得到必要的信息去解釋實際背景。
2 統(tǒng)計學的研究對象
問:我們對于統(tǒng)計學有了一定的了解。從您的談話中我們感覺到,統(tǒng)計學似乎是包羅―萬象的。那么,統(tǒng)計學到底是研究什么呢?
史教授:是這樣的,統(tǒng)計學的應用面非常廣,凡是涉及數(shù)據(jù)分析的都可以成為統(tǒng)計學的研究領域。特別是到了近代,人們希望更加精細地了解實際背景,更多地借助數(shù)據(jù)分析,甚至人文科學也是如此,并且逐漸形成了專業(yè)的研究領域,比如計量經(jīng)濟學、計量社會學、計量教育學、計量心理學,等等。這些研究領域分析方法的基礎大體是統(tǒng)計學。統(tǒng)計學并不研究某一個領域的具體內(nèi)容,在本質(zhì)上只是研究數(shù)據(jù)分析的方法,這包括創(chuàng)新的方法,也包括分析方法的好壞、分析方法的適用條件。
問:您能否結合中小學統(tǒng)計的內(nèi)容談得更具體一些?特別是在統(tǒng)計教學過程中,應當把握的基本原則是什么呢?
史教授:可以在統(tǒng)計研究中首先遇到的問題是如何獲取“好”的數(shù)據(jù)。所謂“好”的數(shù)據(jù),是指那些能夠更加客觀地反映實際背景的數(shù)據(jù),而要獲取好的數(shù)據(jù)要依賴于“好”的方法。根據(jù)數(shù)據(jù)的不同,方法主要分兩大類,一是通過調(diào)查收集數(shù)據(jù),二是通過實驗制造數(shù)據(jù)-中小學統(tǒng)計教學中涉及的主要是前者,稱為抽樣調(diào)查(而后者通常被稱為實驗設計)_抽樣調(diào)查又包含兩個方面,一個是對已經(jīng)存在的數(shù)據(jù)的收集,稱之為抽樣,比如市場的物價、學生的身高、企業(yè)的產(chǎn)值,等等;另一個是需要我們了解才能夠獲取的,稱之為調(diào)查,比如美國總統(tǒng)的民意支持率、人們?nèi)粘OM的主要項目、中小學生喜歡的歌手,等等。
根據(jù)問題的不同,所要采用的方法也可能不同,但是要建立兩個基本原則。第一個基本原則是,采用能夠獲取好的數(shù)據(jù)的方法。為了獲取好的數(shù)據(jù),我們需要盡可能多地利用對于實際背景已有的先驗知識。比如,希望知道學生的身高,先驗知識是“年齡之間差別很大”。因此,最好是根據(jù)年齡段學生數(shù)的多少按比例抽取樣本,我們稱這種方法為分層抽樣。可以看到,統(tǒng)計方法的直觀想法是很明顯的。如果對于實際背景一無所知,那么一定要抽取樣本,這便是隨機抽樣。比如,希望知道學生喜歡的歌手,因為這些學生年齡之間差別可能不大,就可以采取隨機抽樣。當然也可以用分層抽樣,但要麻煩得多。第二個基本原則是,采用簡單的方法。能夠基于上述兩個原則的方法就是一個好方法。我們不要小看第二個原則,一個好的方法往往能夠節(jié)省很多調(diào)查經(jīng)費。這就是為什么咨詢公司非常歡迎統(tǒng)計學家的原因。
問:剛才您提到了樣本,許多教師對樣本這個概念總是感到費解。
史教授:是的,這個概念很難把握。樣本實質(zhì)上就是數(shù)據(jù),但是,統(tǒng)計學中涉及的數(shù)據(jù)往往是隨機性的。還是
回到“學生的身高”這個問題上來。在抽樣之前。我們可能并不知道具體數(shù)據(jù)的大小,這些數(shù)據(jù)對于我們是隨機的。為了討論出一個好的方法,我們假想能夠得到這些數(shù)據(jù),并且假想這些數(shù)據(jù)的出現(xiàn)是依據(jù)某種規(guī)律的,這種規(guī)律就是數(shù)據(jù)出現(xiàn)的可能性在小,我們稱之為概率。比如,高年級學生出現(xiàn)大數(shù)據(jù)(高個子)的可能性要大于低年級學生,就是說,出現(xiàn)大數(shù)據(jù)的概率要大。但是,只有當抽樣之后我們才能得到真實的數(shù)據(jù);才能進行實質(zhì)的計算與分析。這樣,我們所要研究的數(shù)據(jù)既具有隨機性又具有真實性。為了方便起見,我們稱這樣的數(shù)據(jù)為樣本。
問:根據(jù)您的闡述,統(tǒng)計學怎么有一些哲學式的思考呢?
史教授:你們理解到了根本。這是統(tǒng)計學與中小學傳統(tǒng)數(shù)學的最大區(qū)別。傳統(tǒng)數(shù)學可以根據(jù)假設和規(guī)定的原則進行計算或者推理,但是統(tǒng)計學往往要問你所采用的方法是不是有道理,是不是還有更為合理的方法。不過,傳統(tǒng)數(shù)學是統(tǒng)計學不可缺少的工具。
問:是不是因為統(tǒng)計學需要計算呢?
史教授:不僅僅如此,判斷統(tǒng)計方法的好壞也是依賴傳統(tǒng)數(shù)學的。
在統(tǒng)計學上,自由度的概念十分廣泛,在對自由度的概念進行界定時,狹義上,在對總體的參數(shù)進行估計時,在樣本中,能自由變化,或者自變量的個數(shù)能獨立,我們稱之為統(tǒng)計量的自由度。在社會經(jīng)濟的統(tǒng)計實踐中,房地產(chǎn)價格變化和居民消費情況的統(tǒng)計等社會調(diào)查都是建立在統(tǒng)計抽樣的基礎上完成的,這種方法的優(yōu)點在于只要通過樣本的信息,就能夠推測出總體的情況。自由度的概念涉及范圍很廣泛,樣本的參數(shù)估計、系統(tǒng)的推斷和統(tǒng)計的檢驗工作都會涉及到,但是當前我國對自由度產(chǎn)生的背景、性質(zhì)和原因在教材上并沒有給出充分的解釋,對自由度的概念也沒有規(guī)范化的詮釋。
關鍵詞:
經(jīng)濟統(tǒng)計;自由度概念;背景和應用
一、自由度概念的產(chǎn)生
自由度概念的產(chǎn)生與與人們進行抽樣調(diào)查密不可分,抽樣調(diào)查是一種非全面調(diào)查,它能夠解決全面調(diào)查無法解決或者較難解決的問題,在抽樣調(diào)查時,先確定好研究地對象,然后對研究對象進行調(diào)查,最后再抽選相應的對象進行調(diào)查,從總體上來看,抽樣調(diào)查的這種方式是對全面調(diào)查的補充和完善。抽樣調(diào)查的簡單快捷是全面調(diào)查力所不及的,全面調(diào)查在調(diào)查過程中,人力、物力和財力的浪費現(xiàn)象較為嚴重。節(jié)約大量的調(diào)查時間。抽樣調(diào)查的特點較多,抽樣調(diào)查進行時不受其他因素的影響,時效性極強;在抽樣調(diào)查中,能夠根據(jù)調(diào)查的要求隨機進行選擇,這顯示出了抽樣調(diào)查的靈活性;在抽樣調(diào)查后針對獲得的數(shù)據(jù)進行詳細的計算,最后所得數(shù)據(jù)準確性極高。雖然在許多定律和假設條件中受到限制,為了降低判斷失誤和調(diào)查不全面的情況,采取提高總體樣本和抽樣樣本之間的相關性措施,在抽樣樣本數(shù)據(jù)的形成上必須慎重對待。于是自由度在這樣的要求下應運而生?;跐M足總體和樣本之間的約束原因,通過對部分變量和元素的調(diào)整以達到實現(xiàn)抽樣調(diào)查的準確性的目的,因此自由度概念產(chǎn)生的主要原因就是樣本在選擇過程中的為滿足相關條件進行的優(yōu)化。
二、自由度概念的界定
自由度是可以自由變換的,對于在自由度中不同的較為顯著性的實驗,其計算方法也是不一樣的,樣本自由度的正確選擇是顯著性實驗的基礎。有專家認為,自由度是可以隨意變化信息的數(shù)量,其前提是沒有違背總體和樣本之間的約束條件。如果僅僅只從社會經(jīng)濟的角度來看,在統(tǒng)計中,統(tǒng)計工作質(zhì)量的主要方面受到樣本統(tǒng)計過程的科學性、樣本的代表性和統(tǒng)計檢驗的合理性以及統(tǒng)計結果的真實性的影響,而統(tǒng)計工作的質(zhì)量主要取決于統(tǒng)計工作的著重點,即統(tǒng)計樣本。自由度的確定和選擇,在形成統(tǒng)計樣本的時候是十分重要的。在統(tǒng)計學上,界定自由度主要從把握樣本與總體的關系來進行,總體樣本與抽樣樣本的關系只是基于統(tǒng)計的目的,在統(tǒng)計方法、統(tǒng)計主體、統(tǒng)計性質(zhì)和統(tǒng)計數(shù)量的不同而有所不同。在經(jīng)濟統(tǒng)計學中,統(tǒng)計學中自由度n-1的由來。
三、自由度在經(jīng)濟統(tǒng)計學中應用分析
自由度在經(jīng)濟統(tǒng)計學中的運用作用極其重要,其中,在抽樣調(diào)查中的應用尤其常見,在抽樣調(diào)查中,自由度的使用能使抽樣調(diào)查結果更為精確。在統(tǒng)計上,自由度的運用也及其常見。
(一)統(tǒng)計上的自由度在統(tǒng)計中,對總體的方差進行估算時,離差平方和的使用是最為常見的,方差的確定由n-1的個數(shù)決定,這其中的原理是:當均值確定后,n-1個數(shù)的值也得到確定,第n個數(shù)的值便會得到確定,在統(tǒng)計計算中,均值是n-1的限制條件,基于這樣的限制條件,在對總體方差進行最后的估計時,自由度便為n-1.在數(shù)學中,自由度是指變量的個數(shù)可以隨意進行取值,舉例說明:假設有4個變量,分別為x、y、z和w,其中x+y+z+w=20,因此可以得知它的自由度等于3.自由度在統(tǒng)計上的運用較為頻繁,在熱力學中,什么是分子運動的自由度?在確立了分子的空間位置時,這個位置所需要的自由坐標的數(shù)量就叫做自由度;在理論上的力學中,質(zhì)點在空間上進行隨意運動時,質(zhì)點的位置只要三個坐標就能夠得到確定,由此可知,質(zhì)點在進行運動的時候,其擁有三個自由度。當然,在物體受到限制時,其自由度便會減少,如果讓質(zhì)點只在一個平面上運動,它的自由度便為兩個,在曲面上也是如此;但是,如果讓質(zhì)點在一條曲線上運動,或者在一條直線上運動,它的自由度就只有一個。
(二)經(jīng)濟學中自由度的運用舉例為證,實驗者對某一公司產(chǎn)品的年銷售量進行調(diào)查研究,該公司預計銷售10萬份產(chǎn)品,利用隨機抽樣的方式對前半年的月銷售量進行調(diào)查,在調(diào)查中,被調(diào)查產(chǎn)品的月銷售量的平均數(shù)是總體的參數(shù),這是較為精確和客觀的。通過對公司相關負責人的問卷調(diào)查和隨機抽樣取得的數(shù)據(jù)獲得前半年的產(chǎn)品月銷售量數(shù)據(jù),樣本的平均值是在調(diào)查中取得的數(shù)據(jù),通過計算獲得的,理論上來說,調(diào)查的參數(shù)與統(tǒng)計量在數(shù)據(jù)的內(nèi)容要求一致,由此可以看出這前半年的數(shù)據(jù)和是能夠得到確定的。當前5月的數(shù)據(jù)被確定,剩下一個月的數(shù)據(jù)的精確度便十分精準。所以,在上述例子中,被研究產(chǎn)品年銷售的情況是:在統(tǒng)計量中求得平均數(shù)后,其自由度為:k=6-1=5.這個解釋可以歸結為:將前半年的月數(shù)視作6,樣本便為x=6,它的平均值假設為7,即為y=7,由于受到y(tǒng)=7的限制,在自由確定了6、3、7后,第6個數(shù)據(jù)只能為13,否則的話,y不等于7。因此,這里的自由度為k=x-1=3,由此推算,在所有統(tǒng)計量中,自由度都為k=x-y。
四、結束語
在日常社會生活中,人們或多或少都會用到統(tǒng)計量,自由度存在于統(tǒng)計量的計算公式中,但不少人會產(chǎn)生疑惑,同樣是計算標準差,為什么在總體中,標準差的自由度為n,但是樣本中的標準的自由度卻為n-1,其他公式中,自由度的界定為n-2或者n-3?我們知道,自由度的概念不僅僅存在于統(tǒng)計學中,但是在經(jīng)濟統(tǒng)計中,自由度的運用是較為全面的。例如對產(chǎn)品的銷售數(shù)量在市場上進行的調(diào)研、人口的統(tǒng)計調(diào)查以及居民的月用電量等等。自由度的概念廣泛存在于統(tǒng)計的計算公式中,
[參考文獻]
[1]袁衛(wèi).從“人口革命”到重構統(tǒng)計教育體系———戴世光教授的學術貢獻[J].中國人民大學學報,2012,01:146-152.
[2]鐘無涯,顏瑋.自由度概念在經(jīng)濟統(tǒng)計中產(chǎn)生的背景及其應用[J].統(tǒng)計與決策,2012,19:8-10.
[3]徐強.用戶友好型《國民經(jīng)濟統(tǒng)計學》教材建設問題研究[J].經(jīng)濟研究導刊,2013,09:251-252.
【關鍵詞】 齲齒;牙齦出血;牙石;流行病學研究;兒童
【中圖分類號】 R 179 R 78 R 780.1 【文獻標識碼】 A 【文章編號】 1000-9817(2008)12-1129-02
為了解河南省人群口腔健康狀況和口腔疾病的發(fā)病趨勢,監(jiān)測和評價《河南省牙防中期規(guī)劃目標(1999-2005)》的實施情況,根據(jù)衛(wèi)生部疾病控制司批準開展的第三次全國口腔健康流行病學抽樣調(diào)查方案的要求,2005年對河南省城鄉(xiāng)人群的口腔疾病患病狀況及口腔健康行為進行了流行病學抽樣調(diào)查。筆者對12歲年齡組人群的調(diào)查結果進行了分析,報道如下。
1 對象與方法
1.1 對象 根據(jù)第三次全國口腔健康流行病學抽樣調(diào)查方案的要求,采用多階段分層等容量隨機抽樣方法,利用國家統(tǒng)計局公布的2000年全國人口普查資料,由第三次全國口腔健康流行病學抽樣小組隨機抽取區(qū)(縣)級單位以及街道(鄉(xiāng)鎮(zhèn))級單位。在此基礎上,省流調(diào)組從每個街道(鄉(xiāng)鎮(zhèn))抽取2個居委會(行政村),然后從被抽中的居委會(行政村)所有適齡人群中隨機抽取各年齡組的被調(diào)查個體。選取河南省鄭州市中原區(qū)、平頂山市湛河區(qū)、項城市、汝州市、濮陽縣、唐河縣12歲年齡組兒童共784人,其中城市391人,農(nóng)村393人;男生390人,女生394人。
1.2 方法 調(diào)查項目包括牙列狀況(只檢查冠齲)、牙周狀況(全口牙齒)、牙齦出血和牙結石、氟牙癥。參加口腔檢查人員全省共 3人,均具備口腔專業(yè)本科以上學歷,從事口腔內(nèi)科臨床工作3年以上。調(diào)查工作開始前,均經(jīng)過衛(wèi)生部組織的培訓,獲得第三次全國口腔健康流行病學抽樣調(diào)查口腔檢查資格證書。在調(diào)查過程中,全國第三次口腔健康流調(diào)技術指導組進行2次質(zhì)量檢查,每個口腔檢查人員的Kappa值均在0.8以上。檢查齲病、牙周疾病使用WHO推薦、上海市齒科器材廠生產(chǎn)的CPI牙周探針及平面口鏡。調(diào)查數(shù)據(jù)全國統(tǒng)一錄入,數(shù)據(jù)的統(tǒng)計處理采用SPSS 12.0統(tǒng)計軟件包完成。
2 結果
2.1 恒牙齲齒患病情況 學生恒牙齲齒的患病率為19.13%。城鄉(xiāng)差異無統(tǒng)計學意義(χ2=0.89,P>0.05),男、女生差異有統(tǒng)計學意義(χ2=5.25,P<0.05);恒牙齲均(DMFT)為0.29,城鄉(xiāng)差異亦無統(tǒng)計學意義(t=-0.54,P>0.05),男、女生差異無統(tǒng)計學意義(t=-0.76,P>0.05),見表1。
2.2 其他口腔健康狀況 在受檢兒童中,檢出有恒牙外傷的兒童19人,占2.42%,男、女生差異無統(tǒng)計學意義(χ2=1.40,P>0.05),城鄉(xiāng)學生差異無統(tǒng)計學意義(χ2=0.50,P>0.05)。第二恒磨牙未萌的兒童占51.28%,男、女生差異有統(tǒng)計學意義(χ2=18.41,P<0.01),城、鄉(xiāng)學生差異無統(tǒng)計學意義(χ2=0.42,P>0.05)。牙齦出血的兒童占29.61%,男、女生差異無統(tǒng)計學意義(χ2=0.42,P>0.05),城、鄉(xiāng)差異有統(tǒng)計學意義(χ2=143.70,P<0.01)。平均每個兒童有1.06個牙位出血,男生牙齦出血的平均數(shù)為1.20個牙位,女生為0.93個牙位;城市兒童牙齦出血的平均數(shù)為0.22個牙位,農(nóng)村為1.90個牙位。有牙結石的兒童占48.85%,男、女生差異無統(tǒng)計學意義(χ2=3.44,P>0.05),城、鄉(xiāng)學生差異有統(tǒng)計學意義(χ2=51.96,P<0.01)。平均每個兒童有2.63個牙位有結石,男生牙結石的平均數(shù)為2.80個牙位,女生為2.46個牙位;城市兒童牙結石的平均數(shù)為1.20個牙位,農(nóng)村為4.06個牙位。有不同程度氟牙癥的兒童占19.05%,城、鄉(xiāng)學生差異有統(tǒng)計學意義(χ2=5.87,P<0.05)。見表2。
3 討論
調(diào)查顯示,河南省12歲兒童恒牙齲患率和齲均分別為19.13%和0.29。按照世界衛(wèi)生組織齲病等級評價標準[1],河南省12歲年齡組兒童少年的齲齒患病處于較低水平;與2002年河南省第二次口腔流調(diào)的結果(23.3%)比較,呈下降趨勢。分析其原因主要有2方面,一是2次調(diào)查齲病診斷標準不同,2005年齲病診斷采用的是WHO口腔健康調(diào)查基本方法第4版的標準;新標準要求必須有明顯的齲洞或明顯的釉質(zhì)下破壞才可以診斷記錄為“齲”,當可疑齲時不能記錄為齲。二是河南省自1996年成立牙病防治領導小組以來,在牙病防治健康教育和兒童青少年齲病防治方面做了大量工作,兒童齲病的患病率得到了一定的控制。
河南省12歲兒童恒牙齲齒充填率為4.0%,低于1995年全國流調(diào)的平均水平(11.05%),與北京、上海等經(jīng)濟發(fā)達城市差距更大(1995年北京市恒齲充填率為18.45%,上海市為41.3%)。發(fā)達國家學生齲患率雖高,但齲齒的充填率一般都在75%以上。所以真正衡量一個國家口腔保健水平的指標不是齲患率,而是DMF構成比中的充填率(齲補率)[2]。
從調(diào)查結果還可以看出,河南省12歲城鄉(xiāng)兒童牙齦出血及牙結石檢出率農(nóng)村高于城市,牙齒健康(無齲齒、牙齦出血和結石)兒童的檢出率城市高于農(nóng)村。因此,在河南省今后的牙病防治工作中,農(nóng)村和農(nóng)村青少年仍是重點。
建議進一步加強口腔健康教育和健康促進,大力推廣窩溝封閉、早期充填等適宜技術,不斷強化和促進兒童青少年的口腔保健意識及口腔健康行為,做到早發(fā)現(xiàn)、早治療,提高兒童青少年的口腔健康水平。
4 參考文獻
[1] 中華人民共和國衛(wèi)生部.全國學生齲病、牙周疾病流行病學抽樣調(diào)查.北京:人民衛(wèi)生出版社,1987:16.
【關鍵詞】醫(yī)院檔案;管理;統(tǒng)計學;病例檔案;應用;醫(yī)院建設
近年來,醫(yī)院檔案收集整理工作日益加重,借閱數(shù)量也呈上升趨勢。因此,做好各類檔案的登記與統(tǒng)計,及時發(fā)現(xiàn)、分析、總結其規(guī)律,是促進檔案開發(fā)利用的重要一環(huán),而且統(tǒng)計學應用效果關系到醫(yī)院檔案工作的效率和質(zhì)量。統(tǒng)計學是一門綜合性學科,是應用數(shù)學的重要組成部分,通過使用數(shù)學概率論等來建立數(shù)學模型,收集被測系統(tǒng)的數(shù)據(jù),對數(shù)據(jù)進行量化分析、總結,進而作為醫(yī)院管理決策的有效依據(jù)。
一、統(tǒng)計學在醫(yī)院檔案管理中的作用
統(tǒng)計學在醫(yī)院的日常管理工作中有著不可或缺的作用,醫(yī)院檔案管理過程中運用統(tǒng)計學方法,能夠如實體現(xiàn)醫(yī)院各部門的客觀情況,較為全面地為醫(yī)院檔案的登記、保管、借閱、使用等提供更加客觀有效的數(shù)據(jù)。
(一)運用檔案統(tǒng)計為醫(yī)院管理者和決策者提供了重要統(tǒng)計數(shù)據(jù)信息,有助于做出正確發(fā)展決策。借助統(tǒng)計手段,可對醫(yī)院某一階段的發(fā)展效果和工作開展情況統(tǒng)計數(shù)據(jù)化,進而分析管理效果,不斷改進管理方法。(二)有助于促進醫(yī)院的人事行政管理的高效化。合理運用統(tǒng)計學方法,更清晰地分析醫(yī)院人員現(xiàn)有情況,量化掌控人事運行,實現(xiàn)醫(yī)院人事招聘、醫(yī)務人員的管理等有序高效進行。
(三)促進醫(yī)院的臨床門診等管理的信息化、科學化和高效化。通過對醫(yī)院的門診人次、住院人次、患者滿意度、病床周轉情況以及診斷治療有效率、病死率等的統(tǒng)計,尤其是病歷檔案的病種統(tǒng)計,進而分析醫(yī)院醫(yī)療服務工作水平如何,更明確掌握醫(yī)院的質(zhì)量控制工作,有利于不斷改進和提升醫(yī)療水平和服務質(zhì)量。(四)有效提升醫(yī)院管理的規(guī)范化、信息化、科學化、高效化。統(tǒng)計檔案一方面為醫(yī)院提供系統(tǒng)、全面的醫(yī)療統(tǒng)計信息,另一方面能及時、準確地從統(tǒng)計檔案中提取各種統(tǒng)計資料,提升醫(yī)院發(fā)展水平。
二、統(tǒng)計學在醫(yī)院檔案管理中的應用
統(tǒng)計學在醫(yī)院各個部門管理工作中皆有涉及,本文主要淺析統(tǒng)計學在醫(yī)院人事檔案、病歷檔案等幾方面中的應用。
(一)統(tǒng)計學在醫(yī)院人事檔案管理中的應用。在醫(yī)院的實際人事管理中,對醫(yī)院人員的基本情況進行收集、整理,并在計算機人事管理系統(tǒng)中輸入,形成人力資源管理的基礎數(shù)據(jù),對醫(yī)院的人員變動以及職稱、學歷等改變予以及時準確的記錄和統(tǒng)計,使用這些統(tǒng)計數(shù)據(jù),形成一定的統(tǒng)計表格和臺賬,便于深入了解醫(yī)院所有的醫(yī)務人員的學歷水平、醫(yī)院的整體學歷結構、科室的科研水平能力、繼續(xù)教育狀況以及業(yè)務水平等情況,從而形成科室的和個人的業(yè)績數(shù)據(jù)庫,便于獎懲制度的實施。同時,醫(yī)院管理者借助人員信息統(tǒng)計報表,可清楚掌握醫(yī)院的每學科的技術結構和能力,從而合理調(diào)整各專業(yè)的人員設置和用人計劃,借助人員學歷、職稱、年齡等結構統(tǒng)計報表以及工資收入統(tǒng)計臺賬,有效實施醫(yī)院醫(yī)務人員的隊伍建設,優(yōu)化醫(yī)院人才結構和知識結構,進而提升醫(yī)院的學科建設水平和醫(yī)療服務質(zhì)量。
(二)統(tǒng)計學在醫(yī)院病歷檔案管理中的應用。病歷檔案醫(yī)院管理的一種特殊檔案形式,病歷檔案是醫(yī)務人員對疾病的診療過程加以記錄,從而形成有效的文獻,記錄患者發(fā)病、治療過程中病情診斷以及護理和治療,對患者發(fā)病治療全過程予以系統(tǒng)記錄,進而做出準確的治療和護理質(zhì)量評價,醫(yī)院科研教學、臨床診治以及管理活動都不可缺少病歷檔案。醫(yī)院工作實踐中,可利用統(tǒng)計檔案資料編制各類型的統(tǒng)計圖表。比如,醫(yī)院年份衛(wèi)生統(tǒng)計資料匯編、年度住院患者病因分析表等;住院患者疾病分類報表、住院患者地區(qū)分布表,還可借助統(tǒng)計臺賬編制醫(yī)療質(zhì)量統(tǒng)計表以及醫(yī)技科室統(tǒng)計表等,還可根據(jù)醫(yī)院實際開展相應的患者滿意度調(diào)查,形成統(tǒng)計表,直觀反映醫(yī)院患者對醫(yī)院的滿意度和醫(yī)院醫(yī)療水平狀況。整理醫(yī)療質(zhì)量分析表,如各臨床科室的醫(yī)療質(zhì)量分析、工作效率和效益對比臺賬,以及醫(yī)院單病種費用統(tǒng)計等信息統(tǒng)計表,便于對各科室進行考核。同時,各科室結合住院患者人數(shù)、病床使用率、周轉率、手術臺次等統(tǒng)計信息,分析科室工作的效率和不足之處,從而做出調(diào)整和改進科室醫(yī)療水平。近年來社會上對檔案的借閱頻次也呈增長趨勢,利用統(tǒng)計手段,將醫(yī)院檔案分類管理,條目清晰,形成年份、地區(qū)或者病種相應的檔案卷,并借助現(xiàn)代化的查閱電子信息化系統(tǒng),更好地服務于社會查閱。統(tǒng)計抽樣方法在病歷檔案管理中應用廣泛,即把研究對象視作總體,從中抽取部分個體,并開展調(diào)查研究,結合研究結果對總體特性予以評估推斷。首先,入館前抽樣。病例檔案在入館前,采取非概率抽樣鑒定法從大范圍文件系列中擇取最有價值文件;采用概率抽樣鑒定法從某一個大文件中擇取小部分文件。然而,工作量太大,實際操作復雜。比如醫(yī)院每年肺炎感染患者資料的篩選,需要結合文件是否具有價值其而定,病歷檔案工作人員可以客觀判斷加上主觀推斷擇取保留檔案。對于諸如病例相似的手足口病患者的檔案就不必全部保留,可結合需要抽取樣本。這樣既能抽取反映大文件重要特征的小部分文件,還能提升檔案庫房管理效率。其次,庫房的抽樣檢查。對庫房所藏案卷狀況予以定期檢查,掌握案卷使用、貯藏、保管等情況是否正常。由于庫房盤點工作量大、病歷檔案多,運用統(tǒng)計學抽樣方法可達到事半功倍效果。比如,醫(yī)院庫房一般按照年份和檔案類別排架。那么年度排架可將同一年份中的檔案排列,進而年份內(nèi)依各部門或檔案類型劃分類目。根據(jù)檔案類型排架則可以把同類別檔案集中排列,進而依據(jù)部門或年份予以分類。這樣便于后期的分層抽樣等工作的開展,只需簡單推斷、使用合理的統(tǒng)計方法便可清楚得出案卷使用、貯藏、保管等情況。
(三)統(tǒng)計學在醫(yī)院其他部門檔案管理中的應用。對于醫(yī)院的后勤服務同樣離不開統(tǒng)計學方法,后勤部用統(tǒng)計數(shù)據(jù)和臺賬,可將洗衣房清洗工作服、被褥以及該科室相關信息統(tǒng)歸成后勤工作表格,予以詳細分類,便于提取各種數(shù)據(jù)、后勤服務質(zhì)量的分析和評價,有條不紊地開展工作。同時,醫(yī)院統(tǒng)計人員可運用統(tǒng)計數(shù)據(jù)向醫(yī)院管理者清晰展示醫(yī)院的財務報表,準確掌握醫(yī)院的經(jīng)濟效益,進而調(diào)整提升醫(yī)院的經(jīng)營計劃。然而,在醫(yī)院檔案管理中的統(tǒng)計學應用還存在不少問題:醫(yī)院管理者對統(tǒng)計學在醫(yī)院檔案管理中的應用價值不夠重視;工作人員專業(yè)技能和素質(zhì)參差不齊;檔案管理統(tǒng)計系統(tǒng)落后,等等。總之,合理應用統(tǒng)計學手段,可有效對醫(yī)院人、財、物流動進行控制和分配,合理配置資源,提升醫(yī)院工作質(zhì)量和服務水平。在管理實踐中重視其價值,加強統(tǒng)計工作人員的業(yè)務技能培訓,提升專業(yè)水平,發(fā)揮檔案管理系統(tǒng)的應有作用,確保醫(yī)院檔案管理工作的有效開展,促進醫(yī)院的可持續(xù)健康發(fā)展。
【參考文獻】
[1]馬樹才.統(tǒng)計抽樣調(diào)查原理與方法[M].遼寧:遼寧大學出版社,1994(1).
[2]李素梅.醫(yī)院人事統(tǒng)計及統(tǒng)計數(shù)據(jù)開發(fā)利用的探析[J].醫(yī)學信息旬刊,2011,24(8):2187.
[3]王燕青.統(tǒng)計學在醫(yī)院人力資源管理中的應用分析[J].中國外資,2014(10).
[4]王陽.電子病歷是醫(yī)院檔案管理的發(fā)展趨勢[J].中國衛(wèi)生統(tǒng)計,2007,24(2):173.
[5]許杰,劉洪棟.加強醫(yī)院統(tǒng)計檔案管理的必要性[J].中國衛(wèi)生統(tǒng)計,1990(5).
[6]楊偉,陳曉燕,金憲華等.統(tǒng)計檔案在醫(yī)院管理中的應用[J].中國醫(yī)院統(tǒng)計,1999(3).
關鍵詞:應用統(tǒng)計學;課堂設計
《應用統(tǒng)計學》是一門實用性非常強的學科,它在經(jīng)濟和金融管理中有著非常重要的作用,因此經(jīng)濟和金融管理專業(yè)都把《應用統(tǒng)計學》作為一門專業(yè)必修課。一方面它為各專業(yè)學生進一步學習專業(yè)后續(xù)課程提供數(shù)量分析方法;另一方面它可以培養(yǎng)學生運用統(tǒng)計方法和數(shù)學方法分析解決實際問題,進行經(jīng)濟和商業(yè)決策的能力。然而,由于《應用統(tǒng)計學》中所用方法比較復雜,數(shù)據(jù)多,計算量大,學生學起來感覺比較繁瑣和枯燥,影響了學習的效果。因此如何設計和講解這一課程,讓學生學起來覺得有用又有趣,而不再畏懼于大量的數(shù)據(jù),難記的公式,就顯得尤為重要。
一、總體設計
從內(nèi)容上來講,《應用統(tǒng)計學》主要介紹收集數(shù)據(jù)、整理數(shù)據(jù)、分析與解釋數(shù)據(jù)的基本理論與基本方法,以及在經(jīng)濟管理與企業(yè)生產(chǎn)經(jīng)營管理中的應用。因此在總體設計上,可以以它的內(nèi)容為一條主線,把主要內(nèi)容分成三大板塊,第一板塊是數(shù)據(jù)的收集,第二板塊是數(shù)據(jù)的整理,第三板塊是分析數(shù)據(jù)和解釋數(shù)據(jù)的基本理論和基本方法,以及如何將這些理論和方法應用到經(jīng)濟和金融管理中,為經(jīng)濟和商業(yè)決策提供依據(jù)。
學習《應用統(tǒng)計學》要求學生掌握一定的概率論知識,如果學生已經(jīng)學習過相關課程,可以在開始簡單復習一下;如果沒有學習過也不要緊,在開始的時候可以對這部分知識進行簡單介紹,內(nèi)容不易過深,只要學生可以理解其中與本課程有關的概念,會計算一些簡單事件的概率就可以了,這樣有助于更好的理解和掌握基本的統(tǒng)計原理,為本課程的學習打下基礎。
二、收集和整理數(shù)據(jù)的設計
從各板塊的難易來說,收集和整理數(shù)據(jù)是比較容易理解和掌握的,但如果只讓學生做書上的例題和習題,去統(tǒng)計和計算這些數(shù)據(jù),學生會覺得很枯燥,效果不是很好。這時可以適當進行一些數(shù)據(jù)調(diào)查實踐活動,比如學生的成績的抽樣,對某一事件的看法的抽樣,有條件的可以到一些超市或工廠企業(yè)去調(diào)查,讓學生自己設計抽樣方法進行抽樣,將抽樣結果進行篩選,選取合適的方法將數(shù)據(jù)表示出來,并要求用一些簡單的描述性統(tǒng)計方法去分析和解釋這些數(shù)據(jù),這樣一方面可以提高學生學習的積極性和主動性,另一方面也可以對這些數(shù)據(jù)提出一些問題較深的統(tǒng)計問題,比如數(shù)據(jù)之間的數(shù)量關系,怎樣用已知數(shù)據(jù)進行預測和估計,為下面的學習做一個鋪墊。
三、分析與解釋數(shù)據(jù)的基本理論與基本方法
分析和解釋數(shù)據(jù)的基本思想和基本方法,以及它在經(jīng)濟管理與企業(yè)生產(chǎn)經(jīng)營管理中的應用是《應用統(tǒng)計學》的主要和核心內(nèi)容,也是學習過程中的難點。它主要包括了參數(shù)估計和假設檢驗、相關與回歸分析、時間數(shù)列的分析等內(nèi)容。在教學中可以要針對不同的內(nèi)容進行不同的設計。比如參數(shù)估計,這部分內(nèi)容看似公式非常多,但仔細分析就會發(fā)現(xiàn),實際上只要記住兩類基本公式就可以了,一類是大樣本,不管總體是不是正態(tài)分布,公式都是一樣的。這時若總體方差已知則直接計算,若總體方差未知就用樣本方差代替總體方差就可以了。另一類是小樣本,這時只有正態(tài)分布可以計算,總體方差已知與第一類公式一樣,如果方差未知則用t分布計算。只要幫學生理清了這兩類公式,每個公式就可以類比記憶,且不容易產(chǎn)生混淆。
在參數(shù)假設檢驗中,公式也比較多,但這些公式與參數(shù)估計中公式的分類是一樣的,只要講清楚參數(shù)估計與假設檢驗的關系,記憶這些公式是不難的。參數(shù)假設檢驗中的難點是原假設與備則假設如何選擇,尤其在單側檢驗中學生經(jīng)常不知該用哪種檢驗,這時最好舉一個例子,不同立場的人,比如說生產(chǎn)者和消費者,分別用不同的假設檢驗,看看對于同一個問題,不同的檢驗各說明了什么樣的問題,這時學生就會根據(jù)自己所要說明的問題進行假設了。非參數(shù)假設檢驗的內(nèi)容比較多也比較雜,這時就要進行內(nèi)容的選取,只選一些經(jīng)濟中經(jīng)常用到的檢驗進行講解就可以了。在講解這些方法時,最好采取案例式教學,先提出問題,引起學生的興趣,然后對每個問題進行分析,介紹每個問題的分析方法,最后用這些方法去解決提出的問題,這樣講可以讓學生主動去思考,效果比先講理論再講應用的效果要好得多。
相關與回歸是兩個相互之間有關聯(lián)又有區(qū)別的內(nèi)容,這部分內(nèi)容也可以采用案例式教學,先提出一個問題,比如給出一組企業(yè)銷售額與利潤額的數(shù)據(jù),讓學生去判斷這二者之間是什么關系,這時學生就會想到去畫圖或用相關系數(shù)去判斷有沒有關系。若有關系,則又提出這一關系到底是什么關系,怎樣去表示,講了表示方法后又問這一表示方法對具有同樣性質(zhì)所有企業(yè)是否適用,也就是怎樣對這一表達式進行檢驗,通過檢驗后又問如何用這一表達式去進行估計和預測,為企業(yè)的決策提供依據(jù)。這樣步步深入,將這部分內(nèi)容一一講解,學生學起來易于理解,印象深刻。
四、相關統(tǒng)計軟件的應用
《應用統(tǒng)計學》是一門分析和解釋數(shù)據(jù)的學科,因此在學習中會遇到大量的數(shù)據(jù),比較繁瑣的計算工式,即使使用計算器也比較麻煩,為學習本課程帶來不便。隨著計算機的發(fā)展,許多統(tǒng)計軟件提供了進行各種統(tǒng)計的工具,因此在講解本課程時,加入統(tǒng)計軟件的應用這一部分是非常必要的,比如Excel、SPSS等軟件。每講解了一類分析和解釋數(shù)據(jù)的理論和方法后,如果計算比較復雜,都安排一部分如何用軟件來解決這些問題,不但可以使計算簡便,學生做起來容易,不再對復雜數(shù)據(jù)感到反感,也可以分析和處理一些以前由于計算限制而不能分析的問題,大大提高學習本課程的效率。但是在講課過程中應注意控制這部分內(nèi)容,相關軟件知識只是學習本課程的工具,只要簡單介紹,讓學生會用就可以了,不應該喧賓奪主。
[關鍵詞] 尿碘; 碘鹽監(jiān)測; 碘缺乏病
[中圖分類號] R599 [文獻標識碼] B [文章編號] 1673-9701(2014)10-0099-03
吳江區(qū)的碘缺乏病在歷史上屬輕度流行區(qū)[1],2000年達到了國家消除碘缺乏病的標準。碘是人體必需的營養(yǎng)元素,如果缺乏會出現(xiàn)甲狀腺功能減退、智力降低等。我們?yōu)榱思訌姷馊狈Σ》乐喂ぷ魅〉玫某尚?,繼續(xù)開展碘缺乏病監(jiān)測。筆者分析本地區(qū)2001~2011年的碘缺乏病監(jiān)測結果,以期更好地了解碘缺乏病的現(xiàn)狀、干預措施落實情況及防治效果,現(xiàn)報道如下。
1 材料與方法
1.1 碘鹽監(jiān)測
本次監(jiān)測中居民戶按方位依據(jù)江蘇省碘鹽監(jiān)測實施方案實行碘鹽定量和半定量監(jiān)測,2001年共監(jiān)測185份,2002~2011年期間每年監(jiān)測288份。2008年起根據(jù)《江蘇省2007年中央轉移支付碘鹽監(jiān)測項目技術方案》要求,開展隨機抽樣監(jiān)測和重點抽樣監(jiān)測。
1.2 調(diào)查評估
按蘇州市第3~第7次碘缺乏病病情調(diào)查實施方案進行調(diào)查評估,監(jiān)測點的選擇采用PPS(按人口比例概率)抽樣法,采用單純隨機法在各個監(jiān)測點內(nèi)抽取一所小學,同樣采用單純隨機抽樣法在每所小學中抽取40名年齡在8~10歲的學生進行包括甲狀腺腫大率和尿碘監(jiān)測等項目在內(nèi)的病情監(jiān)測。
1.3 碘營養(yǎng)監(jiān)測
孕婦和哺乳婦女監(jiān)測的開展按《蘇州市2003年特需人群碘營養(yǎng)監(jiān)測方案》進行,2008~2011年監(jiān)測共35人;學齡兒童和育齡婦女監(jiān)測的開展按《2008年江蘇省碘缺乏病和高碘防治重點地區(qū)綜合監(jiān)測方案》進行,2008~2011年每年選取50名8~10歲學齡兒童進行監(jiān)測,2008~2011年每年監(jiān)測18~40歲育齡婦女50人。
1.4統(tǒng)計學處理
采用SPSS17.0統(tǒng)計軟件對數(shù)據(jù)進行統(tǒng)計學處理,計數(shù)資料采用χ2檢驗,以P
2 結果
2.1 碘鹽監(jiān)測
2.1.1 居民戶碘鹽監(jiān)測 ①半定量監(jiān)測:11年共監(jiān)測居民戶食鹽5641份,有碘鹽份數(shù)5585份,每年有碘率均在97.00%以上,合計有碘率達到99.00%。②定量監(jiān)測:2002年起按方案每年定量調(diào)查288份居民食用鹽,結果見表1。
2.1.2 隨機抽樣監(jiān)測和重點抽樣監(jiān)測 本研究中采用隨機抽樣的方法對2008~2011年居民戶進行碘鹽定量監(jiān)測,結果表明,2008年的碘鹽覆蓋率為99.7%,2009年為99.3%,2010年為100%,2011年為99.7%,四年的碘鹽覆蓋率差異無統(tǒng)計學意義(χ2=0.32,P>0.05);2008~2011年居民戶半定量監(jiān)測(即重點抽樣監(jiān)測)每年300份,2008年有碘率為100%,2009年為98.7%,2010年及2011年均為100%,四年的有碘率差異無統(tǒng)計學意義(χ2=0.17,P>0.05)。2007年以后碘鹽合格率呈上升趨勢,差異有統(tǒng)計學意義(χ2=7.93,P
2.2 病情監(jiān)測
2.2.1 甲狀腺腫大率 2001~2011年共抽查8~10歲學生840名,其中7例調(diào)查對象出現(xiàn)甲狀腺腫大,腫大率為0.83%(7/840),其中2005年的甲狀腺腫大率最高,2007年、2009年出現(xiàn)降低趨勢,差異有統(tǒng)計學意義(χ2=9.05,P
2.2.2 尿碘檢測結果 8~10周歲學生尿碘中位數(shù)均在100 μg/L以上,尿碘濃度
表2 8~10歲學生甲狀腺腫大率和尿碘測定情況
注:*括號內(nèi)的數(shù)據(jù)是占比
2.3 碘營養(yǎng)監(jiān)測
2.3.1 學齡兒童 2008~2011年每年抽取50名8~10歲學齡兒童進行碘營養(yǎng)監(jiān)測,2008年尿碘中位數(shù)為239.5 μg/L,2009年為230.9 μg/L、2010年為168 μg/L、2011年為247 μg/L。
2.3.2 育齡婦女 2008~2011年每年監(jiān)測18~40歲育齡婦女50人,2008年尿碘中位數(shù)為250 μg/L、2009年為203.1 μg/L、2010年為178.5 μg/L,2011年為208 μg/L。尿碘濃度
2.3.3 孕婦和哺乳婦女 2003年監(jiān)測40人,尿碘中位數(shù)為60.35 μg/L。2008~2011年監(jiān)測共35人,尿碘中位數(shù)平均為181.40 μg/L,尿碘濃度
3 討論
合格碘鹽食用率、兒童甲狀腺腫大率及尿碘3項指標是國家消除IDD的評價指標[2]。居民戶碘鹽定量監(jiān)測顯示,從2007年起,合格碘鹽食用率和碘鹽合格率均穩(wěn)定在97%以上,2007年以后碘鹽合格率呈上升趨勢,差異有統(tǒng)計學意義(P
碘缺乏程度及碘營養(yǎng)水平可通過甲狀腺腫大率的高低與尿碘中位數(shù)得到客觀反映,尿碘也是評價碘缺乏病危害和干預措施的重要指標[7]。近11年的監(jiān)測結果表明,該區(qū)8~10周歲兒童甲狀腺腫大率和尿碘水平呈穩(wěn)定態(tài)勢,甲狀腺腫大率平均0.83%,均低于5.00%,其中2005年甲狀腺腫大率最高,2007年、2009年出現(xiàn)降低趨勢,差異有統(tǒng)計學意義(P
[參考文獻]
[1] 梅火根,王伯榮,儲金奎,等. 碘缺乏病輕度流行區(qū)的防治效果分析[J]. 中國地方病防治雜志,2002,17(1):43-45.
[2] 邱占富, 陳小兵. 2005~2009年重慶開縣碘缺乏病監(jiān)測分析[J]. 疾病預防控制通報,2011,26(2):55.
[3] 顏海英,梅火根. 吳江區(qū)居民食用鹽碘含量檢測分析[J]. 江蘇預防醫(yī)學雜志,2011,22(3):53-54.
[4] 黃麗平,曹納新. 嘉善縣2003~2006年碘缺乏病監(jiān)測結果分析[J]. 安徽預防醫(yī)學雜志,2007,13(5):376.
[5] 江國軍. 某地2004~2009年碘缺乏病監(jiān)測結果分析[J]. 上海預防醫(yī)學雜志,2010,22(4):217-218.
[6] 李春毅,何迎峰,陳甫良,等. 2007~2010年無錫區(qū)崇安區(qū)碘鹽監(jiān)測結果分析[J]. 江蘇預防醫(yī)學雜志,2011,22(4):56.
[7] 王培樺,張慶蘭,尚莉,等. 江蘇省食鹽加碘前后人群碘營養(yǎng)狀況變化分析[J]. 江蘇預防醫(yī)學雜志,2010,21(3):21-24.
[8] 陳祖培. 當前碘缺乏病防治應當注意的問題[J]. 中國地方病學雜志,2004,23(3):193-194.