知網 門戶 科學 查看內容

統計

来源:wikitw.club  2016-2-1 19:50

   

統計一詞起源於國情調查,最早意為國情學。一般來說,統計包括三個含義:統計工作、統計資料和統計科學。統計工作、統計資料、統計科學三者之間的關係是:統計工作的成果是統計資料,統計資料和統計科學的基礎是統計工作,統計科學既是統計工作經驗的理論概括,又是指導統計工作的原理、原則和方法。原始的統計工作即人們收集數據的原始形態已經有幾千年的歷史,而它作為一門科學,是從17世紀開始。英語中統計學家和統計員是同一個單詞,但統計學並不是直接產生於統計工作的經驗總結。每一門科學都有其建立、發展和客觀條件,統計科學則是統計工作經驗、社會經濟理論、計量經濟方法融合、提煉、發展而來的一種邊緣性學科。[1]

目錄 1基本釋義

基本概念 外文詞源 三種涵義 2歷史沿革

產生萌芽 發展 3學科分支

4特徵

5三大職能

6分析

7理論淵源

1基本釋義基本概念人類對事物數量的認識形成的定義。漢語中的「統計」有合計、總計的意 統計學

思。指對某一現象有關的數據的搜集、整理、計算、分析、解釋、表述等的活動。

1. 指對某一現象有關的數據的搜集、整理、計算和分析等。例:人口統計

2. 指總括地計算。例:把全國報來的數據統計一下

典故:明胡應麟《少室山房筆叢·經籍會通一》:「古今書籍,統計一代,前後之藏,往往無過十萬;統計一朝,公私之蓄,往往不能十萬。[2]」清宣鼎《夜雨秋燈錄·銀雁》:「 佛奴掘深窖藏之,統計約有二十餘萬。[3]」

外文詞源英語中的「統計」(statistics;count;add up),statistics用作複數名詞時,意思是統計資料,作單數名詞時,指的是統計學。詞源:德語Statistik ,政治學;新拉丁語 statisticus,國事;義大利語statista ,老練的政客;舊義大利語、拉丁語 status ,形勢,政體。[4]

三種涵義在實際應用中,人們對統計一詞的理解一般有三種涵義:統計工作、統

計資料和統計科學:

(1)統計工作。指利用科學的方法搜集、整理和分析和提供關於社會經濟現象數量資料的工作的總稱,是統計的基礎。[5]也稱統計實踐,或統計活動,是在一定統計理論指導下,採用科學的方法,搜集、整理、分析統計資料的一系列活動過程。它是隨著人類社會的發展、治國和管理的需要而產生和發展起來的,至今已有四五千年的歷史。現實生活中,統計工作作為一種認識社會經濟現象總體和自然現象總體的實踐過程,一般包括統計設計、統計調查、統計整理統計分析四個環節。

(2)統計資料。指通過統計工作取得的、用來反映社會經濟現象的數據資料的總稱。[5]統計工作所取得的各項數字資料及有關文字資料,一般反映在統計表統計圖、統計手冊、統計年鑒、統計資料彙編和統計分析報告中。也稱統計信息,是反映一定社會經濟現象總體或自然現象總體的特徵或規律的數字資料、文字資料、圖表資料及其他相關資料的總稱。包括剛剛調查取得的原始資料和經過一定程度整理、加工的次級資料,其形式有:統計表、統計圖、統計年鑒、統計公報、統計報告和其他有關統計信息的載體。

(3)統計科學。也稱統計學,是統計工作經驗的總結和理論概括,是系統化的知識體系。指研究如何搜集、整理和分析統計資料的理論與方法。統計學是應用數學的一個分支,主要通過利用概率建立數學模型,收集所觀察系統的數據,進行量化的分析、總結,並進而進行推斷和預測,為相關決策提供依據和參考。它被廣泛的應用在各門學科之上,從物理和社會科學到人文科學,甚至被用來工商業及政府的情報決策之上。

統計學主要又分為描述統計學和推斷統計學。給定一組數據,統計學可以摘要並且描述這份數據,這個用法稱作為描述統計學。另外,觀察者以數據的形態建立出一個用以解釋其隨機性和不確定性的數學模型,以之來推論研究中的步驟及母體,這種用法被稱做推論統計學。這兩種用法都可以被稱作為應用統計學。另外也有一個叫做數理統計學的學科專門用來討論這門科目背後的理論基礎。

總體來說,「統計」一詞的三方面涵義是緊密聯繫的,統計資料是統計工作的成果,統計工作與統計科學之間是實踐與理論的關係。[6]

計算方法

均值、中位數、眾數、正態分佈、抽樣、標準差、概率論、檢驗、方差分析、卡方檢驗

2歷史沿革產生萌芽夏禹時代(公元前22世紀)分為九州,有人口約1352萬,可見人口統計的久遠。《書經·禹貢篇》記述了九州的基本土地情況,被西方經濟學家推崇為「統計學最早的萌芽」。西周建立了較為系統的統計報告制度。秦時《商君書》中提出「強國知十三數」,其中包括糧食儲備、各國人數、農業生產資料及自然資源等等。

公元前27世紀,埃及為了建造金字塔和大型農業灌溉系統,曾進行過全國人口和財產調查。公元前15世紀,猶太人為了戰爭的需要進行了男丁的調查。

公元前約6世紀,羅馬帝國規定每5年進行一次人口、土地、牲畜和家奴的調查,並以財產總額作為劃分貧富等級和征丁課稅的依據。

15至18世紀,歐洲出現了許多以報導國情為內容的統計著作。[7]

在19世紀30年代后,出現了所謂「統計狂熱時代」。

十七世紀,在英格蘭居住的人們開始對「政治算術」產生興趣。1662年,John Graunt發表了《natural and politics observations upon the bills of mortality》,分析了生男孩和女孩的比例,發展了保險公司所用的那種類型的死亡率表。

英文的statistics約在十八世紀中葉由德國學者Gottfried Achenwall所創造,是由狀態status和德文的政治算術聯合推導得出的,第一次由John Sinclair所使用,即1797年出現在Encyclopaedia Britannica。(早期還有一個單詞publicitics和statistics競爭「統計」這一含義,就開始流行publicitical learning)。

發展近代統計學指的是18世紀末到19世紀末的描述統計學,其發展過程與概率論的廣泛研究和應用密切相關,在統計分析中經常使用的一些基本方法和術語都始於這一個時期,例:最小平方法、正態分佈曲線、誤差計算等。

在近代統計發展的一百年中,也形成了許多學派,其中以數理統計學派和社會統計學派最為著名。數理統計學派的原創始人是比利時的A·凱特靳,其最大的貢獻就是將法國古典概率引入統計學,用純數學的方法對社會現象進行研究;社會統計學派的首倡者是德國的K·克尼斯,他認為統計研究的對象是社會現象,研究方法為大量觀察法。在近代統計學的發展過程中,這兩學派的矛盾是比較大的。[8]

1. 概述

統計學的英文statistics最早是源於現代拉丁文statisticum collegium (國會)以及義大利文 statista (國民或政治家)。德文Statistik,最早是由Gottfried Achenwall(1749)所使用,代表對國家的資料進行分析的學問,也就是「研究國家的科學」。在十九世紀統計學在廣泛的數據以及資料中探究其意義,並且由John Sinclair引進到英語世界。

統計學是一門很古老的科學,一般認為其學理研究始於古希臘的亞里斯多德時代,迄今已有兩千三百多年的歷史。它起源於研究社會經濟問題,在兩千多年的發展過程中,統計學至少經歷了「城邦政情」,「政治算數」和「統計分析科學」三個發展階段。所謂「數理統計」並非獨立於統計學的新學科,確切地說它是統計學在第三個發展階段所形成的所有收集和分析數據的新方法的一個綜合性名詞。概率論是數理統計方法的理論基礎,但是它不屬於統計學的範疇,而屬於數學的範疇。[9]

2. 三個階段

1.第一階段稱之為「城邦政情」(Matters of state)階段

「城邦政情」階段始於古希臘的亞里斯多德撰寫「城邦政情」或「城邦紀要」。「城邦政情」式的統計研究延續了一兩千年,直至十七世紀中葉才逐漸被「政治算數」這個名詞所替代,並且很快被演化為「統計學」(Statistics)。統計學依然保留了城邦(state)這個詞根。

2.第二階段稱之為「政治算數」(Politcal arthmetic)階段

與「城邦政情」階段沒有很明顯的分界點,本質的差別很小。「政治算數」的特點是統計方法與數學計算和推理方法開始結合。分析社會經濟問題的方式更加註重運用定量分析方法。

1690年英國威廉·配弟出版(政治算數)一書作為這個階段的起始標誌。

威廉·配弟用數字,重量和尺度將社會經濟現象數量化的方法是近代統計學的重要特徵。因此,威廉·配弟的(政治算數)被後來的學者評價為近代統計學的來源,威廉·配弟本人也被評價為近代統計學之父。配弟在書中使用的數字有三類:第一類是對社會經濟現象進行統計調查和經驗觀察得到的數字。第二類是運用某種數學方法推算出來的數字。第三類是為了進行理論性推理而採用的例示性的數字。

3.第三階段稱之為「統計分析科學」(Science of statistical analysis)階段

在「政治算數」階段出現的統計與數學的結合趨勢逐漸發展形成了「統計分析科學」。

十九世紀末,歐洲大學開設的「國情紀要」或「政治算數」等課程名稱逐漸消失,代之而起的是「統計分析科學」課程.當時的「統計分析科學」課程的內容仍然是分析研究社會經濟問題。

「統計分析科學」課程的出現是現代統計發展階段的開端,1908年,「學生」氏(William Sleey Gosset的筆名Student)發表了關於t分佈的論文。它創立了小樣本代替大樣本的方法,開創了統計學的新紀元。

現代統計學的代表人物首推比利時統計學家奎特萊(Adolphe Quelet),他將統計分析科學廣泛應用於社會科學,自然科學和工程技術科學領域。

現代統計學的理論基礎概率論始於研究賭博的機遇問題,大約開始於1477年。數學家為了解釋支配機遇的一般法則進行了長期的研究,逐漸形成了概率論理論框架。在概率論進一步發展的基礎上,到十九世紀初,數學家們逐漸建立了觀察誤差理論,正態分佈理論和最小平方法則。於是,現代統計方法便有了比較堅實的理論基礎。

3.不同學派

一、18-19世紀——統計學的創立和發展

德國的斯勒茲曾說過:「統計是動態的歷史,歷史是靜態的統計。」可見統計學的產生與發展是和生產的發展、社會的進步緊密相聯的。[10]

(1)統計學的創立時期

統計學的萌芽產生在歐洲。17世紀中葉至18世紀中葉是統計學的創立時期。在這一時期,統計學理論初步形成了一定的學術派別,主要有國勢學派和政治算術學派。

1、國勢學派

國勢學派又稱記述學派,產生於17世紀的德國。由於該學派主要以文字記述國家的顯著事項,故稱記述學派。其主要代表人物是海爾曼·康令和阿亨華爾。康令第一個在德國黑爾姆斯太特大學以「國勢學」為題講授政治活動家應具備的知識。阿亨華爾在格丁根大學開設「國家學」課程,其主要著作是《近代歐洲各國國勢學綱要。因在外文中「國勢」與「統計」詞義相通,後來正式命名為「統計學」。該學派在進行國勢比較分析中,偏重事物性質的解釋,而不注重數量對比和數量計算,但卻為統計學的發展奠定了經濟理論基礎。但隨著資本主義市場經濟的發展,對事物量的計算和分析顯得越來越重要,該學派後來發生了分裂,分化為圖表學派和比較學派。

2、政治算術學派

政治算術學派產生於19世紀中葉的英國,創始人是威廉·配第(1623-1687),其代表作是他于1676年完成的《政治算術》一書,為統計學的形成和發展奠定了方法論基礎。因此馬克思說:「威廉·佩第——政治經濟學之父,在某種程度上也是統計學的創始人。」

政治算術學派的另一個代表人物是約翰·格朗特(1620-1674)。他以1604年倫敦教會每周一次發表的「死亡公報」為研究資料,在1662年發表了《關於死亡公報的自然和政治觀察》的論著。書中分析了60年來倫敦居民死亡的原因及人口變動的關係,首次提出通過大量觀察,可以發現新生兒性別比例具有穩定性和不同死因的比例等人口規律;並且第一次編製了「生命表」,對死亡率與人口壽命作了分析,從而引起了普遍的關注。

(2)統計學的發展時期

18世紀末至19世紀末是統計學的發展時期。在這時期,各種學派的學術觀點已經形成,並且形成了兩主要學派,即數理統計學派和社會統計學派。

1、數理統計學派

在18世紀,由於概率理論日益成熟,為統計學的發展奠定了基礎。19世紀中葉,把概率論引進統計學而形成數理學派。其奠基人是比利時的阿道夫·凱特勒(1796-1874),其主要著作有:《論人類》、《概率論書簡》、《社會制度》和《社會物理學》等。他主張用研究自然科學的方法研究社會現象,正式把古典概率論引進統計學,使統計學進入一個新的發展階段。他把概率論引入統計學,使統計學在「政治算術」所建立的「算術」方法的基礎上,促進了統計的精確化。

2、社會統計學派

社會統計學派產生於19世紀後半葉,創始人是德國經濟學家、統計學家克尼斯(1821-1889),主要代表人物主要有恩格爾(1821- 1896)、梅爾(1841-1925)等人。他們融合了國勢學派與政治算術學派的觀點,沿著凱特勒的「基本統計理論」向前發展,但在學科性質上認為統計學是一門社會科學,是研究社會現象變動原因和規律性的實質性科學,以此同數理統計學派通用方法相對立。社會統計學派在研究對象上認為統計學是研究體而不是個別現象,而且認為由於社會現象的複雜性和整體性,必須地總體進行大量觀察和分析,研究其內在聯繫,才能揭示現象內在規律。這是社會統計學派的「實質性科學」的顯著特點。

社會經濟的發展,要求統計學提供更多的統計方法;社會科學本身也不斷地向細分化和定量化發展,也要求統計學能提供更有效的調查整理、分析資料的方法。因此,社會統計學派也日益重視方法論的研究,出現了從實質性方法論轉化的趨勢。但是,社會統計學派仍然強調在統計研究中必須以事物的質為前提和認識事物質的重要性,這同數理統計學派的計量不計質的方法論性質是有本質區別的。

二、20世紀——迅速發展的統計學

20世紀初以來,科學技術迅猛發展,社會發生了巨大變化,統計學進入了快速發展時期。歸納起來有以下幾個方面。[11]

1、由記述統計向推斷統計發展。記述統計是對所搜集的大量數據資料進行加工整理、綜合概括,通過圖示、列表和數字,編製次數分佈表、繪製直方圖、計算各種特徵數等,對資料進行分析和描述。而推斷統計,則是在搜集、整理觀測的樣本數據基礎上,對有關總體作出推斷。其特點是根據帶隨機性的觀測樣本數據以及問題的條件和假定(模型),而對未知事物作出的,以概率形式表述的推斷。西方國家所指的科學統計方法,主要就是指推斷統計來說的。

2、由社會、經濟統計向多分支學科發展。在20世紀以前,統計學的領域主要是人口統計、生命統計、社會統計和經濟統計。隨著社會、經濟和科學技術的發展,統計的範疇已覆蓋了社會生活的領域,成為通用的方法論科學。它被廣泛用於研究社會和自然界的各個方面,並發展成為有著許多分支學科的科學。

3、統計預測和決策科學的發展。傳統的統計是對已經發生和正在發生的事物進行統計,提供統計資料和數據。20世紀30年代以來,特別是第二次世界大戰以來,由於經濟、社會、軍事等方面的客觀需要,統計預測和統計決策科學有了進一步發展。

4、資訊理論、控制論、系統論與統計學的相互滲透和結合,使統計科學進一步得到發展和日趨完善。資訊理論、控制論、系統論在許多基本概念、基本思想、基本方法等方面有著共同之處,三者從不同角度、側面提出了解決共同問題的方法和原則。三論的創立和發展,改變了世界的科學圖景和科學家的思維方式,也使統計科學和統計工作出現了新的發展趨勢。

5、計算技術和一系列新技術、新方法在統計領域不斷得到開發和應用。伴隨著電腦技術的不斷發展,使統計數據的搜集、處理、分析、存貯、傳遞、印製等過程日益現代化,提高了統計工作的效能。電腦技術的發展,日益擴大了傳統的和先進的統計技術的應用領域,促使統計科學和統計工作發生了革命性的變化。而今,電腦科學已經成為統計科學不可分割組成部分。隨著科學技術的發展,統計理論和實踐深度和廣度方面也在不斷發展。

6.統計在現代化管理和社會生活中的地位日益重要。英國統計學家哈斯利特說:「統計方法在生活和習慣中的應用是這樣普遍,應當重視統計的作用。」,後來,甚至有的科學有還叫做「統計時代」。[7]

4. 統計學現狀

伴隨著科學技術的飛速發展,通過吸收和融合相關學科的新理論,開發應用新技術和新方法,深化和豐富統計學傳統領域的理論與方法,統計學拓展了新的領域。在國家,社會主義市場經濟體制的逐步建立,實踐發展的需要對統計學提出了新的更多要求。隨著社會主義市場經濟的成長和不斷完善,統計學的潛在功能將得到更進一步的開掘。

第一,對系統性及系統複雜性的認識為統計學的未來發展增加了新的思路。隨著科學融合趨勢的興起,統計學的研究觸角已經向新的領域延伸,開始探索性數據的統計方法的研究。研究的領域向複雜客觀現象擴展。21世紀統計學研究的重點將由確定性現象和隨機現象轉移到對複雜現象的研究,向模糊現象、突變現象及混沌現象等領域拓展。

第二,定性與定量相結合的綜合集成法將為統計分析方法的發展提供新的思想。定性與定量相結合的綜合集成方法是錢學森教授于1990年提出的。這一方法的實質就是將科學理論、經驗知識和專家判斷相結合,提出經驗性的假設,再用經驗數據和資料以及模型對它的確實性進行檢測,經過定量計算及反覆對比,最後形成結論。

第三,統計科學與其他科學滲透將為統計學的應用開闢新的領域。模糊論、突變論及其他新的邊緣學科的出現為統計學的進一步發展提供了新的科學方法和思想。將一些尖端科學成果引入統計學,使統計學與其交互發展將成為統計學發展的趨勢。已經有一些學者開始將控制論、資訊理論、系統論以及圖論、混沌理論、模糊理論等方法和理論引入統計學。

統計學產生於應用,在應用過程中發展壯大。隨著經濟社會的發展、各學科相互融合趨勢的發展和電腦技術的迅速發展,統計學的應用領域、統計理論與分析方法也將不斷發展。[12]

3學科分支一些學科大量地利用了應用統計學,以至它們自己已經各自獨立成為一門學科。

1.統計學的分支學科有:

統計學史

宏觀經濟統計學

文化與體育統計學

社會福利與社會保障統計學

環境統計學

理論統計學

微觀經濟統計學

衛生統計學

自然資源統計學

國際比較統計學

統計調查分析理論

管理統計學

司法統計學

國際統計學

國際標準分類統計學

統計監督理論

科學技術統計學

生活質量統計學

國際核算體系與方法論體系

國際標準分類統計學

統計預測理論

描述統計學

環境與生態統計學

社會統計學

生態平衡統計學

統計邏輯學

經濟統計學

統計學

教育統計學

工程統計學

水文統計學

水文統計學

社會經濟統計學

生物統計學

心理統計學

統計物理學

統計語言學

化學統計學

數理統計學

化學統計學

推斷統計學

農村經濟調查

生活質量統計學

商務統計學

檔案統計學

生活質量統計學

人口統計學

統計法學

2.延伸學科

有些科學廣泛的應用統計的方法使得他們擁有各自的統計術語,這些學科包括:

人口統計

資料採礦(應用統計學以及圖形從資料中獲取知識)

電機統計

化學與程序分析(所有有關化學的資料分析與化工科學)

經濟統計學

生物統計

統計物理學

社會統計(包括所有的社會科學﹚

商用統計

農業科學

心理統計學

文獻統計分析

教育統計學

運動統計學,特別是棒球以及曲棍球

統計對於商業以及工業是一個基本的關鍵,被用來了解與測量系統變異性,程序控制,對資料作出結論,並且完成資料取向的決策。

4特徵數量性

社會經濟統計的認識對象是社會經濟現象的數量方面,包括現象的數量表現、現象之間的數量關係和質量互變的數量界限。

總體性

社會經濟統計的認識對象是社會經濟現象的總體的數量方面。國民經濟總體的數量方面、社會總體的數量方面、地區國民經濟和社會總體的數量方面、各企事業單位總體數量方面等等。

具體性

社會經濟統計的認識對象是具體事物的數量方面,而不是抽象的量。這是統計與數學的區別。[13]

社會性

社會經濟現象是人類有意識的社會活動,是人類社會活動的條件、過程和結果,社會經濟統計以社會經濟現象作為研究對象,具有明顯的社會性。

5三大職能統計要達到認識社會的目的,不僅需要科學的方法,而且需要強有力的組織領導。因此統計兼有信息、咨詢、監督三種職能。

信息職能

是統計部門根據科學的統計指標體系和統計調查方法,靈敏、系統的採集、處理、傳輸、貯存和提供大量的以數據描述為基本特徵的社會經濟信息。

咨詢職能

指利用已經掌握的豐富的統計信息資源,運用科學的分析方法和先進的技術手段,深入開展綜合分析和專題研究,為科學決策和管理提供各種可供選擇的咨詢建議與對策方案。

監督職能

指根據統計調查和分析,及時、準確地從總體上反映經濟、社會和科技的運行狀態,並對其實行全面、系統的定量檢查、監測和預警,以促使國民經濟按照客觀規律的要求,持續、穩定、協調地發展。

這三種職能是相互聯繫、相輔相成的。統計信息職能是保證咨詢和監督職能有效發揮的基礎;統計咨詢職能是統計薪資職能的延續和深化;而統計監督職能則是信息、咨詢職能基礎上進一步拓展並促進統計信息和咨詢職能的優化。[6]

6分析1)測量的尺度

統計學一共有四種測量的尺度或是四種測量的方式。這四種測量(名目,順序,等距,等比)在統計過程中具有不等的實用性。等比尺度(Ratio measurements)擁有零值及資料間的距離是相等被定義的,等距尺度(Interval measurements)資料間的距離是相等被定義的但是它的零值並非絕對的無而是自行定義的(智力或溫度的測量)。(Ordinal measurements)順序尺度的意義並非表現在其值而是在其順序之上。名目尺度(Nominal measurements)的測量值則不具量的意義。

2)統計技術

以下列出一些有名的統計檢定方法以及可供驗證實驗數據的程序

費雪最小顯著差異法(Fisher's Least Significant Difference test )

學生t檢驗(Student's t-test)

曼-惠特尼 U 檢定(Mann-Whitney U)

回歸分析(regression analysis)

相關性(correlation)

皮爾森積矩相關係數(Pearson product-moment correlation coefficient)

史匹曼等級相關係數(Spearman's rank correlation coefficient )

卡方分配(chi-square )

3)分析方法總結

1.1連續性資料的兩組獨立樣本比較

1.1.1 資料符合正態分佈,且兩組方差齊性,直接採用t檢驗。

1.1.2 資料不符合正態分佈,(1)可進行數據轉換,對數轉換等,使之服從正態分佈,然後對轉換后的數據採用t檢驗;(2)採用非參數檢驗,Wilcoxon檢驗。

1.1.3 資料方差不齊,(1)採用Satterthwate 的t』檢驗;(2)採用非參數檢驗,Wilcoxon檢驗。

1.2兩組配對樣本的比較

1.2.1 兩組差值服從正態分佈,採用配對t檢驗。

1.2.2 兩組差值不服從正態分佈,採用wilcoxon的符號配對秩和檢驗。

1.3多組完全隨機樣本比較

1.3.1資料符合正態分佈,且各組方差齊性,直接採用完全隨機的方差分析。檢驗結果首先有統計學意義,進一步作兩兩比較,兩兩比較的方法有LSD檢驗,Bonferroni法,tukey法,Scheffe法,SNK法等。

1.3.2資料不符合正態分佈,或各組方差不齊,則採用非參數檢驗的Kruscal-Wallis法。檢驗結果首先有統計學意義,採用Bonferroni法校正P,然後用成組的Wilcoxon檢驗。

1.4多組隨機區組樣本比較

1.4.1資料符合正態分佈,且各組方差齊性,直接採用隨機區組的方差分析。檢驗結果如果有統計學意義,進一步作兩兩那麼比較。

1.4.2資料不符合正態分佈,或各組方差不齊,則採用非參數檢驗的Fridman檢驗法。檢驗結果為有統計學意義,那麼進一步作兩兩比較,一般採用Bonferroni法校正P值,然後用符號配對的Wilcoxon檢驗。

1.5需要注意的問題

(1) 一般來說是大樣本,各組例數大於50,可以不作正態性檢驗,直接採用t檢驗或方差分析。因為統計學上有中心極限定理,假定大樣本是服從正態分佈的。

(2)當進行多組比較時,最容易犯的錯誤是僅比較其中的兩組,而不顧其他組,這樣作容易XX犯假陽性錯誤的概率。正確的做法應該是,先作總的各組間的比較,總的來說差別有統計學意義,然後才能作其中任意兩組的比較,這些兩兩比較有特定的統計方法,上面提到的LSD檢驗,Bonferroni法,tukey法,Scheffe法,SNK法等。絕不能對其中的兩組直接採用t檢驗,這樣即使得出結果也未必正確。

(3)關於常用的設計方法:多組資料儘管最終分析都是採用方差分析,但不同設計會有差別。常用的設計完全隨即設計,隨機區組設計,析因設計,裂區設計,嵌套設計等。[11]

7理論淵源1.正態曲線

1733年,德-莫佛(De Moivre)在給友人分發的一篇文章中給出了正態曲線1783年,拉普拉斯建議正態曲線方程適合於表示誤差分佈的概率。

1809年,高斯發表了他的關於天體運行論的偉大著作,在這一著作的第二卷第三節中,他導出正態曲線適宜於表示誤差規律,同時承認拉普拉斯較早的推導。

正態分佈在十九世紀前葉因高斯的工作而加以推廣,所以通常稱作高斯分佈。卡爾-皮爾遜指出德-莫佛是正態曲線的創始人,第一個稱它為正態分佈,但人們仍習慣稱之高斯分佈。

2.最小二乘法

1805年,Legendre提出最小二乘法,Gauss聲稱自己在1794年用過,並在1809年基於誤差的高斯分佈假設,給出了嚴格推導。

3.總體和樣本

在早期文獻中可找到由某個總體中抽樣的明確例子,然而從總體中只能取得樣本的認識常常是缺乏的。 ----K.皮爾遜時代

到十九世紀末,對樣本和總體的區別已普遍知道,然而這種區分並不一定總被堅持。----1910年Yule在自己的教科書中指出。

在 1900年代的早期,區分變的更清楚,並在1922年被Fisher特彆強調。----Fisher在1922年發表的論文《On the mathematical foundation of theoretical statistics》,說明了總體和樣本的聯繫和區別,以及其他概念,奠定了「理論統計學」的基礎。

4.期望、標準差和方差

期望是一個比概率更原始的概念,在十七世紀帕斯卡和費馬時代,期望概念已被公認了。K.皮爾遜最早定義了標準差的概念。1918年,Fisher引入方差的概念。[14]

力學中的矩和統計學中的中數兩者之間的相似性已被概率領域的早期工作者注意到,而K.皮爾遜在1893年第一次在統計意義下使用「矩」。

5.卡方統計量

卡方統計量,是卡-皮爾遜提出用於檢驗已知數據是否來自某一特定的隨機模型,或已知數據是否與已給定的假設一致。卡方檢驗被譽為自1900年以來在科學技術所有分支中20個尖端發明之一,甚至敵人Fisher都對此有極高評價。

6.矩估計與最大似然

卡-皮爾遜提出了使用矩來估計參數的方法。

Fisher則在1912年到1922年間提出了最大似然估計方法,基於直覺,提出了估計的一致性、有效性和充分性的概念。

7.概率的公理化

1933年,前蘇聯數學家柯爾莫格洛夫(Kolmogorov)發表了《概率論的基本概念》,奠定了概率論的嚴格數學基礎。

8.貝葉斯定理

貝葉斯對統計學幾乎沒有什麼貢獻,然而貝葉斯的一篇文章成為貝葉斯學派統計學的思想模式的焦點,這一篇文章發表于1763年,由貝葉斯的朋友、著名人壽保險原理的開拓者Richard Price在貝葉斯死後提出來的----貝葉斯定理。[15]

概率思想的兩種方法,(1)作為一個物理系統內在的一種物理特性,(2)對某一陳述相信程度的度量。 在1950年代後期止,多數統計學家採取第一種觀點,即概率的相對頻數解釋,這一時期貝葉斯定理僅應用在概率能在頻數框架內解釋的場合。

9.其他

在十九世紀中葉,三個不同領域產生的重要發展都是基於隨機性是自然界固有的這個前提上的。

阿道夫·凱特萊特(A. Quetlet,1869)利用概率性的概念來描述社會學和生物學現象孟德(G.Mendel,1870)通過簡單的隨機性結構公式化了他的遺傳法則。

玻爾茲曼(Boltzmann,1866)對理論物理中最重要的基本命題之一的熱力學第二定律給出了一個統計學的解釋。

1859 年,達爾文發表了《物種起源》,達爾文的表兄弟高爾登爵士開始利用概率工具分析生物現象,對生物計量學的基礎做出了重要貢獻(可以稱他為生物信息學之父),高爾登爵士是第一個使用相關和回歸這兩個重要概念的人,他還是中位數和百分位數這種概念的創始人。

受高爾登工作影響,在倫敦的大學學院工作的卡爾-皮爾遜開始把數學和概率論應用於達爾文進化論,從而開創了現代統計時代,贏得了統計之父的稱號,1901年Biometrika第一期出版(卡-皮爾遜是創始人之一)。

參考資料 1. 統計小知識 .中華人民共和國國家統計局 .2002-04-01 [引用日期2013-08-13] .

2. 陳曉霞:統計——「戰鬥」的秘密武器 .中華人民共和國國家統計局 .2011-01-14 [引用日期2013-08-13] .

3. 一集卷一 銀雁 .中國古籍全錄 [引用日期2013-08-13] .

4. 第四單元:統計 .西南師範大學出版社 [引用日期2013-08-13] .

5. 《統計基礎知識與統計實務》電子版教材 .三台縣統計局 .2013-05-27 [引用日期2013-08-13] .

6. 羅洪群 .新編統計學 :清華大學出版社 ,2009 .

7. 符啟勛 .實用統計學 :國防工業出版社 ,2008 .

8. 谷建光, 張為華,王中偉,解紅雨.一種基於劃分聚類和模糊神經網路的機器學習方法[J].《系統模擬學報》 2007.23

9. 關於統計學的性質與發展問題 .中華人民共和國國家統計局 [引用日期2013-08-13] .

10. 統計學歷史中的學派 .上海統計 [引用日期2013-08-13] .

11. 馮國生,呂振通,胡博 .SPSS統計分析與應用 :機械工業出版社 ,2011年 .

12. 賈麗艷,杜強 .SPSS統計分析標準教程 :人民郵電出版社 ,2010年 .

13. 統計學知識點匯總 .鄂爾多斯市統計局 .2011-12-01 [引用日期2013-08-13] .

14. 「統計」一詞的由來 .雲浮市統計局 .2012-06-29 [引用日期2013-08-13] .

15. 統計學發展史 .江西省統計局 .2010-09-17 [引用日期2013-08-13] .

相關文獻統計數列的誤差修正演算法-電腦編程技巧與維護-2011年 第1期

利用VB編寫轉換明細表樣式和拆分成品統計零件數量宏程序-電腦編程技巧與維護-2011年 第1期

流固耦合系統計算方法及應用軟體概述-廣州化工-2011年 第1期

>> 查看更多相關文獻

詞條標籤:

數學數據數據分析計算製造術語火炬計劃物理化學科學經濟專業術語經濟概念自然科學 spss

如果想提出功能問題或意見建議,請到意見反饋;如果您要 舉報侵權或違法信息,請到投訴中心;其他問題請訪問百度百科吧

統計

詞條統計

瀏覽次數:次

編輯次數:72次 歷史版本

最近更新:2013-08-13

創建者:lgltc

詞條貢獻榜 辛勤貢獻者:

雨傷寒

lovexuying1314

guanshanyuede

wyfbj

chufengshiyi

百科ROBOT

sanny870826

聖才財會學習網

yxiangmind

展開

© 2013 Baidu 使用百度前必讀 | 百科協議 | 百度百科合作平台

參考資料

1基本釋義1.1基本概念1.2外文詞源1.3三種涵義2歷史沿革2.1產生萌芽2.2發展3學科分支4特徵5三大職能6分析7理論淵源

登錄

查看我的收藏

1基本釋義基本概念人類對事物數量的認識形成的定義。漢語中的「統計」有合計、總計的意 統計學

思。指對某一現象有關的數據的搜集、整理、計算、分析、解釋、表述等的活動。

1. 指對某一現象有關的數據的搜集、整理、計算和分析等。例:人口統計

2. 指總括地計算。例:把全國報來的數據統計一下

典故:明胡應麟《少室山房筆叢·經籍會通一》:「古今書籍,統計一代,前後之藏,往往無過十萬;統計一朝,公私之蓄,往往不能十萬。[2]」清宣鼎《夜雨秋燈錄·銀雁》:「 佛奴掘深窖藏之,統計約有二十餘萬。[3]」

外文詞源英語中的「統計」(statistics;count;add up),statistics用作複數名詞時,意思是統計資料,作單數名詞時,指的是統計學。詞源:德語Statistik ,政治學;新拉丁語 statisticus,國事;義大利語statista ,老練的政客;舊義大利語、拉丁語 status ,形勢,政體。[4]

三種涵義在實際應用中,人們對統計一詞的理解一般有三種涵義:統計工作、統

計資料和統計科學:

(1)統計工作。指利用科學的方法搜集、整理和分析和提供關於社會經濟現象數量資料的工作的總稱,是統計的基礎。[5]也稱統計實踐,或統計活動,是在一定統計理論指導下,採用科學的方法,搜集、整理、分析統計資料的一系列活動過程。它是隨著人類社會的發展、治國和管理的需要而產生和發展起來的,至今已有四五千年的歷史。現實生活中,統計工作作為一種認識社會經濟現象總體和自然現象總體的實踐過程,一般包括統計設計、統計調查、統計整理和統計分析四個環節。

(2)統計資料。指通過統計工作取得的、用來反映社會經濟現象的數據資料的總稱。[5]統計工作所取得的各項數字資料及有關文字資料,一般反映在統計表、統計圖、統計手冊、統計年鑒、統計資料彙編和統計分析報告中。也稱統計信息,是反映一定社會經濟現象總體或自然現象總體的特徵或規律的數字資料、文字資料、圖表資料及其他相關資料的總稱。包括剛剛調查取得的原始資料和經過一定程度整理、加工的次級資料,其形式有:統計表、統計圖、統計年鑒、統計公報、統計報告和其他有關統計信息的載體。

(3)統計科學。也稱統計學,是統計工作經驗的總結和理論概括,是系統化的知識體系。指研究如何搜集、整理和分析統計資料的理論與方法。統計學是應用數學的一個分支,主要通過利用概率論建立數學模型,收集所觀察系統的數據,進行量化的分析、總結,並進而進行推斷和預測,為相關決策提供依據和參考。它被廣泛的應用在各門學科之上,從物理和社會科學到人文科學,甚至被用來工商業及政府的情報決策之上。

統計學主要又分為描述統計學和推斷統計學。給定一組數據,統計學可以摘要並且描述這份數據,這個用法稱作為描述統計學。另外,觀察者以數據的形態建立

推薦閱讀