本文接上篇:ArcGIS空間統計—Moran’s莫蘭指數(上)
概述:
根據要素位置和屬性值使用 Global Moran’s I 統計量測量空間自相關性。提出者為澳大利亞統計學家帕特里克·阿爾弗雷德·皮爾斯·莫蘭(Patrick Alfred Pierce Moran)。
Moran PAP. The interpretation of statistical maps[J]. Journal of the Royal Statistical Society B , 1948,(37):243-251.
詳細概述:
空間自相關 (Global Moran’s I)工具同時根據要素位置和要素值來度量空間自相關。在給定一組要素及相關屬性的情況下,該工具評估所表達的模式是聚類模式、離散模式還是隨機模式。該工具通過計算 Moran’s I指數值、z得分和p值來對該指數的顯著性進行評估。p值是根據已知分布的曲線得出的面積近似值(受檢驗統計量限制)。
公式:
上次我們將了莫蘭指數的參數該如何選擇,以及每一個指數的含義解釋,想必大家都已經知道了莫蘭指數選擇的參數其實最重要的就一個,也就是空間關系的概念化,那么這次我們來講莫蘭指數的結果如何進行解釋。
上圖是莫蘭指數返回給我們的這張圖表,其實也就是全部的莫蘭指數結果,首先在左上角是最重要的三個指數,莫蘭指數、z得分以及p值。
首先我們要看的其實是z得分以及p值,莫蘭指數放在最后看:
p值,p-value,,probability,表示概率。對于模式分析工具來說,p值表示所觀測到的空間模式是由某一隨機過程創建而成的概率。當p很小時,意味著所觀測到的空間模式不太可能產生于隨機過程(小概率事件),因此您可以拒絕零假設。您可能會問這樣的問題:要小到什么程度才算足夠???這是一個非常好的問題。
z得分,z-score,表示標準差的倍數。例如,如果工具返回的z得分為+2.5,我們就會說,結果是2.5倍標準差。如下所示,z得分和p值都與標準正態分布相關聯。
觀察上圖,其實也就是說,上圖曲線下方是隨機分布的正態分布概率圖,如果P值小于0.01,可以發現也就是隨機分布的可能性落在了最左邊藍色或者最右邊紅色的區域內,但是這個可能性是0.01,即1%,也就是說,我們觀察的空間模式是隨機分布的可能性為1%,也就是有99%的可能性為不是隨機分布,有可能是聚類或者離散模式,但是這另說。在統計意義上來講,也就是說在99%的置信度上拒絕原假設,即有99%的把握認為原假設(隨機分布)是不可能的。若0.05,也就是說在95%的置信度上拒絕原假設,即有95%的把握認為原假設(隨機分布)是不可能的。
1、Z值與P值有何用?
大多數統計檢驗在開始時都首先確定一個零假設。模式分析工具的零假設是完全空間隨機性 (CSR),它或者是要素本身的完全空間隨機性,或者是與這些要素關聯的值的完全空間隨機性。
模式分析工具所返回的 z 得分和 p 值可幫助您判斷是否可以拒絕零假設。通常,您將運行其中一種模式分析工具,并希望 z 得分和 p 值表明可以拒絕零假設,這就意味著:您的要素(或與要素關聯的值)表現出統計意義上的顯著性聚類或離散模式,而不是隨機模式。
如果您在景觀分布(或空間數據)中發現了空間結構(如聚類),就證明某些基礎空間過程在發揮作用,而這方面通常正是地理學者或 GIS 分析人員所最為關注的。
2、置信度
z 得分(標準差)
p 值(概率)
置信度
< -1.65 或 > +1.65
< 0.10
90%
< -1.96 或 > +1.96
< 0.05
95%
< -2.58 或 > +2.58
< 0.01
99%
置信度為 95% 時,z 得分的臨界值為 -1.96 和 +1.96 倍標準差。如果此時,與其關聯的未經校正的 p 值為 0.05,但z 值在 -1.96 和 +1.96 之間,則未經校正的 p 值將大于 0.05,因而不能拒絕零假設,因為所表現出的模式很可能是隨機空間過程產生的結果。如果 z 得分在該范圍之外(例如,-2.5 或 +5.4 倍標準差),則所觀測到的空間模式可能過于罕見,不可能是隨機過程產生的結果,而且 p 值很小也可以反映出這一點。在這種情況下,可以拒絕零假設,并著手找出是什么可能導致您的數據出現具有統計顯著性的空間結構。
這里的一個關鍵概念是,正態分布中間位置的值(例如,類似 0.19 或 -1.2 的 z 得分)代表了預期的結果。但在 z 得分的絕對值很大而概率很小時(即出現在正態分布的兩端),您就會查看其中存在的不尋?,F象并且這也非常有趣。例如,對于熱點分析工具,不尋常意味著出現了具有統計顯著性的熱點或冷點。
(z 得分越高(或越低),聚類程度就越高。如果 z 得分接近零,則表示研究區域內不存在明顯的聚類。z 得分為正表示高值的聚類。z 得分為負表示低值的聚類。)
因此,其實上面這張圖下面的那句話其實就是給我們的解釋,“隨機產生此聚類模式的可能性小于1%”,也就是說,我們的數據是聚類的,因為隨機的可能性是1%,也就是99%的把握認為我們的數據是聚類的,也就是湖南省122個縣的GDP在空間上是有關聯的,并且是聚類分布的。
其實莫蘭指數也就只能告訴我們這么多了,它并不會返回一張紅藍相間的圖給我們,那是其他的工具如局部莫蘭指數或者熱點分析會返回的圖,因此全局莫蘭指數是作為一個檢驗數據的空間相關性的工具出現的,但是也是必不可少的,當然了,雖然不能出圖,但是在我們的論文里,是可以將這個結果作為結論出現的??!
本文鏈接:http://www.duo1680.com/blog/382.html
本文標簽:ArcGIS