概述:
根據要素位置和屬性值使用 Global Moran’s I 統計量測量空間自相關性。提出者為澳大利亞統計學家帕特里克·阿爾弗雷德·皮爾斯·莫蘭(Patrick Alfred Pierce Moran)。
Moran PAP. The interpretation of statistical maps[J]. Journal of the Royal Statistical Society B , 1948,(37):243-251.
詳細概述:
空間自相關 (Global Moran’s I)工具同時根據要素位置和要素值來度量空間自相關。在給定一組要素及相關屬性的情況下,該工具評估所表達的模式是聚類模式、離散模式還是隨機模式。該工具通過計算 Moran’s I指數值、z得分和p值來對該指數的顯著性進行評估。p值是根據已知分布的曲線得出的面積近似值(受檢驗統計量限制)。
公式:
說明:
1、空間自相關工具返回五個值:Moran’s I 指數、預期指數、方差、z 得分及 p 值。您可通過結果窗口訪問這些值,也可以將這些值作為派生輸出值進行傳遞,以滿足模型或腳本中的潛在使用需要。
在給定一組要素及相關屬性的情況下,該工具評估所表達的模式是聚類模式、離散模式還是隨機模式。使用 z 得分或 p 值指示統計顯著性時,如果 Moran’s I 指數值為正則指示聚類趨勢,如果 Moran’s I 指數值為負則指示離散趨勢。
2、返回的z得分與P值解釋:
p 值不具有統計學上的顯著性。
不能拒絕零假設。要素值的空間分布很有可能是隨機空間過程的結果。觀測到的要素值空間模式可能只是完全空間隨機性 (CSR) 的眾多可能結果之一。
p 值具有統計學上的顯著性,且 z 得分為正值。
可以拒絕零假設。如果基礎空間過程是隨機的,則數據集中高值和/或低值的空間分布在空間上聚類的程度要高于預期。
p 值具有統計學上的顯著性,且 z 得分為負值。
可以拒絕零假設。如果基礎空間過程是隨機的,則數據集中高值和低值的空間分布在空間上離散的程度要高于預期。離散空間模式通常會反映某種類型的競爭過程:具有高值的要素排斥具有高值的其他要素;具有低值的要素排斥具有低值的其他要素。
常見的問題:
Q1:可以針對不同研究區域使用全局自相關生成的 z 得分或 p 值與分析結果進行比較嗎?
不可以。但是,如果研究區域是固定的(例如,所有分析都針對加利福尼亞的縣)、輸入字段具有可比性(例如,所有分析都涉及某種類型的人口計數),并且工具參數均相同(例如,距離范圍或距離閾值為 5,000 米的“固定距離”并且工具均使用“行標準化”參數),此時,便可對統計學上顯著的 z 得分進行比較,以了解空間聚類或空間離散的程度或更好地了解趨勢隨時間推移的變化情況。還可以在不斷增大距離范圍或距離閾值的情況下運行分析,以了解在哪個距離/比例下促進空間聚類的過程最明顯。
Q2:為何會得到大于 1.0 或小于 -1.0 的 Moran’s I 指數?
通常,Global Moran’s I 指數介于 -1.0 到 1.0 之間。只有對權重進行了行標準化時才會這樣。如果未對權重進行行標準化處理,則指數值可能會落在 -1.0 到 1.0 的范圍之外,這表示參數設置有問題。
Q3:何時采用全局莫蘭指數(Global Moran’s I),何時采用局部莫蘭指數(Local Moran’s I),以及,兩者有何區別?
莫蘭指數分為全局莫蘭指數(Global Moran’s I)和局部莫蘭指數(Local Moran’s I),前者是Patrick Alfred Pierce Moran于1950年提出,用來衡量空間自相關程度的度量;后者是美國亞利桑那州立大學地理與規劃學院院長 Luc Anselin 教授在1995年提出的。
通常情況,先做一個地區的全局指數,全局指數只是告訴我們空間是否出現了集聚或異常值,但并沒有告訴我們在哪里出現。換句話說全局Moran’I只回答Yes還是NO;如果全局有自相關出現,接著做局部自相關;局部Moran’I會告訴我們哪里出現了異常值或者哪里出現了集聚,是一個回答Where的工具。
莫蘭指數是一個有理數,經過方差歸一化之后,它的值會被歸一化到-1.0與+1.0之間。
Moran’s I大于0時,表示數據呈現空間正相關,其值越大空間相關性越明顯;Moran’s I小于0時,表示數據呈現空間負相關,其值越小空間差異越大;Moran’s I為0時,空間呈隨機性。
ArcGIS中運行莫蘭指數的注意事項:
輸入字段嚴重偏斜(創建數據值的直方圖可了解此情況),空間關系的概念化或距離范圍的設置使得某些要素的相鄰要素非常少。Global Moran’s I 統計量是漸進正態的,這意味著,對于偏斜數據,每個要素至少需要具有 8 個相鄰要素。為距離范圍或距離閾值參數計算的默認值可確保每個要素至少具有 1 個相鄰要素,但這可能不夠,尤其是在輸入字段中的值嚴重偏斜時。
使用反距離空間關系的概念化,并且反距離非常小。
未選擇行標準化。除非聚合方案與所分析的字段直接相關,否則,只要對數據進行了聚合處理,就應選擇行標準化。
空間關系的概念化:
指定要素空間關系的定義方式。
INVERSE_DISTANCE—與遠處的要素相比,附近的鄰近要素對目標要素的計算的影響要大一些。
INVERSE_DISTANCE_SQUARED—與 INVERSE_DISTANCE 類似,但它的坡度更明顯,因此影響下降得更快,并且只有目標要素的最近鄰域會對要素的計算產生重大影響。
反距離方法(INVERSE_DISTANCE、INVERSE_DISTANCE_SQUARED)最適合對連續數據,或最適合對符合此種情形的對象進行建模:兩個要素在空間上越靠近,它們彼此交互/影響的可能性就越大。使用此空間概念化參數,每個要素都可能是其他各個要素的鄰域,而對于大型數據集,這將涉及巨大的計算量。使用反距離法時,應嘗試添加一個距離范圍或距離閾值,特別是對于大型數據集十分重要。如果將距離范圍或距離閾值參數留空,系統將計算距離閾值,但這可能不是分析所需的最適當距離;默認的距離閾值是能夠確保每個要素至少具有一個相鄰要素的最小距離。
可為0,可默認,可輸入正值。
FIXED_DISTANCE_BAND—將對鄰近要素環境中的每個要素進行分析。在指定臨界距離(距離范圍或距離閾值)內的鄰近要素將分配有值為 1 的權重,并對目標要素的計算產生影響。在指定臨界距離外的鄰近要素將分配值為零的權重,并且不會對目標要素的計算產生任何影響。此方法適用于處理點數據。
ZONE_OF_INDIFFERENCE—在目標要素的指定臨界距離(距離范圍或距離閾值)內的要素將分配有值為1的權重,并且會影響目標要素的計算。一旦超出該臨界距離,權重(以及鄰近要素對目標要素計算的影響)就會隨距離的增加而減小。
不可為0,可默認,可輸入正值。
CONTIGUITY_EDGES_ONLY—只有共用邊界或重疊的相鄰面要素會影響目標面要素的計算。
CONTIGUITY_EDGES_CORNERS—共享邊界、結點或重疊的面要素會影響目標面要素的計算。
國際象棋里面的Rook(車)和皇后(Queen)的走法,因此也叫做Rook’s Case和Queen’s Case。面要素計算進行計算的話,面鄰接是最簡單的一種空間關系概念化的模型。
GET_SPATIAL_WEIGHTS_FROM_FILE—將由指定空間權重文件定義空間關系。指向空間權重文件的路徑由權重矩陣文件參數指定。
標準化:
行標準化的權重通常與固定距離相鄰要素結合使用,并且幾乎總是用于基于面鄰接的相鄰要素,這樣可減少因為要素具有不同數量的相鄰要素而產生的偏離。行標準化將換算所有權重,使它們在 0 和 1 之間,從而創建相對(而不是絕對)權重方案。每當要處理表示行政邊界的面要素時,您都可能會希望選擇“行標準化”選項。
實例:
這次,我們采用湖南省2018年的122個縣的一些社會經濟數據,如GDP、第二產業增加值、第二產業從業人員、第三產業增加值、學校、醫院床位等等數據,來進行莫蘭指數的實驗:
之前的參數設置都已經講過了,所以我們直接按照上方的提示設定參數,其實莫蘭指數的參數蠻少,主要就一個:空間關系的概念化。
因為首先,空間關系的概念化選擇決定了你要不要設置距離范圍或距離閾值以及權重矩陣文件,如果你選擇了反距離,那么距離范圍可以不輸入,也可以選擇輸入;如果選擇了FIXED_DISTANCE_BAND或者ZONE_OF_INDIFFERENCE,那么最好輸入距離范圍,當然也可以不輸入,選擇默認;如果選擇了CONTIGUITY_EDGES_ONLY或者CONTIGUITY_EDGES_CORNERS,則不需要輸入距離范圍,選擇了GET_SPATIAL_WEIGHTS_FROM_FILE,那當然需要引入權重矩陣文件了!
其次,距離法一般我們也都是選擇歐氏距離,標準化一般都是默認勾選ROW的。那么我們按照以下的進行選擇,然后點擊生成報表,運行。
最終會生成一張報表如下,而不是返回給我們一張花花綠綠的圖(那是局部莫蘭指數或者其他空間統計工具會生成的),因為上面已經講到,其實莫蘭指數就是告訴我們要素是否是隨機分布的,也就是說只會給我們一個值,是或者否,僅此而已:
本文鏈接:http://www.duo1680.com/blog/383.html
本文標簽:ArcGIS