- 相關(guān)推薦
馬氏距離與歐氏距離方法在地球化學(xué)異常處理中的對(duì)比
第27卷 第4期吉 林 地 質(zhì) Vol127 No14
2008年12月Dec12008JILINGEOLOGY
文章編號(hào):10012427(2008)0411704
馬氏距離與歐氏距離方法在地球化學(xué)異常處理中的對(duì)比
宋運(yùn)紅,李振祥,孫連輝,賈大成,部雪嬌
1.吉林大學(xué)地球探測(cè)科學(xué)與技術(shù)學(xué)院,吉林長(zhǎng)春 130061;2.,1
2
2
1
1
摘要:,馬氏距離就是一個(gè)在地球以往比較普遍使用的是以歐氏距離為基礎(chǔ)的計(jì)算方法,1∶5萬(wàn)地球化學(xué)數(shù)據(jù)處理為例,,馬氏距離方法考慮到了不同元素之間的相互關(guān)系,利用馬氏距離方法求得的綜合地球化學(xué)異常范圍集中、界線清楚、強(qiáng)度突出、與已知礦體的吻合程度高,較歐氏距離方法具有明顯優(yōu)勢(shì),并在實(shí)際中可行。
關(guān)鍵詞:地球化學(xué)數(shù)據(jù)處理;綜合地球化學(xué)異常;歐氏距離;馬氏距離;對(duì)比中圖分類號(hào):P618,P632 文獻(xiàn)標(biāo)識(shí)碼:A
ContrastbetweenMahalanobisdistanceandEuclideandistance
ingeochemicalexplorationprocessing
SONGYun2hong,LIZhen2xiang,SUNLian2hui,JIADa2cheng,BUXue2jiao
1.CollegeofGeoexplorationScienceandTechnology,JilinUniversity,Changchun130026,Jilin,China;2.InnerMongoliaNo.
10InstituteofGeologyandMineralExplorationandDevelopment,Chifeng,024005,InnerMongolia,China
1
2
2
1
1
Abstract:Theaccuracyandvalidityofthedeterminationofsyntheticgeochemicalanomalyaretheimportantcontentsintheprocessingofgeochemicalanomaly.Thedeterminationofsyntheticgeochemicalanomalyisbasedonmulti2variatenormaldistributiontheory,whichisthedirectlypromotionandapplicationofmultivariablestatisticalmethod,Mahalanobisdistanceisacompositeindicatorthatwidelyappliedinidentifyingoutlier,discriminantanaly2sisandotherrelatedareaofgeochemistry.Euclideandistancewasuniversallyusedintraditionalmethed,however,inrecenttwentyyears,Euclideandistancehasbeenappliedincreasedly.Takingtheprocessingof1∶50000geo2chemistrydataforexampleinthispaper,twomethodswerecontrastedfromtheoryandappliedeffects.
Interrela2
tionshipoftheelementshadbeenconsideredinMahalanobisdistance.SyntheticgeochemicalanomalycomputedbyMahalanobisdistancehassuchcharactersascentralizedshttp://www.szmdbiao.comcope,cleardemarcationline,prominentintensity,highanastomosiswithknownorebody.MahalanobisdistancehasobviousadvantageoverEuclideandistanceandisfeasi2bletobeappliedinreality.
Keywords:geochemicaldataprocessing;syntheticgeochemicalanomaly;Mahalanobisdistance;Euclideandistance;contrast
收稿日期:2008204225;改回日期:2008211210
作者簡(jiǎn)介:宋運(yùn)紅(19832),女,山東泰安人,吉林大學(xué)地球探測(cè)科學(xué)與技術(shù)學(xué)院碩士研究生。
118
吉 林 地 質(zhì) 第27卷
地球化學(xué)背景和異常劃分是地球化學(xué)處理方法
中的重要內(nèi)容,直接影響地球化學(xué)找礦的效果;谝辉龖B(tài)分布理論,通過(guò)計(jì)算樣品數(shù)據(jù)的統(tǒng)計(jì)學(xué)參數(shù)(均值、標(biāo)準(zhǔn)離差等)得出背景值和異常下
[1]
限,獲得單指標(biāo)異常,隨著多元正態(tài)分布理論在地球化學(xué)數(shù)據(jù)處理中的應(yīng)用,綜合地球化學(xué)異常在地化找礦和成礦預(yù)測(cè)中的優(yōu)勢(shì)得到充分的發(fā)揮,已逐漸成為一種常規(guī)的地球化學(xué)異常處理方法;诙嘣龖B(tài)分布理論的多指標(biāo)綜合地球化學(xué)異常處理方法,實(shí)際上是多變量統(tǒng)計(jì)方法的直接推廣與應(yīng)用,算方法,,20[2]
別。由于,常上也有所差別,然而,對(duì)于這兩種方法在地球化學(xué)異常處理效果上的差異如何卻鮮有討論。本文以河北某地1∶5萬(wàn)地球化學(xué)數(shù)據(jù)處理為例,試圖從理論上和應(yīng)用效果上對(duì)兩種方法進(jìn)行比較,查找各自的優(yōu)缺點(diǎn),以便在進(jìn)行地球化學(xué)綜合異常評(píng)價(jià)時(shí)為選擇合理處理方法提供依據(jù)。
并作為區(qū)分背景與異常的有效方法112 馬氏距離的基本原理
[3]
。
由于歐氏距離只是各變量至變量平均值的幾何距離,而沒有考慮到變量之間的相關(guān)關(guān)系,為解決這個(gè)問題,印度著名統(tǒng)計(jì)學(xué)家馬哈拉諾比斯提出了“基于多元統(tǒng)計(jì)的馬氏距離方法”,它是一種有效X-X)=D
2
-1
-1
[6]
。
(3)
2
;X為元素平均值;S為原始;S為原始數(shù)據(jù)協(xié)方差矩陣逆矩陣。
在原始變量空間中,馬氏距離是考慮樣本中變量間相關(guān)性的各樣本到樣本平均值的距離,對(duì)于每
-1
(X-X)一個(gè)給定的正值D,(X-X)′S
=D就
2
確定了一個(gè)m維超橢球。通過(guò)不斷改變D值,就
可以得到具有相同中心的超橢球束,它們的形狀和方向由S確定,它們的大小由D確定。在橢球面
2
上,馬氏距離的概率密度不變,D越小,概率密度越大,D越大,概率密度越小,當(dāng)D大到一定程度時(shí),其分布的概率密度就會(huì)小到一定的程度,以至于在此范圍外的所有點(diǎn)不再屬于正態(tài)分布總體,即它們?cè)谝欢ǔ潭壬蠈儆诋惓|c(diǎn),因此,只要找到這個(gè)臨界距離Dα,則大于它的均為異常樣
2
[4]
2
2
1 馬氏距離和歐氏距離的基本原理
111 歐氏距離的基本原理
。
歐氏距離是使用最為廣泛的一種方法。其計(jì)算公式為:
m
從總體中剔除異常樣品,剩下的就是正態(tài)分布總體,從而可求得正態(tài)分布總體的平均值,這就是所求得的綜合背景值,剔除的異常樣就是我們所需要的綜合異常樣。
2
在實(shí)際應(yīng)用中,臨界距離Dα可用F分布(可由F分布表查出)確定:
d=
=1
(X
ik
-Xjk),i、j=1,2,…,n
2
(1)
其中一種特殊情況,點(diǎn)i到分布中心的歐氏距
離,公式如下:
m
d=
=1
(X
ik
-Xj),i=1,2,…,n
2
(2)
Dα
2
=Fα(m,n-m)(n-m)n
2
(4)
式中:Xij為樣品點(diǎn);Xj為變量的平均值。
歐氏距離是一種點(diǎn)與點(diǎn)間的距離,在多元統(tǒng)計(jì)中,我們所要解決的不再是具體的點(diǎn)到點(diǎn)的距離,而是樣品點(diǎn)到相應(yīng)總體的距離,因此,需要在總體中找一個(gè)最具代表性的點(diǎn),用樣品點(diǎn)到代表點(diǎn)的距離定義樣品點(diǎn)到相應(yīng)總體的距離,總體的均值向量Xj就是這樣的代表點(diǎn),因?yàn)樗强傮w的取值以概率加權(quán)后的“中心”點(diǎn),從而可以很容易的推廣到3個(gè)變量乃至更多變量的場(chǎng)合。歐氏距離的突出特點(diǎn)是考慮到各變量至各變量平均值的幾何距離,
馬氏距離是建立在多元正態(tài)分布理論之上的方法,由于其所考慮的是多種相互作用的因素,因而更適合多元或多因素的求異。
2 馬氏距離與歐氏距離基本原理比較
雖然綜合地球化學(xué)異常的確定是以多元正態(tài)分布理論為基礎(chǔ),但基于上述不同的計(jì)算方法,對(duì)于多元數(shù)據(jù)統(tǒng)計(jì)過(guò)程存在不同條件和含義。對(duì)于確定綜合地球化學(xué)異常,歐氏距離體現(xiàn)出3個(gè)主要的不足:(1)歐氏距離的值與總體各分量的量綱有關(guān),
第4期 宋運(yùn)紅李振祥等:馬氏距離與歐氏距離方法在地球化學(xué)異常處理中的對(duì)比
119
而各種元素在地殼中的含量有著明顯的差距,需要統(tǒng)一量綱,在統(tǒng)一量綱過(guò)程中有一定的人為性和隨意性,而且任何一個(gè)變量計(jì)量單位的改變都會(huì)使此距離的數(shù)值改變;(2)歐氏距離的定義沒有考慮各個(gè)變量之間的相關(guān)性。實(shí)際上,歐氏距離是把各個(gè)變量都同等看待,將兩個(gè)樣本在各個(gè)變量上的離差簡(jiǎn)單地進(jìn)行了綜合;(3)歐氏距離必須滿足正態(tài)分布條件,對(duì)地球化學(xué)數(shù)據(jù)首先要進(jìn)行正態(tài)分布檢驗(yàn)。
同樣建立在多元正態(tài)分布理論基礎(chǔ)上的馬氏距離方法,考慮了均值、方差和協(xié)方差3,。
馬氏距離是考慮樣本中變量間相關(guān)性的各變量至變量平均值的距離;而歐氏
[5]
距離只是各變量至變量平均值的幾何距離。馬氏距離相對(duì)于歐氏距離而言具有以下優(yōu)點(diǎn):(1)馬氏距離是歐幾里德空間中非均勻分布的歸一化距離,不用考慮各特征參數(shù)的量綱,且與各分量單位的選取無(wú)關(guān);(2)馬氏距離是根據(jù)整個(gè)空間上的特征分布情況作為判別依據(jù)的,考慮了變量之間的相關(guān)性影響。因此,它能更好地描述元素之間的相似性,為更高一級(jí)的數(shù)據(jù)分析提供有效的數(shù)據(jù);(3)可以不嚴(yán)格地滿足正態(tài)分布條件。
在實(shí)際應(yīng)用中,地球化學(xué)樣品往往要受到多種互相關(guān)聯(lián)的因素控制。如該地區(qū)的地層、巖石、構(gòu)造以及化學(xué)物質(zhì)的污染情況等等多種地質(zhì)條件、地球化學(xué)因素,這些因素彼此影響,在很大程度上影響樣品中各元素的分布狀態(tài)和結(jié)構(gòu)。在同一地質(zhì)環(huán)境中,有顯著異常的區(qū)域往往與成礦作用或其它特有地質(zhì)作用有關(guān),此外,我們實(shí)地遇到的某地區(qū)也并不是只有一次成礦作用和只產(chǎn)一種礦床,即使是一種礦床也往往會(huì)有多種伴生元素,所以得到這個(gè)地區(qū)綜合異常是非常必要的,然而只有在查明數(shù)據(jù)總體與各變量及各變量之間的聯(lián)系,刻畫出總體多元結(jié)構(gòu)的基礎(chǔ)上,才有可能正確區(qū)分背景與異常。馬氏距離D是廣義平方距離的一種,以多元正態(tài)分布理論為基礎(chǔ),有效地考慮了均值、方差、協(xié)方差3個(gè)參數(shù),由于其所考慮的是多種相互作用的因素,是一個(gè)能夠較全面描述總體多元結(jié)構(gòu)的綜合指標(biāo),在礦產(chǎn)資源預(yù)測(cè)、異常圈定、生態(tài)環(huán)境研究、
2
氣象等方面得到了廣泛的應(yīng)用。
3 馬氏距離和歐氏距離地球化學(xué)綜合異常
效果對(duì)比
以河北某地區(qū)正規(guī)1∶5萬(wàn)水系沉積物地球化學(xué)測(cè)量數(shù)據(jù)為例,比較應(yīng)用馬氏距離和歐氏距離確定多元綜合異常的方法1476個(gè)樣品,,根據(jù)綜合異常直觀地比較兩。
31 R型因子分析地球化學(xué)組合異常
對(duì)該圖幅數(shù)據(jù)處理得到R型因子分析結(jié)果(表1),其中:F1因子主要是Au、Ag、Pb、Sb組合;F2因子主要是Mn、As、Sb組合;F3因子主要是Cu、Pb組合;F4因子主要是Mo、Mn組合;F5因子主要是Co、Mn組合;F6因子主要是Zn(Mn、Pb)組合;F7因子主要是Ni異常;F8因子主要是Sn異常;F9因子主要是Bi異常。選擇以Au為主的F1因子得分做累加綜合異常圖(圖1)。
在F1因子得分綜合異常圖中,有10個(gè)主要異常區(qū)(Z1~Z10),其異常主要分布在右上半部分,構(gòu)成西北和東南走向異常帶與線性構(gòu)造基本一致,Z2和Z4兩個(gè)異常與已知礦區(qū)基本吻合(圖1)
。
圖1 R型因子分析F1因子組合異常等值線圖
Fig11 F1factorsyntheticanomalycontourmapwithR
-factoranalysis
120
吉 林 地 質(zhì) 第27卷
表1 全部樣品正交旋轉(zhuǎn)因子載荷矩陣
Table1 Loadmatrixoforthogonalrotationfactorforallsamples
F1
AuAgCuPbZnMnMoCoNiSnAsSbBi
0181201799010570161901100-0104001080011130102601003-001431010292011%
F20105801015-0104801069010520147301008-01058010890101665010933114%
F3-011740124001907014640105601243-01008-010460101017-01137010434111%
F4-0111301214-01017010990105701304019530110109601009-01032010694916%
F50103201080-01015010490103801010113201122-01004-01052010505712%
F601066-0103301028012351970001007010150108101046-01015010126416%
F7-01018010270103601100-01940105101181019500103701191-01098010237112%
F8-01019-010210104210981076-01262010960116901037019280113701074-010017715%
F901017-01045010230113001011-01036010730106301022-010020116701070019848312%
累計(jì)方差貢獻(xiàn)
312 馬氏距離地球化學(xué)綜合異常
依據(jù)公式(3)至(4),計(jì)算樣品的馬氏距離
2
D,以剔除異常樣品后的正?傮w的馬氏距離上線值Dα為異常下限,利用所有樣品的馬氏距離D做地球化學(xué)綜合異常圖(圖2)
。
2
2
區(qū)(M1~M10),其異常主要分布在圖幅上半部分,與線性構(gòu)造一致,西北和東南走向異常帶更為明顯,M2~M8兩個(gè)異常與已知礦區(qū)基本吻合(圖2)。
313 馬氏距離與歐氏距離地球化學(xué)綜合異常比較
兩種方法確定的綜合異常分布總體上具有類似性,綜合異常個(gè)數(shù)相同,多數(shù)異常基本可以對(duì)應(yīng),如圖1中Z1、Z2、Z7、Z3、Z4、Z5、Z6、Z8號(hào)異常分別對(duì)應(yīng)圖2中的M1、M2、M4、M5、M6、M8、M10、M7號(hào)異常。但是在異?臻g位置、異常范圍和異常強(qiáng)度等方面仍然存在一定差異。
從兩異常圖對(duì)比可以看出,馬氏距離綜合異常具有如下優(yōu)勢(shì):異常范圍面積比較小,界線清楚,異常濃集中心明顯,且異常含量等級(jí)清晰,異常強(qiáng)度突出,與已知礦體的吻合程度高,異常空間分布與區(qū)域線性構(gòu)造的關(guān)系更密切,異常的帶狀能夠體現(xiàn)出區(qū)域成礦帶的特征,有利于在找礦中的實(shí)際應(yīng)用。由此可見,利用馬氏距離方法確定的綜合異常具有比較好的應(yīng)用效果。
圖2 馬氏距離綜合異常等值線圖
Fig12 SystheticanomalycontourmapwithMahalano2
bisdistance
4 結(jié)論
(1)馬氏距離和歐氏距離都是建立在多元正
(下轉(zhuǎn)129頁(yè))
在馬氏距離綜合異常圖中,有10個(gè)主要異常
第4期 丁志江王 猛:基于GoogleEarth影像圖遙感解譯在我國(guó)西北礦產(chǎn)地質(zhì)調(diào)查中的應(yīng)用
129
變化、植被覆蓋等等容易時(shí)過(guò)境遷的圖象信息反映差異較大。顯然GE影像更加接近于目前工作區(qū)內(nèi)的實(shí)際情況。能更加準(zhǔn)確有效地指導(dǎo)野外調(diào)查工作。GE還能夠動(dòng)態(tài)顯示光標(biāo)位置的經(jīng)緯度及高程,雖然其數(shù)據(jù)誤差較大,但我們可以利用它能大體測(cè)算區(qū)內(nèi)各地點(diǎn)間的相對(duì)高差,及時(shí)發(fā)現(xiàn)野外調(diào)查工作當(dāng)中的安全隱患,減少安全事故的發(fā)生。讓我們?cè)谌魏我粋(gè)陌生環(huán)境中仍能做到心中有數(shù)。不至于無(wú)的放失。
另外GE還可以與GPS進(jìn)行連接,對(duì)野外調(diào)查工作進(jìn)行實(shí)時(shí)控制。也可以通過(guò)GE采集種類界線的坐標(biāo)點(diǎn),編輯航線,導(dǎo)入GPS后進(jìn)行導(dǎo)航地質(zhì)觀測(cè)。
其實(shí)GE的應(yīng)用遠(yuǎn)遠(yuǎn)不限于此。我們可以在實(shí)地的工作當(dāng)中充分利用GE帶給我們的豐富的免費(fèi)信息,,讓GE在 (上接120頁(yè))
態(tài)分布理論之上的方法,在處理地球化學(xué)測(cè)量數(shù)據(jù)中都有應(yīng)用,但基于歐氏距離的計(jì)算方法應(yīng)用得較為普遍。從兩種計(jì)算方法的原理分析,歐氏距離只是各變量與變量平均值的幾何距離,而馬氏距離是考慮樣本中變量間相關(guān)性的各變量至變量平均值的距離,因而考慮到多種相互作用的因素,由于地球化學(xué)異常的形成是各種地質(zhì)和成礦因素的綜合,因而應(yīng)用馬氏距離方法求多元綜合地球化學(xué)異常較歐氏距離方法更為客觀。
(2)從實(shí)際應(yīng)用效果上看,馬氏距離法所確定的綜合異常與歐氏距離法所確定的綜合異?傮w上在異常個(gè)數(shù)和分布特征方面基本可以對(duì)比,具有相似性。然而,馬氏距離法所確定的綜合異常范圍集中、濃集中心明顯、界線清楚、強(qiáng)度突出、與已知礦體和線性構(gòu)造的吻合程度高,既減輕了多元組合異常重疊而造成的圖面負(fù)荷太重,又便于對(duì)多元組合異常的驗(yàn)證和評(píng)價(jià),其應(yīng)用效果明顯優(yōu)于歐氏
距離方法。參考文獻(xiàn):
[1]吳錫生.化探數(shù)據(jù)處理方法[M].北京:地質(zhì)出版
社,1992,38245.
[2]樸壽成,陶文宏,連長(zhǎng)云.利用X分布確定多元地
2
球化學(xué)異常的方法[J].吉林地質(zhì),1997,16(3):
71274.
[3]時(shí)艷香,紀(jì)宏金,郝立波等.利用水系沉積物地球化
學(xué)數(shù)據(jù)判別淺覆蓋區(qū)巖性與構(gòu)造-歐氏距離法[J].物探化探計(jì)算技術(shù),2004,26(3):2432246.
[4]紀(jì)宏金,林瑞慶,周永昶.關(guān)于若干化探數(shù)據(jù)處理方
法的討論[J].地質(zhì)與勘探,2001,37(4):56259.
[5]時(shí)艷香,紀(jì)宏金,陸繼龍等.水系沉積物地球化學(xué)分
區(qū)的因子分析方法與應(yīng)用[J].地質(zhì)與勘探,2004,
40(5):73276.
[6]李玉榕,項(xiàng)國(guó)波.一種基于馬氏距離的線性判別分析
分類算法[J].計(jì)算機(jī)仿真,2006,32(8):86289.
【馬氏距離與歐氏距離方法在地球化學(xué)異常處理中的對(duì)比】相關(guān)文章:
距離02-17
距離08-26
距離(經(jīng)典)11-27
略論人際交往中的距離04-28
基于改進(jìn)魯棒馬氏距離與卡平方分布的粗差判別及其應(yīng)用04-30
[精品]距離11-28
河岸的距離05-02
距離作文04-28