基于距離和徑向基核函數的加權KPCA分析
羅小平,沈徐輝,杜鵬英
浙江大學電氣工程學院,浙江杭州
浙江大學城市學院智能系統重點實驗室,浙江杭州
摘 要:針對利用核主成分分析方法處理非線性問題存在對干擾點的敏感性和特征空間中的主成分缺乏明確的物理意義等缺點,提出了一種改進的模糊KPCA(ImprovedFuzzyKernelPrincipalComponentAnalysis,IFKPCA)算法,對每個樣本點進行加權處理,并利用基于距離的特征核函數和徑向基核函數,把特征空間中的重構誤差和輸入空間的誤差對應起來。用算法對2個無干擾和有干擾的數據集進行了仿真實驗。同時,對藥物代謝的數據進行主成分提取。結果表明,IFKPCA弱化了干擾點對樣本分布的影響,表現出較好的魯棒性;基于距離的特征核函數對樣本分布具有較大的依賴性,而徑向基核函數對樣本分布具有良好的魯棒性,對藥物代謝的應用結果也進一步表明了IFKPCA的有效性和可行性。
關 鍵 詞:核主成分;IFKPCA;核函數;敏感性
1 引 言
Scholkopf于1998年首次提出基于核函數的非線性主成分分析, 簡稱為核主成分分析(KPCA)[1]。該方法在模式識別、信號處理,函數逼近和圖像處理等方面取得了良好的效果。但是,常規的KPCA方法是利用特征空間中較小方差的較優來實現的,對樣本數據點的分布具有很大的敏感性。同時,如果樣本中存在個別誤差較大的值,那么對KPCA的結果也會造成影響。針對這些問題,有學者通過在一個大的樣本集中選擇一個合適的子樣本集來進行分析,如Rousseeuw提出了較小協方差決定子方法[2],Gabrys,Baruque和Corchado提出了基于子集的方法[3]; 而Lu,Zhang,Zhang,andZhang(2003)[4]和Lu,Zhang,Du,andLi(2004)等[5],則通過排除異常值的方法對樣本集進行預處理。值得注意的是,這類方法并不適合用于小樣本集。基于以上問題,提出了一種基于模糊的改進KPCA(IFKPCA)方法,通過改進各樣本點的加權值,很好地解決了樣本點敏感性問題以及RKFPCA方法中存在的干擾點分布限制問題。
相關閱讀:
- ...· Efinix® 全力驅動AI邊緣計算,成功推出Trion™ T20 FPGA樣品, 同時將產品擴展到二十萬邏輯單元的T200 FPGA
- ...· 英飛凌亮相進博會,引領智慧新生活
- ...· 三電產品開發及測試研討會北汽新能源專場成功舉行
- ...· Manz亞智科技跨入半導體領域 為面板級扇出型封裝提供化學濕制程、涂布及激光應用等生產設備解決方案
- ...· 中電瑞華BITRODE動力電池測試系統順利交付北汽新能源
- ...· 中電瑞華FTF系列電池測試系統中標北京新能源汽車股份有限公司
- ...· 中電瑞華大功率高壓能源反饋式負載系統成功交付中電熊貓
- ...· 中電瑞華國際在電動汽車及關鍵部件測評研討會上演繹先進測評技術