做聚類分析時量綱相同取值範圍相同但數值相差比較大的情況下

1樓：

如果不是正態分佈就要標準化，可以聯絡一下共同學習

70011316

聚類分析資料標準化問題

2樓：匿名使用者

k-mean沒有標準化選項， 2-steps 是有標準化選項的。

要得到標準化的標量，需要到分析選單中，選擇描述統計中,再選擇descriptive選單，在對話方塊中的下方，仔細看，有乙個儲存標準化變數的選項。點上既可以生成乙個新的標準化變數。

3樓：純純黃黃

sas 聚類是自動標準化並且沒有顯示的。

想要得到標準化資料可以手動做啊。。

excel 乙個公式就可以做到啊

標準化 = 減去均值除以標準差。

spss在聚類分析的時候，針對單位不同的資料需要先無量綱化（標準化）嗎

4樓：匿名使用者

是的。聚類演算法要求連續變數先進性標準化。

在聚類分析的options按鈕裡面您可以找到standardization of continuous variables欄，任何連續變數都要作為要被標準化的變數列在右邊to be standardized矩形框中。

希望可以幫助您。

spss中主成分分析法的資料如何進行標準化處理？

5樓：匿名使用者

首先樓主要知道為什麼做資料標準化資料標準化主要是對那些量綱不同的指標資料進行標準化通俗說就是資料單位不同的話就做個標準化要是單位相同不用標準化了

標準化步驟：選擇analysis 分析然後選擇下拉列表的第二個descriptive statistics 描述統計接下來選擇第二項descriptive 描述接著把你的指標都放到空白框裡就是這個介面的左下角挑上對號資料標準化了相關係數矩陣也蹦出來啦

接著你就會看到標準化後的資料出現在你spss頁面上這些原始指標的後面也就是頁面往右拉吧就看到標準化之後的資料了你可以用這些標準化之後的資料進行主成分分析

資料預處理在什麼情況下採取哪種方法最合適？

6樓：匿名使用者

在資料分析之前，我們通常需要先將資料標準化（normalization），利用標準化後的資料進行資料分析。資料標準化也就是統計資料的指數化。資料標準化處理主要包括資料同趨化處理和無量綱化處理兩個方面。

資料同趨化處理主要解決不同性質資料問題，對不同性質指標直接加總不能正確反映不同作用力的綜合結果，須先考慮改變逆指標資料性質，使所有指針對測評方案的作用力同趨化，再加總才能得出正確結果。

資料無量綱化處理主要解決資料的可比性。去除資料的單位限制，將其轉化為無量綱的純數值，便於不同單位或量級的指標能夠進行比較和加權。

資料標準化的方法有很多種，常用的有「最小—最大標準化」、「z-score標準化」和「按小數定標標準化」等。經過上述標準化處理，原始資料均轉換為無量綱化指標測評值，即各指標值都處於同乙個數量級別上，可以進行綜合測評分析。

一、min-max 標準化

min-max標準化方法是對原始資料進行線性變換。設mina和maxa分別為屬性a的最小值和最大值，將a的乙個原始值x通過min-max標準化對映成在區間[0,1]中的值x'，其公式為：

新資料=（原資料-極小值）/（極大值-極小值）

二、z-score 標準化

這種方法基於原始資料的均值（mean）和標準差（standard deviation）進行資料的標準化。將a的原始值x使用z-score標準化到x'。

z-score標準化方法適用於屬性a的最大值和最小值未知的情況，或有超出取值範圍的離群資料的情況。

新資料=（原資料-均值）/標準差

spss預設的標準化方法就是z-score標準化。

用excel進行z-score標準化的方法：在excel中沒有現成的函式，需要自己分步計算，其實標準化的公式很簡單。

步驟如下：

1.求出各變數（指標）的算術平均值（數學期望）xi和標準差si ；

2.進行標準化處理：

zij＝（xij－xi）／si

其中：zij為標準化後的變數值；xij為實際變數值。

3.將逆指標前的正負號對調。

標準化後的變數值圍繞0上下波動，大於0說明高於平均水平，小於0說明低於平均水平。

三、decimal scaling小數定標標準化

這種方法通過移動資料的小數點位置來進行標準化。小數點移動多少位取決於屬性a的取值中的最大絕對值。將屬性a的原始值x使用decimal scaling標準化到x'的計算方法是：

x'=x/(10*j)

其中，j是滿足條件的最小整數。

例如假定a的值由-986到917，a的最大絕對值為986，為使用小數定標標準化，我們用1000（即，j=3）除以每個值，這樣，-986被規範化為-0.986。

注意，標準化會對原始資料做出改變，因此需要儲存所使用的標準化方法的引數，以便對後續的資料進行統一的標準化。

除了上面提到的資料標準化外還有對數logistic模式、模糊量化模式等等：

對數logistic模式：新資料=1/（1+e^(-原資料)）

模糊量化模式：新資料=1/2+1/2sin[派3.1415/（極大值-極小值）*（x-（極大值-極小值）/2） ] x為原資料

簡述一下logistic回歸分析指標重要程度的主要過程 135

7樓：匿名使用者

**中的「市盈率」為負數時，絕對數越大越好嗎？

8樓：我心敏心

越小越好!

負為虧本

正為贏利

市盈率代表你有多少年可以收回投資(不分紅情況下)

9樓：近世鎮

-7是7年虧損到0資產

-18是18年虧損到0資產

想來還是虧得慢好。

10樓：匿名使用者

才那樣在最主要的關節中收手，是為了儲存the morning, when kong yan

用spss做主成分分析時怎麼將原始資料標準化

11樓：懶惰小人之懶惰

《spss統計分析高階教程》張文彤第2版中第226頁，在「相關陣和協方差」版塊下有這麼一段話：「相關陣不受變數量綱的影響，而協差陣受量綱的影響很大，當變數取值範圍相差很大或量綱不同時，應進行標準化，不過這點在spss中到不存在，因為spss的因子分析方法中本身就包含了乙個標準化過程。」

spss的因子分析方法中本身就包含了乙個標準化過程。

你說的是主成分分析，統計書上提到過，可以把主成分分析看成是因子分析中的一種，而且spss中主成分分析和因子分析都放在了一起，使用同乙個spss分析過程。

做聚類分析時量綱相同取值範圍相同但數值相差比較大的情況下

聚類分析，資料標準化處理，聚類分析資料標準化問題

如何利用R軟體進行聚類分析

spss軟體聚類分析怎麼用，從輸入資料到結果，樹狀圖結果。整

做聚類分析時量綱相同取值範圍相同但數值相差比較大的情況下

聚類分析，資料標準化處理，聚類分析資料標準化問題

如何利用R軟體進行聚類分析

spss軟體聚類分析怎麼用，從輸入資料到結果，樹狀圖結果。整

相關推薦