1樓:
如果不是正態分佈就要標準化,可以聯絡一下共同學習
70011316
聚類分析資料標準化問題
2樓:匿名使用者
k-mean沒有標準化選項, 2-steps 是有標準化選項的。
要得到標準化的標量,需要到分析選單中,選擇描述統計中,再選擇descriptive選單,在對話方塊中的下方,仔細看,有乙個儲存標準化變數的選項。點上既可以生成乙個新的標準化變數。
3樓:純純黃黃
sas 聚類是自動標準化 並且沒有顯示的。
想要得到標準化資料可以手動做啊 。。
excel 乙個公式就可以做到啊
標準化 = 減去均值 除以標準差。
spss在聚類分析的時候,針對單位不同的資料需要先無量綱化(標準化)嗎
4樓:匿名使用者
是的。聚類演算法要求連續變數先進性標準化。
在聚類分析的options按鈕裡面您可以找到standardization of continuous variables欄,任何連續變數都要作為要被標準化的變數列在右邊to be standardized矩形框中。
希望可以幫助您。
spss中主成分分析法的資料如何進行標準化處理?
5樓:匿名使用者
首先 樓主要知道為什麼做資料標準化 資料標準化主要是對那些量綱不同的指標資料進行標準化 通俗說就是資料單位不同的話就做個標準化 要是單位相同不用標準化了
標準化步驟:選擇analysis 分析 然後選擇 下拉列表的第二個descriptive statistics 描述統計 接下來 選擇第二項descriptive 描述 接著把你的指標都放到空白框裡 就是這個介面的左下角 挑上對號 資料標準化了 相關係數矩陣也蹦出來啦
接著 你就會看到標準化後的資料出現在你spss頁面上這些原始指標的後面 也就是頁面往右拉吧 就看到標準化之後的資料了 你可以用這些標準化之後的資料進行主成分分析
資料預處理在什麼情況下採取哪種方法最合適?
6樓:匿名使用者
在資料分析之前,我們通常需要先將資料標準化(normalization),利用標準化後的資料進行資料分析。資料標準化也就是統計資料的指數化。資料標準化處理主要包括資料同趨化處理和無量綱化處理兩個方面。
資料同趨化處理主要解決不同性質資料問題,對不同性質指標直接加總不能正確反映不同作用力的綜合結果,須先考慮改變逆指標資料性質,使所有指針對測評方案的作用力同趨化,再加總才能得出正確結果。
資料無量綱化處理主要解決資料的可比性。去除資料的單位限制,將其轉化為無量綱的純數值,便於不同單位或量級的指標能夠進行比較和加權。
資料標準化的方法有很多種,常用的有「最小—最大標準化」、「z-score標準化」和「按小數定標標準化」等。經過上述標準化處理,原始資料均轉換為無量綱化指標測評值,即各指標值都處於同乙個數量級別上,可以進行綜合測評分析。
一、min-max 標準化
min-max標準化方法是對原始資料進行線性變換。設mina和maxa分別為屬性a的最小值和最大值,將a的乙個原始值x通過min-max標準化對映成在區間[0,1]中的值x',其公式為:
新資料=(原資料-極小值)/(極大值-極小值)
二、z-score 標準化
這種方法基於原始資料的均值(mean)和標準差(standard deviation)進行資料的標準化。將a的原始值x使用z-score標準化到x'。
z-score標準化方法適用於屬性a的最大值和最小值未知的情況,或有超出取值範圍的離群資料的情況。
新資料=(原資料-均值)/標準差
spss預設的標準化方法就是z-score標準化。
用excel進行z-score標準化的方法:在excel中沒有現成的函式,需要自己分步計算,其實標準化的公式很簡單。
步驟如下:
1.求出各變數(指標)的算術平均值(數學期望)xi和標準差si ;
2.進行標準化處理:
zij=(xij-xi)/si
其中:zij為標準化後的變數值;xij為實際變數值。
3.將逆指標前的正負號對調。
標準化後的變數值圍繞0上下波動,大於0說明高於平均水平,小於0說明低於平均水平。
三、decimal scaling小數定標標準化
這種方法通過移動資料的小數點位置來進行標準化。小數點移動多少位取決於屬性a的取值中的最大絕對值。將屬性a的原始值x使用decimal scaling標準化到x'的計算方法是:
x'=x/(10*j)
其中,j是滿足條件的最小整數。
例如 假定a的值由-986到917,a的最大絕對值為986,為使用小數定標標準化,我們用1000(即,j=3)除以每個值,這樣,-986被規範化為-0.986。
注意,標準化會對原始資料做出改變,因此需要儲存所使用的標準化方法的引數,以便對後續的資料進行統一的標準化。
除了上面提到的資料標準化外還有對數logistic模式、模糊量化模式等等:
對數logistic模式:新資料=1/(1+e^(-原資料))
模糊量化模式:新資料=1/2+1/2sin[派3.1415/(極大值-極小值)*(x-(極大值-極小值)/2) ] x為原資料
簡述一下logistic回歸分析指標重要程度的主要過程 135
7樓:匿名使用者
**中的「市盈率」為負數時,絕對數越大越好嗎?
8樓:我心敏心
越小越好!
負為虧本
正為贏利
市盈率代表你有多少年可以收回投資(不分紅情況下)
9樓:近世鎮
-7是7年虧損到0資產
-18是18年虧損到0資產
想來還是虧得慢好。
10樓:匿名使用者
才那樣在最主要的關節中收手,是為了儲存the morning, when kong yan
用spss做主成分分析時怎麼將原始資料標準化
11樓:懶惰小人之懶惰
《spss統計分析高階教程》張文彤第2版中第226頁,在「相關陣和協方差」版塊下有這麼一段話:「相關陣不受變數量綱的影響,而協差陣受量綱的影響很大,當變數取值範圍相差很大或量綱不同時,應進行標準化,不過這點在spss中到不存在,因為spss的因子分析方法中本身就包含了乙個標準化過程。」
spss的因子分析方法中本身就包含了乙個標準化過程。
你說的是主成分分析,統計書上提到過,可以把主成分分析看成是因子分析中的一種,而且spss中主成分分析和因子分析都放在了一起,使用同乙個spss分析過程。
聚類分析,資料標準化處理,聚類分析資料標準化問題
spss15以上版本在聚類分析時自動資料標準化,不用自己標準化計算了。聚類分析資料標準化問題 k mean沒有標準化選項,2 steps 是有標準化選項的。要得到標準化的標量,需要到分析選單中,選擇描述統計中,再選擇descriptive選單,在對話方塊中的下方,仔細看,有乙個儲存標準化變數的選項。...
如何利用R軟體進行聚類分析
運用聚類bai分析法主要做好分du 析表達數zhi 據 1 通過一系列的 dao檢測將待測內的一組基因的變異標容準化,然後成對比較線性協方差。2 通過把用最緊密關聯的譜來放基因進行樣本聚類,例如用簡單的層級聚類 hierarchical clustering 方法。這種聚類亦可擴充套件到每個實驗樣本...
spss軟體聚類分析怎麼用,從輸入資料到結果,樹狀圖結果。整
1 分析 分類 k 平均值聚類 進行相關引數的設定。2 結果顯示 spss從中挑選了幾個個例,5個聚類中心選擇了5個原始案例。3 針對存在的問題,進行相關引數的設定,增加迭代次數。4 所以要對資料進行標準化,得到標準化後的結果。5 利用標準化後的資料進行聚類分析。6 接著進行 分析 比較平均值 33...