logistic回歸分析結果怎麼看

2021-03-04 06:20:48 字數 5035 閱讀 9405

1樓:匿名使用者

求logistic回歸分析的思路及spss分析結果解釋,單因素與多因素logistic回歸分析,到底是什麼關係,spss分析中,怎樣才是單因素分析,怎樣才是多因素分析?

logistic 回歸一般步驟:

一:變數編碼,

二:啞變數的設定,涉及如何設計啞變數

三:各個自變數的單因素分析,主要檢查有無共線性和互動作用四:變數的篩選,若有共線性的話,只有乙個變數能進入方程五:

互動作用的引入,分析有無此必要,主要看引入後方程是不是更加好六:建立多個模型

七:選擇最優模型,主要看r平方校正值,越大越好八:模型應用條件的評價

九:輸出結果的解釋

網上查詢到的資料

請採納~

相關因素logistic回歸分析結果怎麼看

2樓:

logistic回歸與多重線性回歸一樣,在應用之前也是需要分析一下資料是否可以採用logistic回歸模型。並不是說因變數是分類變數我就可以直接採用logistic回歸,有些條件仍然是需要考慮的。

首要的條件應該是需要看一下自變數與因變數之間是什麼樣的一種關係。多重線性回歸中,要求自變數與因變數符合線性關係。而logistic回歸則不同,它要求的是自變數與logit(y)符合線性關係,所謂logit實際上就是ln(p/1-p)。

也就是說,自變數應與ln(p/1-p)呈線性關係。當然,這種情形主要針對多分類變數和連續變數。對於二分類變數就無所謂了,因為兩點永遠是一條直線。

這裡舉乙個例子。某因素y與自變數x之間關係分析,y為二分類變數,x為四分類變數。如果x的四分類直接表示為1,2,3,4。

則分析結果為p=0.07,顯示對y的影響在0.05水準時無統計學意義,而如果將x作為虛擬變數,以1為參照,產生x2,x3,x4三個變數,重新分析,則結果顯示:

x2,x3,x4的p值分別為0.08,0.05和0.

03。也就是說,儘管2和1相比無統計學意義,但3和1相比,4和1相比,均有統計學意義。

為什麼會產生如此結果?實際上如果仔細分析一下,就可以發現,因為x與logit(y)並不是呈線性關係。而是呈如下圖的關係:

這就是導致上述差異的原因。從圖中來看,x的4與1相差最大,其次是2,3與1相差最小。實際分析結果也是如此,上述分析中,x2,x3,x4產生的危險度分別為3.

1,2.9,3.4。

因此,一開始x以1,2,3,4的形式直接與y進行分析,預設的是認為它們與logit(p)呈直線關係,而實際上並非如此,因此掩蓋了部分資訊,從而導致應有的差異沒有被檢驗出來。而一旦轉換為虛擬變數的形式,由於虛擬變數都是二分類的,我們不再需要考慮其與logit(p)的關係,因而顯示出了更為精確的結果。

最後強調一下,如果你對自變數x與y的關係不清楚,在樣本含量允許的條件下,最好轉換為虛擬變數的形式,這樣不至於出現太大的誤差。

如果你不清楚應該如何探索他們的關係,也可以採用虛擬變數的形式,比如上述x,如果轉換的虛擬變數x2,x3,x4他們的or值呈直線關係,那x基本上可以直接以1,2,3,4的形式直接與y進行分析。而我們剛才也看到了,x2,x3,x4的危險度分別為3.1,2.

9,3.4。並不呈直線關係,所以還是考慮以虛擬變數形式進行分析最好。

總之,虛擬變數在logistic回歸分析中是非常有利的工具,善於利用可以幫助你探索出很多有用的資訊。

統計的分析策略是乙個探索的過程,只要留心,你就會發現在探索資料關係的過程中充滿了樂趣,因為你能發現別人所發現不了的隱藏的資訊。希望大家多學點統計分析策略,把統計作為一種藝術,在分析探索中找到樂趣。

樣本量的估計可能是臨床最頭疼的一件事了,其實很多的臨床研究事前是從來不考慮樣本量的,至少我接觸的臨床研究大都如此。他們大都是想到就開始做,但是事後他們會尋求研究中樣本量的依據,尤其是在投文章被審稿人提問之後。可能很少有人想到研究之前還要考慮一下樣本夠不夠的問題。

其實這也難怪,臨床有臨床的特點,很多情況下是很難符合統計學要求的,尤其一些動物試驗,可能真的做不了很多。這種情況下確實是很為難的。

本篇文章僅是從統計學角度說明logistic回歸所需的樣本量的大致估計,不涉及臨床特殊問題。

其實不僅logistic回歸,所有的研究一般都需要對樣本量事前有乙個估計,這樣做的目的是為了盡可能地得出陽性結果。比如,你事前沒有估計,假設你做了20例,發現是陰性結果。如果事前估計的話,可能會提示你需要30例或25例可能會得出陽性結果,那這時候你會不會後悔沒有事前估計?

當然,你可以補實驗,但是不管從哪方面角度來講,補做的實驗跟一開始做得實驗可能各種條件已經變化,如果你在雜誌中說你的實驗是補做的,那估計發表的可能性就不大了。

一般來說,簡單的研究,比如組間比較,包括兩組和多組比較,都有比較成熟的公式計算一下你到底需要多少例數。這些在多數的統計學教材和流行病學教材中都有提及。而對於較為複雜的研究,比如多重線性回歸、logistic回歸之類的,涉及多個因素。

這種方法理論上也是有計算公式的,但是目前來講,似乎尚無大家公認有效的公式,而且這些公式大都計算繁瑣,因此,現實中很少有人對logistic回歸等這樣的分析方法採用計算的方法來估計樣本量。而更多地是採用經驗法。

其實關於logistic回歸的樣本量在部分著作中也有提及,一般來講,比較有把握的說法是:每個結局至少需要10例樣品。這裡說得是每個結局。

例如,觀察胃癌的危險因素,那就是說,胃癌是結局,不是你的總的例數,而是胃癌的例數就需要這麼多,那總的例數當然更多。比如我有7個研究因素,那我就至少需要70例,如果你是1:1的研究,那總共就需要140例。

如果1:2甚至更高的,那就需要的更多了。

而且,樣本量的大小也不能光看這乙個,如果你的研究因素中出現多重共線性等問題,那可能需要更多的樣本,如果你的因變數不是二分類,而是多分類,可能也需要更大的樣本來保證你的結果的可靠性。

理論上來講,logistic回歸採用的是最大似然估計,這種估計方法有很多優點,然而,乙個主要的缺點就是,必須有足夠的樣本才能保證它的優點,或者說,它的優點都是建立在大樣本的基礎上的。一般來講,logistic回歸需要的樣本量要多於多重線性回歸。

最後仍然需要說一句,目前確實沒有很好的、很權威的關於logistic回歸樣本量的估計方法,更多的都是根據自己的經驗以及分析過程中的細節發現。如果你沒有太大的把握,就去請教統計老師吧,至少他能給你提出一些建議。

logistic回歸分析結果解讀

3樓:匿名使用者

第一:對模型整體情況進行說明,比如對r方值進行描述,以及列出模型公式。

第二:逐一分析x對於y(相對於的對比項)影響情況;如果x對應的p值小於0.05則說明x會對y(相對於的對比項)產生影響關係,此時可結合or值進一步分析影響幅度。

第三:總結分析結果。

以及可結合輸出的智慧型文字分析,進行解讀。

4樓:匿名使用者

不知道你是否聽說過辛普森悖論,了解這個玩意也許能解決你的問題,如果需要在考慮a而不分析a,如果a是離散的,將不同a不同取值放入不同的模型中,然後分析其他變數。如果a是連續的,,,那就複雜一點。。。。。

5樓:七彩虹科技****

logistic回歸主要用於危險因素探索。因變數y為二分類或多分類變數,自變數既可以為分類變數,也可以為連續變數。   回歸分析**法,是在分析市場現象自變數和因變數之間相關關係的基礎上,建立變數之間的回歸方程,並將回歸方程作為**模型,根據自變數在**期的數量變化來**因變數關係大多表現為相關關係,因此,回歸分析**法是一種重要的市場**方法,當我們在對市場現象未來發展狀況和水平進行**時,如果能將影響市場**物件的主要因素找到,並且能夠取得其數量資料,就可以採用回歸分析**法進行**。

它是一種具體的、行之有效的、實用價值很高的常用市場**方法。

6樓:土行仔

不一定!這取決於因變數的編碼,情況十分複雜:

假如,因變數編碼為1時代表無病,2代表有病,那麼偏回歸係數為負就說明是保護性因素;如果編碼為1時代表有病,2代表無病,那麼偏回歸係數為負就說明是危險因素,正好與前面的說法相反!注意,這個說法僅僅對於自變數為連續變數者(如體重、年齡、身高等)而言。

因此,在spss的logistic回歸分析中,因變數編碼十分重要,總結以上規律不難發現,logistic回歸預設因變數編碼小者為對照分類(或稱參考分類)。

對於自變數為分類變數者(如性別、婚姻狀態等)而言,偏回歸係數的符號不但取決於因變數編碼,還取決於自變數的對照分類(或稱參考分類)的設定,這個設定使用者是可以調整的,系統預設編碼最大者為對照分類(或稱參考分類),這個情況你可以在分析結果的引數估計表中看到。因此,在因變數編碼為1時代表無病,2代表有病預設設定下,如果自變數也採用預設設定,那麼某一偏回歸係數為負就說明,相對於自變數的對照分類而言,該自變數分類為保護性因素,其他情況可以類推。

以上回答你滿意麼?

spss二元logistic回歸分析,結果如下,變數係數怎麼看,或者回歸方程序什麼?

7樓:匿名使用者

很遺憾的告訴你,你這研究失敗了

二元logistic回歸分析,應該說所有回歸分析,最重要的係數是sig,或者平時我們叫p值,需要小於0.05才能說明有顯著性影響,你這個所有p值高的接近1,都是毫無意義的資料

置於你說的回歸方程問題,回歸係數一般是b值,不過logistic回歸分析是對數分析法,所以一般看exp(b),也就是我們所說的or值

8樓:匿名使用者

你這全是亂作的,怎麼寫啊

找我專業資料分析

9樓:匿名使用者

不會做就別亂做

我經常幫別人做這類的資料分析的

logistic回歸結果中walds值如何解讀解讀

10樓:匿名使用者

logistic回歸分析報告結果解讀分析

logistic回歸常用於分析二分類因變數(如存活和死亡、患病和未患病等)與多個自變數的關係。比較常用的情形是分析危險因素與是否發生某疾病相關聯。例如,若**胃癌的危險因素,可以選擇兩組人群,一組是胃癌組,一組是非胃癌組,兩組人群有不同的臨床表現和生活方式等,因變數就為有或無胃癌,即「是」或「否」,為二分類變數,自變數包括年齡、性別、飲食習慣、是否幽門螺桿菌感染等。

自變數既可以是連續變數,也可以為分類變數。通過logistic回歸分析,就可以大致了解胃癌的危險因素

SPSS中Logistic回歸分析結果常數項的OR值0 這

小小於0就是個保護性因素,先要看b值。如 你的子女個數是 1.094,那or值小於1的話就是個保護性因素,結論解釋就需要根據你賦值來下。請問 在spss中,有序logistic回歸分析的or值怎麼得出?或者是要手動算出嗎?用spssau可以檢視or值,同時輸出有智慧型文字分析 or值在spss裡面通...

如何用SPSS做logistic回歸分析

開啟資料以後,選單欄上依次點選 analyse regression binary logistic,開啟二分回歸對話方塊 2將因變數和自變數放入格仔的列表裡,如圖所示,上面的是因變數,下面的是自變數,我們看到這裡有三個自變數 設定回歸方法,這裡選擇最簡單的方法 enter,它指的是將所有的變數一次...

多因素非條件logistic回歸分析怎麼做

spss多因素非條抄 件logistic回歸 spss 多因素非條件logistic回歸分析 中的se b r p是什麼意思?spss多因素非條件logistic回歸分析中 se表示標準誤 b表示回歸係數 r表示擬合優度指標 p表示 p 1是危險因素 p 1保護因素 p 1該因素不起作用。1 sps...