統計學中相關係數多少判斷相關性,相關係數越大,說明兩個變數之間的關係就越強嗎

2021-07-01 06:37:51 字數 5440 閱讀 7679

1樓:匿名使用者

相關係數是用以反映變數之間相關關係密切程度的統計指標。相關係數是按積差方法計算,同樣以兩變數與各自平均值的離差為基礎,通過兩個離差相乘來反映兩變數之間相關程度;著重研究線性的單相關係數。相關關係是一種非確定性的關係,相關係數是研究變數之間線性相關程度的量。

由於研究物件的不同,相關係數有如下幾種定義方式。  簡單相關係數:又叫相關係數或線性相關係數,一般用字母p表示,是用來度量變數間的線性關係的量。

  復相關係數:又叫多重相關係數。複相關是指因變數與多個自變數之間的相關關係。

例如,某種商品的季節性需求量與其**水平、職工收入水平等現象之間呈現複相關關係。  典型相關係數:是先對原來各組變數進行主成分分析,得到新的線性關係的綜合指標,再通過綜合指標之間的線性相關係數來研究原各組變數間相關關係。

依據相關現象之間的不同特徵,其統計指標的名稱有所不同。如將反映兩變數間線性相關關係的統計指標稱為相關係數(相關係數的平方稱為判定係數);將反映兩變數間曲線相關關係的統計指標稱為非線性相關係數、非線性判定係數;將反映多元線性相關關係的統計指標稱為復相關係數、復判定係數等。

2樓:嘉芸佛駿琛

迴歸係數b乘以x和y變數的標準差之比結果為相關係數r。即b*σx/σy=r

相關係數越大,說明兩個變數之間的關係就越強嗎

3樓:月似當時

樣本的簡單相關係數一般用r表示,計算公式為:

r 的絕對值越大表明相關性越強,要注意的是這裡並不存在因果關係。若r=0,表明兩個變數間不是線性相關,但有可能是其他方式的相關(比如曲線方式)。

利用樣本相關係數推斷總體中兩個變數是否相關,可以用t 統計量對總體相關係數為0的原假設進行檢驗。若t 檢驗顯著,則拒絕原假設,即兩個變數是線性相關的;若t 檢驗不顯著,則不能拒絕原假設,即兩個變數不是線性相關。

擴充套件資料

一些實際工作者用非居中的相關係數(與pearson係數不相相容)。

例如:假設五個國家的國民生產總值分別是1、2、3、5、8(單位10億美元),又假設這五個國家的貧困比例分別是11%、12%、13%、15%、18%。

則有兩個有序的包含5個元素的向量x、y:x = (1, 2, 3, 5, 8) 、 y = (0.11, 0.

12, 0.13, 0.15, 0.

18) 使用一般的方法來計算向量間夾角(參考數量積)。

上面的資料實際上是選擇了一個完美的線性關係:y

= 0.10 + 0.01 x。因此皮爾遜相關係數應該就是1。

把資料居中(x中資料減去 e(x) = 3.8 ,y中資料減去e(y) =

0.138)後得到:x = (−2.

8, −1.8, −0.8, 1.

2, 4.2)、 y = (−0.028, −0.

018, −0.008,

0.012, 0.042)。

4樓:禾鳥

相關係數越大,說明兩個變數之間的關係就越強。當相關係數為1時,兩個變數其實就是一次函式關係。

相關係數介於0與1之間,用以反映變數之間相關關係密切程度的統計指標。相關係數是按積差方法計算,同樣以兩變數與各自平均值的離差為基礎,通過兩個離差相乘來反映兩變數之間相關程度;著重研究線性的單相關係數。

相關係數是最早由統計學家卡爾·皮爾遜設計的統計指標,是研究變數之間線性相關程度的量,一般用字母 r 表示。由於研究物件的不同,相關係數有多種定義方式,較為常用的是皮爾遜相關係數。

擴充套件資料

(1)相關係數的應用

1、概率論

例:若將一枚硬幣拋n次,x表示n次試驗中出現正面的次數,y表示n次試驗中出現反面的次數。計算ρxy。

解:由於x+y=n,則y=-x+n,根據相關係數的性質推論,得ρxy = − 1。

2、企業物流

例:一種新產品上市,在上市之前,公司的物流部需把新產品合理分配到全國的10個倉庫,新品上市一個月後,要評估實際分配方案與之前考慮的其他分配方案中,是實際分配方案好還是其中尚未使用的分配方案更好。

通過這樣的評估,可以在下一次的新產品上市使用更準確的產品分配方案,以避免由於分配而產生的積壓和斷貨。表1是根據實際資料所列的數表。

通過計算,很容易得出這3個分配方案中,b的相關係數是最大的,這樣就評估到b的分配方案比實際分配方案a更好,在下一次的新產品上市分配計劃中,就可以考慮用b這種分配方法來計算實際分配方案。

3、聚類分析

例:如果有若干個樣品,每個樣品有n個特徵,則相關係數可以表示兩個樣品間的相似程度。藉此,可以對樣品的親疏遠近進行距離聚類。

例如9個小麥品種(分別用a1,a2,...,a9表示)的6個性狀資料見表2,作相關係數計算並檢驗。

由相關係數計算公式可計算出6個性狀間的相關係數,分析及檢驗結果見表3。由表3可以看出,冬季分櫱與每穗粒數之間呈現負相關(ρ = − 0.8982),即麥冬季分櫱越多,那麼每穗的小麥粒數越少,其他性狀之間的關係不顯著。

(2)相關係數的缺點:

需要指出的是,相關係數有一個明顯的缺點,即它接近於1的程度與資料組數n相關,這容易給人一種假象。

因為,當n較小時,相關係數的波動較大,對有些樣本相關係數的絕對值易接近於1;當n較大時,相關係數的絕對值容易偏小。特別是當n=2時,相關係數的絕對值總為1。因此在樣本容量n較小時,我們僅憑相關係數較大就判定變數x與y之間有密切的線性關係是不妥當的。

5樓:西域牛仔王

相關係數介於 -1 與 1 之間,是衡量兩個變數之間線性關係程度的量,

相關係數越大,說明兩個變數之間的線性關係越強。

當相關係數為 1 時,兩個變數其實就是一次函式關係。

6樓:匿名使用者

相關性的強度確實是用相關係數的大小來衡量的,但相關大小的評價要以相關係數顯著性的評價為前提,我們首先應該檢驗相關係數的顯著性,如果顯著,證明相關係數有統計學意義,下一步再來看相關係數大小,如果相關係數沒有統計學意義,那意味著你研究求得的相關係數也許是抽樣誤差或者測量誤差造成的,再進行一次研究結果可能就大不一樣,此時討論相關性強弱的意義就大大減弱了。

在滿足相關係數顯著的條件下,相關係數越大,相關性就越強,這沒錯

7樓:獨梅印血

強強強強強強強強強強強強強強強強強強強強強強強強強強強強

統計學中,相關係數r不等於0,就一定相關嗎

8樓:房老師

答:【1】相關係數 r , 不等於0 ,也不一定相關。

【2】不同的二元方程的兩個變數的相關性,會給出其相關係數呈相關關係的判定值。

9樓:高中數學莊稼地

相關係數|r|<=1,

r=0時,q誤差最大,說明不線性相關

r不為0時,線性相關,但線性相關程度不同,|r|=1時,線性相關程度最高

越接近0,線性相關性越差。

相關係數多少算具有相關性?

10樓:我是一個麻瓜啊

相關係數是最早由統計學家卡爾·皮爾遜設計的統計指標,是研究變數之間線性相關程度的量,一般用字母 r 表示。由於研究物件的不同,相關係數有多種定義方式,較為常用的是皮爾遜相關係數。

相關係數r的絕對值一般在0.8以上,認為a和b有強的相關性。0.3到0.8之間,可以認為有弱的相關性。0.3以下,認為沒有相關性。

擴充套件資料

相關表和相關圖可反映兩個變數之間的相互關係及其相關方向,但無法確切地表明兩個變數之間相關的程度。相關係數是用以反映變數之間相關關係密切程度的統計指標。相關係數是按積差方法計算,同樣以兩變數與各自平均值的離差為基礎,通過兩個離差相乘來反映兩變數之間相關程度;著重研究線性的單相關係數。

需要說明的是,皮爾遜相關係數並不是唯一的相關係數,但是最常見的相關係數,以下解釋都是針對皮爾遜相關係數。

依據相關現象之間的不同特徵,其統計指標的名稱有所不同。如將反映兩變數間線性相關關係的統計指標稱為相關係數(相關係數的平方稱為判定係數);將反映兩變數間曲線相關關係的統計指標稱為非線性相關係數、非線性判定係數;將反映多元線性相關關係的統計指標稱為復相關係數、復判定係數等。

11樓:米飯紅燒排骨

在說明變數之間線性相關程度時,根據經驗,按照相關係數的大小將相關程度分為以下幾種情況:|rl≥0.8時,可視為兩個變數之間高度相關;0.

5≤|rl<0.8時,可視為中度相關;0.3≤|rl<0.

5時,視為低度相關; |rl<0.3時,說明兩個變數之間的相關程度極弱,可視為不相關。

在實際問題中,相關係數一般都是用樣本資料計算得到的,因而帶有一定的隨機性,尤其 是樣本容量比較小時,這種隨機性更大,此時,用樣本相關係數估計總體相關係數可信度會受到很大質疑,也就是說,樣本相關係數並不能說明樣本來自的兩個總體是否具有顯著線性關係。因此,需要對其進行統計推斷,通過檢驗的方法確定變數之間是否存在相關性,即要對總體相關係數ρ=0進行顯著性檢驗。

在x. y都服從正態分佈,及原假設(ρ= 0)為真時,統計量服從自由度為n-2的t分佈。當|t|>+(或p——  汪冬華《多元統計分析與spss應用》

相關係數怎麼計算

12樓:註冊會計師

相關係數介於區間[-1,1]內。當相關係數為-1,表示完全負相關,表明兩項資產的收益率變化方向和變化幅度完全相反。當相關係數為+1時,表示完全正相關,表明兩項資產的收益率變化方向和變化幅度完全相同。

當相關係數為0時,表示不相關。

13樓:小鬍子不是我

若y=a+bx,則有:

令e(x) = μ,d(x) = σ

則e(y) = bμ + a,d(y) = bσe(xy) = e(ax + bx) = aμ + b(σ + μ)cov(x,y) = e(xy) − e(x)e(y) = bσ相關係數相關表和相關圖可反映兩個變數之間的相互關係及其相關方向,但無法確切地表明兩個變數之間相關的程度。於是,著名統計學家卡爾·皮爾遜設計了統計指標--相關係數(correlation coefficient)。相關係數是用以反映變數之間相關關係密切程度的統計指標。

相關係數是按積差方法計算,同樣以兩變數與各自平均值的離差為基礎,通過兩個離差相乘來反映兩變數之間相關程度;著重研究線性的單相關係數。

依據相關現象之間的不同特徵,其統計指標的名稱有所不同。如將反映兩變數間線性相關關係的統計指標稱為相關係數(相關係數的平方稱為判定係數);將反映兩變數間曲線相關關係的統計指標稱為非線性相關係數、非線性判定係數;將反映多元線性相關關係的統計指標稱為復相關係數、復判定係數等。

缺點

需要指出的是,相關係數有一個明顯的缺點,即它接近於1的程度與資料組數n相關,這容易給人一種假象。因為,當n較小時,相關係數的波動較大,對有些樣本相關係數的絕對值易接近於1;當n較大時,相關係數的絕對值容易偏小。特別是當n=2時,相關係數的絕對值總為1。

因此在樣本容量n較小時,我們僅憑相關係數較大就判定變數x與y之間有密切的線性關係是不妥當的。

eviews中做自相關係數和偏自相關係數函式的具體步驟是怎樣的

workfile中點開你需要觀測的序列視窗,左上側view correlogram ok,得到自相關和偏相關 用eviews如何求自相關和偏自相關函式?開啟你要計算的序列,view correlogram eviews中怎麼判斷是不是白雜訊序列,自相關函式和偏自相關函式如圖所示,這樣算白雜訊嗎 ac...

相關係數的正負問題,相關係數的正負問題

家都知道,在我們國家南方的環境相差是非常大的,在南風環境四季如春,而在北方卻內是四季分明 同容時受到氣候的影響所種植的水果也會受到變化,很多水果都是在某個特定的區域才會有,所以很多北方人經常吃的食物,可能南方人見都沒有見過,而今天菡菡分享給大家的則是南方經常見到的水果,因為數量實在太多了,爛在樹上沒...

協方差矩陣與相關係數矩陣,相關係數矩陣和協方差矩陣有什麼區別

不可能知道,除非你假設隨機變數的分布 可以考慮使用matlab命令實現 相關係數矩陣和協方差矩陣有什麼區別 相關係數矩 陣 相當於消除量綱的表示變數間相關性的乙個矩陣協方差矩陣 它是沒有消除量綱的表示變數間相關性的矩陣。你對比下它們的等式變換關係 r cov x,y d x d y 看看我的部落格 ...