當前位置:首頁>生活> 相關(guān)系數(shù)r的計算公式
發(fā)布時間:2025-10-28閱讀( 17)
|
相關(guān)系數(shù)(Correlation coefficient)是用來衡量兩個變量之間相關(guān)程度的一個統(tǒng)計量。通俗的說,相關(guān)系數(shù)是用來刻畫兩個變量之間相互關(guān)聯(lián)關(guān)系的強度與方向的。本文將詳細介紹相關(guān)系數(shù)的定義、計算公式以及其在實際應(yīng)用中的運用。
一、相關(guān)系數(shù)的定義 在數(shù)學(xué)和統(tǒng)計學(xué)中,相關(guān)系數(shù)通常用來描述兩個變量之間的線性關(guān)系。它的取值范圍通常在[-1,1]之間,其值越接近于1或-1,則表明兩個變量之間的線性關(guān)系越緊密。當相關(guān)系數(shù)為0時,則表明兩個變量之間不存在線性關(guān)系。 相關(guān)系數(shù)的正負號通常表明了兩個變量之間的方向關(guān)系。如果相關(guān)系數(shù)為正,則表明當一個變量變大時,另一個變量也隨之增加。反之,如果相關(guān)系數(shù)為負,則表明當一個變量變大時,另一個變量會減小。 相關(guān)系數(shù)通常使用 r 這個符號來表示,其計算公式如下: r= (n∑xy-∑x∑y) ÷ ((n∑x^2-(∑x)^2)(n∑y^2-(∑y)^2))^1/2 其中,x和 y 分別代表兩個變量(或兩個賦值列),n代表數(shù)據(jù)樣本的數(shù)量,∑xy代表x和y對應(yīng)的數(shù)據(jù)乘積之和,∑x和∑y分別表示x和y的數(shù)據(jù)之和,∑x^2與∑y^2分別代表x和y每個數(shù)據(jù)的平方和。 相關(guān)系數(shù)的值通常是[-1,1]之間的實數(shù),當相關(guān)系數(shù)為 1 時,表明兩個變量之間的線性關(guān)系緊密、正相關(guān);當相關(guān)系數(shù)為 0 時,表明兩個變量之間不存在線性關(guān)系或只存在很弱的線性關(guān)系;當相關(guān)系數(shù)為 -1 時,表明兩個變量之間的線性關(guān)系緊密,但是是負相關(guān)。
二、相關(guān)系數(shù)的計算方法 計算相關(guān)系數(shù)的方法根據(jù)給定數(shù)據(jù)的形式(原始數(shù)據(jù)或數(shù)據(jù)表)和數(shù)據(jù)集的大?。颖净蚩傮w)有所不同。在這里我們將詳細介紹兩種計算方法。 1、原始數(shù)據(jù)計算法 在原始數(shù)據(jù)計算法中,我們需要先計算兩個變量的均值,然后計算兩列數(shù)據(jù)的協(xié)方差,最后再用協(xié)方差除以兩個變量的標準差的乘積得到相關(guān)系數(shù) r。 該方法的計算公式如下: r = ∑(x- x') (y- y') ÷ [ (∑(x- x')^2∑(y- y')^2)^(1/2)] 其中,x和y分別表示兩個變量的數(shù)據(jù)集,x'和y'分別表示兩個變量的均值。 舉例來說,假如我們要計算一個公司的銷售額與廣告投入之間的相關(guān)系數(shù)。我們收集到了公司過去一段時間的銷售額和廣告費用(如下表所示):
步驟1:計算兩個數(shù)據(jù)的均值: x' = (100 110 105 120 115 125 130) / 7 = 114 y' = (50 55 60 72 68 75 80) / 7 = 64 步驟2:計算兩個數(shù)據(jù)的協(xié)方差 s = ∑(x- x') (y- y') ÷ (n - 1) = [(100-114) × (50-64) (110-114) × (55-64) (105-114) × (60-64) (120-114) × (72-64) (115-114) × (68-64) (125-114) × (75-64) (130-114) × (80-64)] /6 = 186.86 步驟3:計算標準差 sx =[(∑(x- x')^2)/(n-1)] ^1/2 =[((100-114)^2 (110-114)^2 (105-114)^2 (120-114)^2 (115-114)^2 (125-114)^2 (130-114)^2)/6]^(1/2) = 9.83, sy =[(∑(y- y')^2)/(n-1)]^1/2 =[((50-64)^2 (55-64)^2 (60-64)^2 (72-64)^2 (68-64)^2 (75-64)^2 (80-64)^2)/6]^(1/2) = 8.77. 步驟 4:計算相關(guān)系數(shù) r=s/(sx sy)= 0.95 從上面的數(shù)據(jù)計算結(jié)果來看,該公司的銷售額和廣告費用之間存在著很強的正相關(guān)性。 2、數(shù)據(jù)表計算法 在數(shù)據(jù)表計算法中,我們需要先計算每個變量的平均數(shù)和標準差,然后計算兩列數(shù)據(jù)的協(xié)方差,最后再用協(xié)方差除以兩個變量的標準差的乘積得到相關(guān)系數(shù)。計算公式如下: r = cov(x,y) / (std(x) * std(y)) 其中,cov(x,y)代表兩個變量的協(xié)方差,std(x)和std(y)分別代表兩個變量的標準差。
三、相關(guān)系數(shù)的應(yīng)用 相關(guān)系數(shù)在統(tǒng)計學(xué)上的應(yīng)用極其廣泛,對數(shù)據(jù)分析有重要的幫助。有以下幾個方面的應(yīng)用: 1、判斷變量之間的相關(guān)性 通過計算相關(guān)系數(shù),我們可以確定兩個變量之間的相關(guān)性。如果相關(guān)系數(shù)大于0,表明兩個變量之間存在正相關(guān)關(guān)系;如果相關(guān)系數(shù)小于0,則表明兩個變量之間存在負相關(guān)關(guān)系;如果相關(guān)系數(shù)等于0,則表明兩個變量之間不存在線性相關(guān)關(guān)系。 2、用于多元回歸和線性回歸分析 在多元回歸和線性回歸分析中,相關(guān)系數(shù)可以用來判斷自變量和因變量之間的關(guān)系。例如,我們可以使用相關(guān)系數(shù)來判斷傳統(tǒng)電視廣告投入與電視機收視人數(shù)之間的相關(guān)性,以及這兩個因素如何對銷售額產(chǎn)生影響。 3、用于探索性數(shù)據(jù)分析 相關(guān)系數(shù)也有助于探索性數(shù)據(jù)分析,可以幫助觀察員們了解變量之間的相互關(guān)系,從而有助于數(shù)據(jù)分析員們發(fā)現(xiàn)新的變量之間的關(guān)系,尤其是那些不容易被發(fā)現(xiàn)的變量。 |
歡迎分享轉(zhuǎn)載→ http://m.avcorse.com/read-730560.html
Copyright ? 2024 有趣生活 All Rights Reserve吉ICP備19000289號-5 TXT地圖HTML地圖XML地圖