最小值、最大值、全距

 

 

名稱

說明

最小值(minimum)

  • 一組資料中最小的數。

最大值(maximum)

  • 一組資料中最大的數。

全距

(range)

  • 一組資料中的最大值與最小值之差。

 

  • 最小值:min(x,na.rm=FALSE)

  • 最大值:max(x,na.rm=FALSE)

  • 全距 :range(x,na.rm=FALSE)

  •   註:在R中全距只給出最大最小值,並無直接計算後的結果。       

            參數說明:

  • x向量, 矩陣或數字資料。

  • na.rm在物件x中是否有缺失值(missing value)預設為FALSE

  •  

      下列為15位病人的Hamstring peak torque - concentric(簡寫為HTPC,單位:牛頓

     •米)資料,資料內容如下:

  • les1.HPTC:病人動過手術腳的量測的數據 。

  • norm1.HPTC:病人未動過手術腳的量測的數據。 

  • ratio=les/norm

      對判斷此筆資料,ratio為一合理的資訊來表示此筆資料的狀態,因此接下來我

   們所做的結果均是針對ratio來做討論,經程式計算後可得如下結果以及程式碼: 

           最小值=0.4333333;  最大值=1.666667;  全距=(0.4333333 1.6666667)

     

      例題程式碼:              

     > HPTC<-read.table("HPTC.txt", header=TRUE)---匯入資料

     > min(HPTC$ratio) ---求最小值

     [1] 0.4333333

      > max(HPTC$ratio) ---求最大值

     [1] 1.666667

      > range(HPTC$ratio) ---求全距

     [1] 0.4333333 1.6666667

     其中"HPTC$ratio" 為呼叫此資料表中"ratio" 向量的語法。


 

中位數、分位數

名稱

說明

中位數

(median)

  • 一組資料中處於中間位置之值,所有比它小和比它大的數具有相等的次數或機率。

  • 若資料個數為奇數,則中位數為第位之數。

  • 若資料個數為偶數,則中位數為第 位之值和第 位之值的平均值。

分位數

(quantile)

  • 第p分位數:某一點,對比小於或等於的值之機率大於或等於及對比大於或等於的值之機率大於或等於,則稱為第p分位數(pth quantile)。

  • 第 25分位數又稱為下四分位數。

  • 第 50分位數又稱為中位數。

  • 第 75分位數又稱為上四分位數

    內四分位數間距

(interquantile range)

  • 一組資料的上四分位數與下四分位數之差。

 

  • 中位數:median(x,na.rm=FALSE)

  • 分位數:quantile(x,probs=seq(0,1,0.25), na.rm=FALSE)

  • 內四分位數間距 IQR(x,na.rm=FALSE)

   參數說明:

  • probs:為一機率值的向量,即求出對應此機率值的分位數,預設機率值為0、0.25、0.5、0.75、1 對應的分位數分別為最小值、第一分位數、中位數、第三分位數、最大值。

  • 若沒給 "probs" 之指令,則會給出最小值,第一分位數、第二分位數、第三分位數以及最大值。

      同上例,

中位數=1.017544;            第一分位數=0.8643678;         

第三分位數=1.097097;     內四分位數間距=0.2327287。

     

      例題程式碼:

              > median(HPTC$ratio) ---中位數

            [1] 1.017544

             > quantile(HPTC$ratio,0.25) ---第一分位數

             25% 
             0.8643678 

              > IQR(HPTC$ratio) ---內四分位數間距

             [1] 0.2327287

 


 

變異數、標準差、共變異數、相關係數

 

 

名稱

說明

變異數

(variance)

  • 量測一組數據 離散程度的一種方式。

  • 表變異數 代表由樣本資料算出的變異數。

  • 計算方式如下:

  •  

    其中表數據樣本平均。

標準差

(standard deviation)

  • 量測一組數據 離散或散佈程度的一種方式。

  • 表標準差;以 表樣本標準差。

  • 計算方式如下:  

  •  

共變異數(covariance)

  • 二組數據 , 的一個統計量。

  • 代表由樣本資料算出的變異數。

  • 計算方式如下:

   

   其中分別代表數據樣本平均。

相關係數

(correlation coefficient)

  • 測量兩組數據之相依程度的方法。

  • 相關係數是一個介於 -1 與 1 之間的數。

  • 1表完全正相關;0表無相關;-1表完全負相關。

  • 計算方式如下:

           分別代表 的標準差。

  • 變異數 :var(x,na.rm=FALSE)

  • 共變異數:cov(x,y)

  • 標準差 :sd(x,na.rm=FALSE)

  • 相關係數:cor(x,y)

 

        同前例,並增加另一量測項目Hamstring peak torque -- eccentric (HTPE),資料

   內容如下:

(HTPE)=0.1084051;  共變異數=0.04230503;  

      標準差(HTPE)=0.3292493;  相關係數=0.4575865。         

  

      例題程式碼:              

        > var(HPTE$ratio) ---變異數

          [1] 0.1084051

       > sd(HPTE$ratio) ---標準差

         [1] 0.3292493

         > cov(HPTE$ratio,HPTC$ratio) ---共變異數

         [1] 0.04230503

         > cor(HPTE$ratio,HPTC$ratio) ---相關係數

         [1] 0.4575865

 

 


 

其他相關指令

  • 摘要:summary( 變數名稱 )

  •      列出最小值、第一分位數、中位數、平均值、第三分位數、最大值

             以及遺失值個數。

  • 總和:sum( 變數名稱 )

  • 平均:mean( 變數名稱 )