جدول 4-2: شبيه سازي خطاي نوع اول براي مقايسه بردارهاي ميانگين نرمال سه متغيره 58
جدول 4-3: شبيه سازي خطاي نوع اول براي مقايسه بردارهاي ميانگين زمانيکه10 p= 60
فهرست نشانههاي اختصاري
GV: Generalized test variable

LRT: Likelihood ratio test
MANOVA: Multivariate analysis of variance
MNV: Modified Nel and Van der Merwe
PB: Parametric bootstrap
فصل اول: مقدمه
مفاهيم مقدمه
در اين فصل به معرفي نمادها و توزيعهاي آماري که در اين پايان نامه مورد استفاده است، ميپردازيم. همچنين آماره آزمون، توزيع آن و مقدار بحراني را تحت شرط معلوم بودن ماتريسهاي کوواريانس معرفي ميکنيم. اما به دليل مجهول بودن ماتريسهاي کوواريانس در اکثر مواقع، آماره آزمون را با فرض مجهول بودن ماتريسهاي کوواريانس معرفي خواهيم کرد.
1-1- آشنايي با نمادها

فرض کنيد Y_i1,…,Y_(?in?_i ) يک نمونه تصادفي از توزيع نرمال p – متغيره با بردار ميانگين ?_i و ماتريس کوواريانس ?_i , i=1,…,k باشد. همچنين فرض کنيد Y ?_i و S_i به ترتيب نشان دهنده بردار ميانگين و ماتريس کوواريانس نمونهاي باشند. يعني:
Y ?_i=1/n_i ?_(j=1)^(n_i)??Y_ij , S_i=1/(n_i-1) ?_(j=1)^(n_i)??(Y_ij-Y ?_i ) (Y_ij-Y ?_i )^’ , i=1,…,k??
(1-1-1)
? ?_i را به صورت ? ?_i=1/n_i ?_i تعريف ميکنيم به گونهاي که
Y ?_i~N_p (?_i,? ?_i ) .
به طور مشابه برآورد ? ?_i به صورت S ?_i=1/n_i S_i تعريف ميشود.

در این سایت فقط تکه هایی از این مطلب با شماره بندی انتهای صفحه درج می شود که ممکن است هنگام انتقال از فایل ورد به داخل سایت کلمات به هم بریزد یا شکل ها درج نشود

شما می توانید تکه های دیگری از این مطلب را با جستجو در همین سایت بخوانید

ولی برای دانلود فایل اصلی با فرمت ورد حاوی تمامی قسمت ها با منابع کامل

اینجا کلیک کنید

1-2- توزيع ويشارت
در اين بخش توزيع ويشارت (Anderson, 2003, p.252) و برخي از خواص آن را بررسي خواهيم کرد.
تعريف: فرض کنيد Z_1,…,Z_m يک نمونه تصادفي m تايي از توزيع N_p (0,?) باشند. توزيع ويشارت با m درجه آزادي و پارامتر ? را به صورت زير تعريف ميکنيم:
اگر A~?_(j=1)^m??Z_j Z_j^’ ? باشد، در اين صورت گوييم A داراي توزيع ويشارت با m درجه آزادي و پارامتر ? است و آن را با نماد A~W_p (m,?) نمايش ميدهيم.
اميد رياضي توزيع ويشارت به صورت زير محاسبه ميشود:
E(A)=?_(j=1)^m?E(Z_j Z_j^’ ) =m?
قضيه 1-2-1: اگر A_1~W_p (m_1,?) و A_2~W_p (m_2,?) و از يکديگر مستقل باشند، آنگاه A_1+A_2~W_p (m,?) به گونهاي که m=m_1+m_2 است.
اثبات: طبق تعريف ميتوان A_1 و A_2 را بفرم زير نمايش داد:
A_1~?_(j=1)^(m_1)??Z_j Z_j^’ ?
A_2~?_(j=m_1+1)^(m_1+m_2)??Z_j Z_j^’ ?
به گونهاي که Z_1,…,Z_(m_1+m_2 ) مستقل از يکديگر هستند و داراي توزيع N_p (0,?) ميباشند. بنابراين
A_1+A_2~?_(j=1)^(m_1+m_2)??Z_j Z_j^’=?_(j=1)^m??Z_j Z_j^’ ?? .
قضيه 1-2-2: اگر Y_1,…,Y_n بردارهاي تصادفي مستقل و همتوزيع با N_p (?,?),(n>p) باشند، در اين صورت A=?_(j=1)^n??(Y_j-Y ? ) (Y_j-Y ? )^’~?_(j=1)^(n-1)??Z_j Z_j^’ ?? است به گونهاي که Z_1,…,Z_(n-1) مستقل از يکديگر و داراي توزيع مشترک N_p (0,?) ميباشند. بنابراين A داراي توزيع ويشارت با n-1 درجه آزادي و پارامتر ? است.
اثبات: به پيوست مراجعه شود.
بنابراين براساس قضيه 1-2-2 نتيجه ميشود که
S_i~W_p (n_i-1, 1/(n_i-1) ?_i )
بنابراين
S ?_i~W_p (n_i-1, 1/(n_i-1) ? ?_i )
مسئله مورد علاقه در اين پايان نامه، آزمون کردن
H_0:?_1=…=?_k vs H_1:?_i??_j ? i?j
براساس آمارههاي بسنده مينيمال بردار ميانگين و ماتريس کوواريانس نمونهاي است.
فرض کنيد Y ?=(Y ?_1^’,…,Y ?_k^’ )^’، S ?=diag(S ?_1,…,S ?_k )، ?=(?_1^’,…,?_k^’ )^’ و ?=diag(? ?_1,…,? ?_k ) باشند. تحت فرض برابري بردارهاي ميانگين، ?_0 را بردار مشترک ?_i ها در نظر بگيريد.
1-3- آماره آزمون
در اين بخش ابتدا آماره آزمون را تحت فرض معلوم بودن ماتريسهاي کوواريانس و سپس تحت فرض مجهول بودن ماتريسهاي کوواريانس، مييابيم.
1-3-1-آماره آزمون نسبت درستنمايي تحت فرض معلوم بودن ماتريسهاي کوواريانس

در اين قسمت ابتدا برآورد ماکزيمم درستنمايي ?_0 را تحت فرض ?_0 و با فرض معلوم بودن ماتريسهاي کوواريانس محاسبه ميکنيم. بدين منظور تابع درستنمايي عبارت است از:
L(?_0 )=f(y_i1,…,y_(?in?_i ) )=?_(i=1)^k??_(j=1)^(n_i)??(2?)^((-p)/2) |?_i |^((-1)/2) ? exp{-1/2 (y_ij-?_0 )^’ ?-
? ?_i^(-1) (y_ij-?_0 )} (1-3-1)
و بنابراين لگاريتم تابع درستنمايي به صورت زير ميباشد:
ln??L(?_0 )=(-p)/2 ?_(i=1)^k??n_i ln?(2?) ?+?_(i=1)^k??-n_i/2 ln?|?_i | ?-1/2 ?_(i=1)^k??_(j=1)^(n_i)?(y_ij-?_0 )^’ ?
?_i^(-1) (y_ij-?_0 )
حال از رابطه فوق نسبت به بردار ?_0 مشتق ميگيريم و مساوي با صفر قرار ميدهيم:
(? ln?L(?_0 ))/(??_0 )=-1/2 ?_(i=1)^k??_(j=1)^(n_i)?(-2?_i^(-1) y_ij+2?_i^(-1) ?_0 ) =0
بنابراين با توجه به تعريف ? ?_i برآورد ماکزيمم درستنمايي بردار ?_0 عبارت است از:
? ?_0=(?_(i=1)^k?? ?_i^(-1) )^(-1) ?_(i=1)^k??? ?_i^(-1) Y ?_i ? (1-3-2)
توجه شود برآورد فوق بهترين برآوردگر نااريب خطي براي ?_0 ميباشد.
در اين مرحله با استفاده از روش LR آماره آزمون را بدست ميآوريم. فضاي پارامتري تحت فرض صفر و در حالت کلي به صورت زير تعريف ميشود:
?={(?_1,…,?_k ):?_i?R^p,i=1,…,k}
?_0={(?_1,…,?_k ):?_i=?_0?R^p, i=1,…,k}
تابع درستنمايي و لگاريتم آن به صورت زير ميباشد:
L(?_1,…,?_k )=?_(i=1)^k??_(j=1)^(n_i)??(2?)^((-p)/2) |?_i |^((-1)/2) exp{-1/2 (y_ij-?_i )^’ ?_i^(-1) (y_ij-?_i )} ?
ln??L(?_1,…,?_k )=-p/2 ?_(i=1)^k??n_i ln?(2?) ?-?_(i=1)^k??n_i/2 ln?|?_i | ??
-1/2 ?_(i=1)^k??_(j=1)^(n_i)??(y_ij-?_i )^’ ?_i^(-1) (y_ij-?_i ) ? .
فرض کنيد g(?_i )=-1/2 ?_(i=1)^k??_(j=1)^(n_i)??(y_ij-?_i )^’ ?_i^(-1) (y_ij-?_i ) ? باشد. بنابراين:
?g(?_i )/(??_i )=-1/2 ?_(j=1)^(n_i)?(-2?_i^(-1) y_ij+2?_i^(-1) ?_i ) =0
پس برآورد درستنمايي ?_i به صورت زير ميباشد:
? ?_i=Y ?_i , i=1,…,k .
تحت فرض برابري بردارهاي ميانگين تابع درستنمايي و برآورد ماکزيمم درستنمايي ?_0 به ترتيب با روابط ( 1-3-1 ) و ( 1-3-2 ) برابر است. بنابراين آماره آزمون عبارت است از:
?=(?sup?_(?_0 ) L(?_1,…,?_k ))/(?sup?_? L(?_1,…,?_k ) )
=exp{-1/2 ?_(i=1)^k??_(j=1)^(n_i)??[y_ij (?_(i=1)^k?? ?_i^(-1) )^(-1) ?_(i=1)^k??? ?_i^(-1) y ?_i ?]^’ ?_i^(-1) [y_ij (?_(i=1)^k?? ?_i^(-1) )^(-1) ?_(i=1)^k??? ?_i^(-1) y ?_i ?] ?}/exp{-1/2 ?_(i=1)^k??_(j=1)^(n_i)??(y_ij-y ?_i )^’ ?_i^(-1) (y_ij-y ?_i ) ?}
=exp{-1/2 ?_(i=1)^k?(y ?_i^’ ? ?_i^(-1)-2y ?_i^’ ? ?_i^(-1) ? ?_0+? ?_0^’ ? ?_i^(-1) ? ?_0 ) }
=exp{-1/2 ?_(i=1)^k??(y ?_i-? ?_0 )^’ ? ?_i^(-1) (y ?_i-? ?_0 ) ?}
براساس آزمون نسبت درستنمايي فرض برابري بردارهاي ميانگين رد ميشود اگر:
exp{-1/2 ?_(i=1)^k??(y ?_i-? ?_0 )^’ ? ?_i^(-1) (y ?_i-? ?_0 ) ?}<?_0
و يا به طور معادل
?_(i=1)^k??(y ?_i-? ?_0 )^’ ? ?_i^(-1) (y ?_i-? ?_0 ) ?>c
بنابراين آماره آزمون با فرض معلوم بودن ماتريسهاي کوواريانس به صورت زير ميباشد:
?(Y ?_i;? ?_i )=?_(i=1)^k??(Y ?_i-? ?_0 )^’ ? ?_i^(-1) (Y ?_i-? ?_0 ) ?
=?_(i=1)^k?(Y ?_i^’ ? ?_i^(-1) Y ?_i-2? ?_0^’ ? ?_i^(-1) Y ?_i+? ?_0^’ ? ?_i^(-1) ? ?_0 )
براي پيدا کردن c احتياج داريم توزيع ? را تحت فرض صفر بيابيم.
با جايگذاري برآوردگر محاسبه شده در رابطه ( 1-3-2 ) براي ?_0، آماره آزمون به صورت زير ساده ميشود:
?(Y ?_i;? ?_i )=?_(i=1)^k??Y ?_i^’ ? ?_i^(-1) Y ?_i ?-(?_(i=1)^k??? ?_i^(-1) Y ?_i ?)^’ (?_(i=1)^k?? ?_i^(-1) )^(-1) (?_(i=1)^k??? ?_i^(-1) Y ?_i ?)
=Y ?^’ ?^(-1) Y ?-Y ?^’ ?^(-1) J(J^’ ?^(-1) J)^(-1) J^’ ?^(-1) Y ?
=Y ?^’ ?^((-1)?2) [?_kp-?^((-1)?2) J(J^’ ?^(-1) J)^(-1) J^’ ?^((-1)?2) ] ?^((-1)?2) Y ? (1-3-3)
به گونهاي که J=(?_p,…,?_p )_(kp×p)^’ است. فرض کنيد ?=[?_kp-?^((-1)?2) J(J^’ ?^(-1) J)^(-1) J^’ ?^((-1)?2) ] باشد. با توجه به اينکه
?^((-1)?2) J(J^’ ?^(-1) J)^(-1) J^’ ?^((-1)?2) ?^((-1)?2) J(J^’ ?^(-1) J)^(-1) J^’ ?^((-1)?2)
=?^((-1)?2) J(J^’ ?^(-1) J)^(-1) J^’ ?^(-1) J(J^’ ?^(-1) J)^(-1) J^’ ?^((-1)?2)
=?^((-1)?2) J(J^’ ?^(-1) J)^(-1) J^’ ?^((-1)?2)
پس ماتريس ? يک ماتريس خودتوان است و چون متقارن نيز ميباشد، با توجه به قضيه 1 پيوست
rank(?)=trace(?)=p(k-1)
از طرفي با توجه به اينکه Y ?_i~N_p (?_i,? ?_i )، نتيجه ميشود که Y ?~N_kp (?,?) و بنابراين
?^((-1)?2) Y ?~N_kp (?^((-1)?2) ?,?_kp ).
بنابراين براساس قضيه 2 پيوست ?(Y ?_i;? ?_i ) داراي توزيع کاي اسکور نامرکزي با درجه آزادي p(k-1) و پارامتر نامرکزيت 1/2 ?^’ ?^((-1)?2) ??^((-1)?2) ? ميباشد.
پارامتر نامرکزيت توزيع کاي اسکور را ميتوان به صورت زير نوشت:
1/2 ?^’ ?^((-1)?2) ??^((-1)?2) ?=1/2 ?_(i=1)^k??(?_i-?_0 )^’ ? ?_i^(-1) (?_i-?_0 ) ?
بنابراين تحت فرض برابري بردارهاي ميانگين آماره ?(Y ?_i;? ?_i ) توزيع کاي اسکور مرکزي دارد و در نتيجه k برابر با چندک (1-?)- ام توزيع کاي اسکور با درجه آزادي p(k-1) ميباشد.
1-3-2- آماره آزمون تحت فرض مجهول بودن ماتريسهاي کوواريانس

در اين قسمت به معرفي آماره آزمون تحت فرض مجهول بودن ماتريسهاي کوواريانس ميپردازيم. بدين منظور در آماره ?(Y ?_i,? ?_i ) که در قسمت قبل محاسبه شد، S ?_i را جايگزين ? ?_i ميکنيم تا آماره ?(Y ?_i,S ?_i ) به دست آيد. فرض کنيد W_i=S ?_i^(-1),i=1,…,k و W=?_(i=1)^k?W_i باشد. در اين صورت برآوردگر ?_0 را به صورت زير تعريف ميکنيم:
? ?_0^*=W^(-1) ?_(i=1)^k??W_i Y ?_i ?
در نتيجه آماره آزمون عبارت است از:
?(Y ?_i;S ?_i )=?_(i=1)^k??(Y ?_i-? ?_0^* )^’ W_i (Y ?_i-? ?_0^* ) ?
=?_(i=1)^k??Y ?_i^’ W_i Y ?_i ?-(?_(i=1)^k??W_i Y ?_i ?)^’ W^(-1) (?_(i=1)^k??W_i Y ?_i ?) (1-3-4)
استفاده از آماره فوق به منظور انجام آزمون برابري بردارهاي ميانگين، مستلزم اطلاع از توزيع آماره ?(Y ?_i;S ?_i ) ميباشد که به دليل مشکل بودن يافتن توزيع آماره فوق، از آزمونهاي تقريبي که در فصلهاي آينده معرفي خواهد شد، استفاده ميکنيم.
فصل دوم: مقايسه بردارهاي ميانگين دو جامعه نرمال
مقايسه بردارهاي ميانگين دو جامعه نرمال
در اين فصل به منظور آشنايي بيشتر با مفاهيم گفته شده در فصل اول، به بررسي آزمونهاي مربوط به برابري بردارهاي ميانگين دو جامعه نرمال ميپردازيم.
فرض کنيد Y_i1,…,Y_(?in?_i ) يک نمونه تصادفي از توزيع نرمال p – متغيره با بردار ميانگين ?_i و ماتريس کوواريانس ?_i , i=1,2 باشد. همچنين فرض کنيد Y ?_i و S_i به ترتيب نشان دهنده بردار ميانگين و ماتريس کوواريانس نمونهاي باشند. يعني:
Y ?_i=1/n_i ?_(j=1)^(n_i)??Y_ij , S_i=1/(n_i-1) ?_(j=1)^(n_i)??(Y_ij-Y ?_i ) (Y_ij-Y ?_i )^’ , i=1,2??
آزمون زير را درنظر بگيريد:
?_0:?_1=?_2 vs ?_a:?_1??_2
2-1- آزمون ?^2- هتلينگ زمانيکه ?_1=?_2

در اين بخش از روش نسبت درستنمايي به منظور به دست آوردن آماره آزمون استفاده ميکنيم.
فضاي پارامتري تحت فرض صفر و در حالت کلي به صورت زير تعريف ميشود:
?={(?_1,?_2,?):?_i?R^p,i=1,2 , ? is a positive definite matrix}
?_0={(?_1,?_2,?):?_1=?_2=??R^p , ? is a positive definite matrix}
تابع درستنمايي به صورت زير ميباشد:
L(?_1,?_2,?)=?_(i=1)^2??_(j=1)^(n_i)??(2?)^((-p)/2) |?|^((-1)/2) exp{-1/2 (y_ij-?_i )^’ ?^(-1) (y_ij-?_i )} ?
=?_(i=1)^2??(2?)^((-pn_i)/2) |?|^((-n_i)/2) exp{-1/2 ?_(j=1)^(n_i)??(y_ij-?_i )^’ ?^(-1) (y_ij-?_i ) ?} ?
بنابراين برآورد درستنمايي ?_i و ? به صورت زير ميباشد:
? ?_i=Y ?_i , i=1,2 , ? ?=1/(n_1+n_2 ) ?_(i=1)^2??_(j=1)^(n_i)??(Y_ij-Y ?_i ) (Y_ij-Y ?_i )^’ ?
در نتيجه
?sup?_? L(?_1,?_2,?)=(2?)^((-(n_1+n_2 )p)/2) |? ? |^((-(n_1+n_2 ))/2) exp{(-(n_1+n_2 )p)/2}
اگر ?_1=?_2=? باشد، آنگاه
L(?_1,?_2,?)=?_(i=1)^2??(2?)^((-pn_i)/2) |?|^((-n_i)/2) exp{-1/2 ?_(j=1)^(n_i)??(y_ij-?)^’ ?^(-1) (y_ij-?) ?} ?
در اين حالت برآورد درستنمايي ? و ? به صورت زير ميباشد:
? ?=(n_1 Y ?_1+n_2 Y ?_2)/(n_1+n_2 )=(?_(i=1)^2??n_i Y ?_i ?)/(n_1+n_2 ) , ? ?_0=1/(n_1+n_2 ) ?_(i=1)^2??_(j=1)^(n_i)??(y_ij-? ? ) (y_ij-? ? )^’ ?
در نتيجه
?sup?_(?_0 ) L(?_1,?_2,?)=(2?)^((-(n_1+n_2 )p)/2) |? ?_0 |^((-(n_1+n_2 ))/2) exp{(-(n_1+n_2 )p)/2}
در اين صورت آماره آزمون عبارت است از:
?=(?sup?_(?_0 ) L(?_1,?_2,?))/(?sup?_? L(?_1,?_2,?) )=|? ?_0 |^((-(n_1+n_2 ))/2)/|? ? |^((-(n_1+n_2 ))/2) =|C|^((n_1+n_2)/2)/|C+(n_1 n_2)/(n_1+n_2 ) (Y ?_1-Y ?_2 ) (Y ?_1-Y ?_2 )^’ |^((n_1+n_2)/2)
به گونهاي که C=?_(i=1)^2??_(j=1)^(n_i)??(Y_ij-Y ?_i ) (Y_ij-Y ?_i )^’ ? ميباشد.
براساس آزمون نسبت درستنمايي فرض برابري بردارهاي ميانگين رد ميشود اگر:
|C|^((n_1+n_2)/2)/|C+(n_1 n_2)/(n_1+n_2 ) (Y ?_1-Y ?_2 ) (Y ?_1-Y ?_2 )^’ |^((n_1+n_2)/2) <?_0
و يا به طور معادل
|C|/|C+(n_1 n_2)/(n_1+n_2 ) (Y ?_1-Y ?_2 ) (Y ?_1-Y ?_2 )^’ | <?_1
براساس قضيه 3 پيوست
|C+(n_1 n_2)/(n_1+n_2 ) (Y ?_1-Y ?_2 ) (Y ?_1-Y ?_2 )^’ |
=|C+{?((n_1 n_2)/(n_1+n_2 )) (Y ?_1-Y ?_2 )} {?((n_1 n_2)/(n_1+n_2 )) (Y ?_1-Y ?_2 )}^’ |
=|C|(1+{?((n_1 n_2)/(n_1+n_2 )) (Y ?_1-Y ?_2 )}^’ C^(-1) {?((n_1 n_2)/(n_1+n_2 )) (Y ?_1-Y ?_2 )})
=|C|(1+(n_1 n_2)/(n_1+n_2 ) (Y ?_1-Y ?_2 )^’ C^(-1) (Y ?_1-Y ?_2 ))
با توجه به مطالب فوق آماره آزمون را ميتوان به صورت زير نوشت:
?=1/(1+(n_1 n_2)/(n_1+n_2 ) (Y ?_1-Y ?_2 )^’ C^(-1) (Y ?_1-Y ?_2 ) )=1/(1+(n_1 n_2)/(n_1+n_2 ) (Y ?_1-Y ?_2 )^’ (1/(n_1+n_2-2)) S_p^(-1) (Y ?_1-Y ?_2 ) )
=1/(1+?^2/(n_1+n_2-2))
به گونهاي که
S_p=1/(n_1+n_2-2) ?_(i=1)^2??_(j=1)^(n_i)??(Y_ij-Y ?_i ) (Y_ij-Y ?_i )^’ ?=((n_1-1) S_1+(n_2-1) S_2)/(n_1+n_2-2)
و
?^2=(n_1 n_2)/(n_1+n_2 ) (Y ?_1-Y ?_2 )^’ S_p^(-1) (Y ?_1-Y ?_2 ) (2-1-1)
فرض برابري بردارهاي ميانگين رد ميشود اگر:
1+?^2/(n_1+n_2-2)>?_2
و يا به صورت معادل
?^2>c .
مقدار ثابت c را به گونهاي تعيين ميکنيم که P_(?_0 ) (?^2>c)=? باشد. بدين منظور بايد از توزيع ?^2 اطلاع داشته باشيم.
قضيه 2-1-1: فرض کنيد ?^2=Y^’ S^(-1) Y باشد به گونهاي که Y~N_p (?,?) و nS~W_p (n,?). در اين صورت ?^2 (n-p+1)/np توزيع ? نامرکزي با درجات آزادي p و n-p+1 و پارامتر نامرکزيت ?^’ ?^(-1) ? دارد. اگر ?=0 باشد، ?^2 (n-p+1)/np داراي توزيع ? مرکزي است.
اثبات: به پيوست مراجعه شود.
نتيجه 2-1-1: براساس قضيه 2-1-1 و با توجه به اينکه
(n_1+n_2-2) S_p=(n_1-1) S_1+(n_2-1) S_2~W_p (n_1+n_2-2,?)
براي آماره معرفي شده در رابطه 2-1-1 تحت فرض ?_0:?_1=?_2 ميتوان گفت ?^2 (n_1+n_2-1-p)/(n_1+n_2-2)p داراي توزيع ? مرکزي با درجات آزادي p و n_1+n_2-1-p است.
بنابراين مقدار ثابت c را به صورت زير تعيين ميکنيم:
P_(?_0 ) (?^2>c)=P_(?_0 ) (?^2 (n_1+n_2-1-p)/(n_1+n_2-2)p>c (n_1+n_2-1-p)/(n_1+n_2-2)p)
=P_(?_0 ) (?_((p,n_1+n_2-1-p) )>c (n_1+n_2-1-p)/(n_1+n_2-2)p)=?
بنابراين
c= (n_1+n_2-2)p/(n_1+n_2-1-p) ?_((p,n_1+n_2-1-p;1-?) )
در نتيجه فرض برابري بردارهاي ميانگين رد ميشود اگر:
?^2>(n_1+n_2-2)p/(n_1+n_2-1-p) ?_((p,n_1+n_2-1-p;1-?) ) (2-1-2)
2-2- آزمون برابري ماتريسهاي کوواريانس

براي اينکه آزمون گفته شده در بخش قبل معتبر باشد بايستي فرض برابري ماتريسهاي کوواريانس برقرار باشد. بنابراين ابتدا با استفاده از روش نسبت درستنمايي فرض
?_0:?_1=?_2 vs ?_a:?_1??_2
را آزمون ميکنيم.( Muirhead, 2005, p.291 )
فضاي پارامتري تحت فرض صفر و در حالت کلي عبارت است از:
?={(?_1,?_2,?_1,?_2 ):?_i?R^p , ?_i is positive definite , i=1,2}
?_0={(?_1,?_2,?_1,?_2 ):?_i?R^p , ?_i=? is positive definite , i=1,2}
تابع درستنمايي عبارت است از:
L(?_1,?_2,?_1,?_2 )=?_(i=1)^2??(2?)^((-pn_i)/2) |?_i |^((-n_i)/2) exp{-1/2 ?_(j=1)^(n_i)??(y_ij-?_i )^’ ?_i^(-1) ?? ?
? (y_ij-?_i )}
بنابراين برآورد ماکزيمم درستنمايي ?_i و ?_i به صورت زير ميباشد:
? ?_i=Y ?_i , ? ?_i=1/n_i ?_(j=1)^(n_i)??(Y_ij-Y ?_i ) (Y_ij-Y ?_i )^’ ?=1/n_i A_i , i=1,2
در نتيجه
?sup?_? L(?_1,?_2,?_1,?_2 )=(2?)^((-(n_1+n_2 )p)/2) |? ?_1 |^((-n_1)/2) |? ?_2 |^((-n_2)/2) exp{(-(n_1+n_2 )p)/2}
اگر ?_1=?_2=? باشد، آنگاه
L(?_1,?_2,?,?)=?_(i=1)^2??(2?)^((-pn_i)/2) |?|^((-n_i)/2) exp{-1/2 ?_(j=1)^(n_i)??(y_ij-?_i )^’ ?^(-1) ?? ?
? (y_ij-?_i )}
بنابراين برآورد ماکزيمم درستنمايي ?_i و ? تحت فرض صفر به صورت زير ميباشد:
?? ?_i0=? ??_i=Y ?_i , i=1,2
? ?=1/(n_1+n_2 ) ?_(i=1)^2??_(j=1)^(n_i)??(Y_ij-Y ?_i ) (Y_ij-Y ?_i )^’=1/(n_1+n_2 ) (A_1+A_2 )=1/(n_1+n_2 ) A?
بنابراين
?sup?_(?_0 ) L(?_1,?_2,?,?)=(2?)^((-(n_1+n_2 )p)/2) |? ? |^((-(n_1+n_2 ))/2) exp{(-(n_1+n_2 )p)/2}
در نتيجه آماره آزمون عبارت است از:
?=(?sup?_(?_0 ) L(?_1,?_2,?,?))/(?sup?_? L(?_1,?_2,?_1,?_2 ) )=(|? ?_1 |^(n_1/2) |? ?_2 |^(n_2/2))/|? ? |^((n_1+n_2)/2) =((1/n_1 )^((pn_1)/2) |A_1 |^(n_1/2) (1/n_2 )^((pn_2)/2) |A_2 |^(n_2/2))/((1/(n_1+n_2 ))^(p(n_1+n_2 )/2) |A_1+A_2 |^((n_1+n_2)/2) )
=(n_1+n_2 )^(p(n_1+n_2 )/2)/((n_1 )^((pn_1)/2) (n_2 )^((pn_2)/2) ) (|A_1 |^(n_1/2) |A_2 |^(n_2/2))/|A_1+A_2 |^((n_1+n_2)/2)
بنابراين براساس آزمون نسبت درستنمايي فرض برابري ماتريسهاي کوواريانس رد ميشود اگر:
?=(n_1+n_2 )^(p(n_1+n_2 )/2)/((n_1 )^((pn_1)/2) (n_2 )^((pn_2)/2) ) (|A_1 |^(n_1/2) |A_2 |^(n_2/2))/|A_1+A_2 |^((n_1+n_2)/2) <?_0
و يا به صورت معادل
V=?^2 ((n_1 )^(pn_1 ) (n_2 )^(pn_2 ))/(n_1+n_2 )^p(n_1+n_2 ) =(|A_1 |^(n_1 ) |A_2 |^(n_2 ))/|A_1+A_2 |^(n_1+n_2 ) <c
قضيه 2-2-1: براي آزمون ?_0:?_1=?_2 در مقابل ?_a:?_1??_2، آزمون نسبت درستنمايي با ناحيه بحراني بفرم V<c اريب است. (يک آزمون اريب است اگر توان آزمون کمتر از خطاي نوع اولش باشد.)
اثبات: به منظور اثبات قضيه فوق فرض کنيد ?_2=?_p و ?_1=? باشد به گونهاي که ? يک ماتريس قطري است. در حالت خاص فرض کنيد ماتريس ? به صورت ?=diag(?,1,…,1) باشد. همچنين ماتريسهاي A_1 و A_2 را به صورت A_1=(a_ij^((1) ) ) و A_2=(a_ij^2 ) در نظر بگيريد. در اين صورت
|A_1 |=a_11^((1) ) |A_22^((1) )-(a_1^((1) ) a_1^'(1) )/(a_11^((1) ) )| , |A_2 |=a_11^((2) ) |A_22^((2) )-(a_1^((2) ) a_1^'(2) )/(a_11^((2) ) )|
و
|A_1+A_2 |=(a_11^((1) )+a_11^((2) ) )|A_22^((1) )+A_22^((2) )-(a_1^((1) )+a_1^((2) ) )(a_1^'(1) +a_1^'(2) )/(a_11^((1) )+a_11^((2) ) )| .
بنابراين آماره V را ميتوان به صورت زير نوشت:
V=((a_11^((1) ) )^(n_1 ) (a_11^((2) ) )^(n_2 ))/(a_11^((1) )+a_11^((2) ) )^(n_1+n_2 ) Z
به گونهاي که Z=(|A_22^((1) )-(a_1^((1) ) a_1^'(1) )/(a_11^((1) ) )|^(n_1 ) |A_22^((2) )-(a_1^((2) ) a_1^'(2) )/(a_11^((2) ) )|^(n_2 ))/|A_22^((1) )+A_22^((2) )-(a_1^((1) )+a_1^((2) ) )(a_1^'(1) +a_1^'(2) )/(a_11^((1) )+a_11^((2) ) )|^(n_1+n_2 ) است. در اين صورت متغير تصادفي Z از فاکتور اول در آماره V مستقل است و توزيعش به ? بستگي ندارد.زيرا به عنوان مثال فرض کنيد A_22.1^((1) )=A_22^((1) )-(a_1^((1) ) a_1^'(1) )/(a_11^((1) ) ) و ?_1=[?(?&0^’@0&?_(p-1) )] باشند. در اين صورت ?_22.1=?_(p-1) است و طبق قضيه 4 پيوست
A_22.1^((1) )~W_p (n-1,?_(p-1) )
و همچنين A_22.1^((1) ) از a_11^((1) ) نيز مستقل است.
متغير تصادفي Y را به صورت Y=(a_11^((1) ))/(a_11^((2) ) ) در نظر بگيريد. در اين صورت (?^(-1) (n_2-1)Y)/(n_1-1) توزيع ? با درجات آزادي n_1-1 و n_2-1 است. همچنين فاکتور اول آماره V را ميتوان به صورت Y^(n_1 )/(1+Y)^(n_1+n_2 ) نوشت. بنابراين براساس لم 1 پيوست، يک عدد ثابت ? (?<1) وجود دارد بطوريکه
P( Y^(n_1 )/(1+Y)^(n_1+n_2 ) <k??^(-1) )<P( Y^(n_1 )/(1+Y)^(n_1+n_2 ) <k??^(-1)=1) , ??^(-1)?(?,1)
به دليل کاستي آزمون نسبت درستنمايي بيان شده، بارتلت ( Bartlett ) در سال 1937 آماره آزمون اصلاح شده را به صورت زير پيشنهاد داد. اين آماره براي حالت i=2 عبارت است از:
?^*=(|A_1 |^((n_1-1)/2) |A_2 |^((n_2-1)/2))/|A_1+A_2 |^((n_1+n_2-2)/2) (n_1+n_2-2)^(p(n_1+n_2-2)/2)/((n_1-1)^(p(n_1-1)/2) (n_2-1)^(p(n_2-1)/2) )
و يا
V^*=?^* ((n_1-1)^(p(n_1-1)/2) (n_2-1)^(p(n_2-1)/2))/(n_1+n_2-2)^(p(n_1+n_2-2)/2) =(|A_1 |^((n_1-1)/2) |A_2 |^((n_2-1)/2))/|A_1+A_2 |^((n_1+n_2-2)/2)
قضيه 2-2-2: براي آزمون ?_0:?_1=?_2 در مقابل ?_a:?_1??_2 آزمون نسبت درستنمايي اصلاح شده با ناحيه بحراني بفرم V^*<k نااريب است. (اثبات: Muirhead, 2005, p.299)
2-2-1- توزيع مجانبي آماره ?^*
در اين قسمت توزيع مجانبي آماره ?^*، زمانيکه اندازه نمونه بزرگ است را به دست ميآوريم. بدين منظور فرض کنيد
n_i-1=k_i (n_1+n_2-2) , i=1,2
باشد به گونهاي که k_1+k_2=1 است. همان طور که از قبل ميدانيم، تحت فرض صفر(برابري ماتريسهاي کوواريانس)، براي اندازه نمونه بزرگ، -2 log???^* ? داراي توزيع کاي اسکور با درجه آزادي برابر با تفاضل تعداد پارامترهاي مستقل در فضاي پارامتري و تعداد پارامترهاي مستقل تحت فرض صفر، دارد. يعني درجه آزادي f برابر است با:
f=2[p+p+1/2 (p^2-p)]-[2p+p+1/2 (p^2-p)]=1/2 p(p-1)
حال در اين قسمت تعديلي از آماره قبل يعني -2? log???^* ? را در نظر ميگيريم و ? را در ادامه معرفي ميکنيم. براي بيان توزيع مجانبي، ابتدا حالت کلي را بررسي ميکنيم و سپس حالت خاص يعني توزيع مجانبي ?^* را مورد مطالعه قرار ميدهيم. ( Muirhead, 2005, p.303 )

متغير تصادفي Z , (0?Z?1) با گشتاورهايي بفرم زير را در نظر بگيريد:
?(Z^h )=K[(?_(j=1)^m?y_j^(y_j ) )/(?_(k=1)^q?x_k^(x_k ) )]^h (?_(k=1)^q??[x_k (1+h)+?_k ] )/(?_(j=1)^m??[y_j (1+h)+?_j ] ) (2-2-1)
جاييکه
?_(j=1)^m?y_j =?_(k=1)^q?x_k (2-2-2)
و K يک عدد ثابت است به گونهاي که ?(Z^0 )=1 است. با توجه به رابطه (2-2-1) تابع مشخصه -2? log?Z زمانيکه 0???1 است برابر است با
?(t)=?[exp(-2it? log?Z )]=K[(?_(j=1)^m?y_j^(y_j ) )/(?_(k=1)^q?x_k^(x_k ) )]^(-2it?) (?_(k=1)^q??[x_k (1-2it?)+?_k ] )/(?_(j=1)^m??[y_j (1-2it?)+?_j ] )
فرض کنيد
?_k=(1-?) x_k , ?_j=(1-?) y_j (2-2-3)
باشد. تابع مولد انباشتک (Cumulant generating function) -2? log?Z عبارت است از:
?(t)=log???(t)=g(t)-g(0)? (2-2-4)
به گونهاي که
g(t)=2it?[?_(k=1)^q??x_k log??x_k ? ?-?_(j=1)^m??y_j log??y_j ? ?]+?_(k=1)^q?log??[?x_k (1-2it)+?
? ?_k+?_k ]-?_(j=1)^m?log??[?y_j (1-2it)+?_j+?_j ]
و -g(0)=log?K است. حال بسط تابع لگاريتم گاما را به صورت زير در نظر بگيريد:
log??(z+a)=(z+a-1/2) log?z-z+1/2 log?2?+(B_2 (a))/(1×2) z^(-1)+…
+(-1)^(l+1) (B_(l+1) (a))/l(l+1) z^(-1)+?(z^(-l-1) ) (l=1,2,…,|argz|<?) (2-2-5)
در رابطه ( 2-2-5 )، B_j (a) چند جملهاي برنولي از درجه j است که به صورت ضريب z^j/j! در بسط ze^az (e^z-1)^(-1) تعريف ميشود. يعني
ze^az (e^z-1)^(-1)=?_(j=0)^???B_j (a) z^j/j!? (|z|<2?) (2-2-6)
بنابراين با استفاده از روابط گفته شده، ?(t) به صورت زير نوشته ميشود:
?(t)=-1/2 f log?(1-2it)+?_(?=1)^l???_? [(1-2it)^(-?)-1] ?+?(n^(-l-1) )
(2-2-7)
جاييکه
f=-2[?_(k=1)^q??_k -?_(j=1)^m??_j -1/2 (q-m)] (2-2-8)
و
?_?=(-1)^?/?(?+1) [?_(k=1)^q?(B_(?+1) (?_k+?_k ))/(?x_k )^? -?_(j=1)^m?(B_(?+1) (?_j+?_j ))/(?y_j )^? ] (2-2-9)
با در نظر گرفتن l=1 و با توجه به اينکه B_2 (a)=a^2-a+1/6 ميباشد، تابع مولد انباشتک -2? log?Z به صورت زير محاسبه ميشود:
?(t)=-1/2 f log?(1-2it)+?_1 [(1-2it)^(-1)-1]+?(n^(-2) )
به گونهاي که f در رابطه ( 2-2-8 ) صدق ميکند و
?_1=1/2? {-(1-?)f+?_(k=1)^q??x_k^(-1) (?_k^2-?_k+1/6) ?-?_(j=1)^m??y_j^(-1) (?_j^2-?_j+1/6) ?}
ميباشد. حال فرض کنيد ? را به صورت زير در نظر بگيريم:
?=1-1/f [?_(k=1)^q??x_k^(-1) (?_k^2-?_k+1/6) ?-?_(j=1)^m??y_j^(-1) (?_j^2-?_j+1/6) ?] (2-2-10)
در اين صورت ?_1=0 است و در نتيجه ?(t)=-1/2 f log??(1-2it)+?(n^(-2) )? ميباشد. بنابراين با توجه به اينکه ?(t)=(1-2it)^(-1/2 f)+?(n^(-2) ) است، نتيجه ميگيريم:
P[-2? log?Z<x]=P[?_f^2?x]+?(n^(-2) ) (2-2-11)
اگر l=2 باشد، مشابه قبل با استفاده از رابطه ( 2-2-7 ) تابع مولد انباشتک عبارت است از:
?(t)=-1/2 f log?(1-2it)+?_2 [(1-2it)^(-2)-1]+?(n^(-3) )
و در نتيجه
P[-2? log?Z<x]+P[?_f^2?x]+?_2 [P(?_(f+4)^2?x)-P(?_f^2?x)]+
?(n^(-3) ) (2-2-12)
حال به بررسي توزيع مجانبي ?^* در آزمون ?_0:?_1=?_2 ميپردازيم. با توجه به قضيه 5 پيوست، تحت فرض صفر گشتاور h- ام آماره ?^* عبارت است از:
?(?^(*^h ) )=(n_1+n_2-2)^(ph(n_1+n_2-2)/2)/((n_1-1)^(ph(n_1-1)/2) (n_2-1)^(ph(n_2-1)/2) ) ?(V^(*^h ) )
K[(?_(j=1)^p?[1/2 (n_1+n_2-2)]^(((n_1+n_2-2))/2) )/(?_(j=1)^p??_(i=1)^2?[1/2 (n_1+n_2-2) k_i ]^(((n_1+n_2-2) k_i)/2) )]^h (?_(i=1)^2??_(j=1)^p??[1/2 (n_1+n_2-2) k_i (1+h)-1/2 (j-1)] )/(?_(j=1)^p??[1/2 (n_1+n_2-2)(1+h)-1/2 (j-1)] )
(2-2-13)
اگر رابطه فوق را با رابطه ( 2-2-1 ) مقايسه کنيم، متوجه ميشويم که m=p، q=2p، y_j=1/2 (n_1+n_2-2)، ?_j=-1/2 (j-1)، x_k=1/2 (n_1+n_2-2) k_i براي k=(i-1)m+1,…,im(i=1,2) و ?_k=-1/2 (j-1) براي
k=j,p+j(j=1,…,p) است.
با استفاده از رابطه ( 2-2-8 )، f=1/2 p(p+1) به دست ميآيد که با مقدار f که در ابتداي بحث به دست آورديم برابر است. همچنين با استفاده از رابطه ( 2-2-10 )
?=1-(2p^2+3p-1)/6(n_1+n_2-2)(p+1) ((n_1+n_2-2)/(n_1-1)+(n_1+n_2-2)/(n_2-1)-1) (2-2-14)
به دست ميآيد. با توجه به روابط ( 2-2-12 ) و ( 2-2-9 ) و چند جملهاي برنولي، ?_2 عبارت است از:
?_2=p(p+1)/(48[(n_1+n_2-2)?]^2 ) {(p-1)(p-2)((n_1+n_2-2)^2/(n_1-1)^2 +(n_1+n_2-2)^2/(n_2-1)^2 -1)-?
? 6(n_1+n_2-2)^2 (1-?)^2 } (2-2-15)
حال M و ? را به صورت زير تعريف ميکنيم:
M=?(n_1+n_2-2)=(n_1+n_2-2)-(2p^2+3p-1)/6(p+1) ((n_1+n_2-2)/(n_1-1)+(n_1+n_2-2)/(n_2-1)-1) (2-2-16)
?=M^2 ?_2=p(p+1)/48 {(p-1)(p-2)((n_1+n_2-2)^2/(n_1-1)^2 +(n_1+n_2-2)^2/(n_2-1)^2 -1)-?
? 6(n_1+n_2-2)^2 (1-?)^2 } (2-2-17)
فرض کنيد W=-2? log???^* ? و W_0 مقدار مشاهده شده W باشد.
قضيه 2-2-3: در صورت درست بودن فرض ?_0:?_1=?_2، توزيع W با فرض بزرگ بودن M عبارت است از:
P(W?W_0 )=P(?_f^2?W_0 )+?/M^2 [P(?_(f+4)^2?W_0 )-P(?_f^2?W_0 )]+
?(M^(-3) )
به گونهاي که ? و M به ترتيب در روابط ( 2-2-17 ) و ( 2-2-16 ) تعريف شدهاند و f=1/2 p(p+1) ميباشد.
اثبات: با توجه به روابط ( 2-2-12 ) و ( 2-2-17 ) قضيه فوق به راحتي اثبات ميشود.
همان طور که در قضيه ( 2-2-2 ) گفته شد، آزمون نسبت درستنمايي اصلاح شده با ناحيه بحراني بفرم (?^*<k) V^*<k نااريب است. از طرفي با توجه به تعريف آماره W نتيجه ميگيريم فرض ?_0:?_1=?_2 براي مقادير بزرگ W رد ميشود. بنابراين براساس قضيه 6 پيوست، p – مقدار عبارت است از:
p-value=P_(?_0 ) (W?W_0 )=1-P_(?_0 ) (W?W_0 )
=1-P(?_f^2?W_0 )-?/M^2 [P(?_(f+4)^2?W_0 )-P(?_f^2?W_0 )] (2-2-18)
بنابراين اگر p – مقدار فوق از سطح معني داري ? کمتر باشد، فرض برابري ماتريسهاي کوواريانس رد ميشود.
2-3- آزمون MNV

در اين بخش به معرفي يکي از آزمونهاي تقريبي براي فرض برابري بردارهاي ميانگين دو جامعه نرمال چند متغيره زماني که ماتريسهاي کوواريانس برابر نيستند ميپردازيم.
آزمون اصلاح شده نل و وان در مرو که به اختصار با نماد MNV نشان ميدهيم در سال 1986 براساس فرم درجه دوم (Y ?_1-Y ?_2 )^’ ? ?^(-1) (Y ?_1-Y ?_2 ) ارائه شد که در آن ? ? يک برآوردگر براي Cov(Y ?_1-Y ?_2 )=1/n_1 ?_1+1/n_2 ?_2 ميباشد. اگر از برآوردگر نااريب S ?_i=1/n_i S_i , i=1,2 براي ? ?_i=1/n_i ?_i , i=1,2 استفاده کنيم، آماره آزمون عبارت است از:
?_u^2=(Y ?_1-Y ?_2 )^’ (S ?_1+S ?_2 )^(-1) (Y ?_1-Y ?_2 ) (2-3-1)
2-3-1- توزيع آماره ?_u^2

در اين قسمت توزيع آماره ?_u^2 را به دست ميآوريم.
براساس مطالب بيان شده در فصل اول، تحت فرض برابري بردارهاي ميانگين، Y ?_1-Y ?_2 داراي توزيع N_p (0,? ? ) و S ?_i داراي توزيع W_p (n_i-1, 1/(n_i-1) ? ?_i ) است، به گونهاي که ? ?=? ?_1+? ?_2 ميباشد.
بنابراين تحت فرض برابري بردارهاي ميانگين
Z=? ?^((-1)?2) (Y ?_1-Y ?_2 )~N_p (0,?_p )
بنابراين
Y ?_1-Y ?_2=? ?^(1?2) Z
در نتيجه آماره ?_u^2 را ميتوان به صورت زير نوشت:


پاسخ دهید