آمار توصیفی/استنباطی

هنجار آزمون:

تعریف هنجار اگر برای تفسیر نمرۀ یک دانش آموز آن نمره را با میانه یا میانگین نمرۀ بک گروه مرجع مقایسه کنیم به آن گروه مرجع گروه هنجار می گویند.گروه مرجع از کسانی تشکیل می یابد که به گونه ای شبیه به دانش آموز مورد نظر هستند. بنابراین، فایدۀ هنجار این است که برای قضاوت دربارۀ سطح نسبی عملکرد یک فرد به عنوان معیار به کار می رود.هنجار یابی یکی از مراحل اصلی در استاندارد کردن آزمون های وابسته به هنجار است.در تعیین هنجار برای یک آزمون، باید سوال زیر را مورد توجه قرارداد:     آزمون در مورد چه گروهی به کار خواهد رفت؟ برای مثال اگر آزمون برای اندازه گیری ویژگیهای شخصیتی زنان به کار خواهد رفت، گروه مرجع یا گروه هنجار باید نمونه ای از تمام زنان باشد.یا اگر آزمون برای سنجش آمادگی خواندن کودکان پیش دبستانی به کار خواهد رفت، گروه مرجع باید از کودکان پیش دبستانی که هنوز آموزش خواندن را شروع نکرده اند تشکیل یابد.    هنجارهای مربوط به نمرات معیار موقعیت نسبی یک دانش آموز در یک گروه با نشان دادن فاصلۀ نمرۀ او از میانگین نمرات معلوم می‌شود. نمرات معیار، عملکرد هر دانش آموز را در یک آزمون، بنا بر اختلاف عملکرد او از میانگین گروه، بر حسب واحد انحراف معیار نشان می دهد .     نمرهzآن دسته از نمرات معیار که دارای توزیعی با میانگین صفر و انحراف معیار واحد(۱) هستند به نمرات z (نمرات زی) شهرت دارند .    نمره Tمجموعه نمرات معیار دیگری که به نمرات T (نمرات تی ) شهرت دارند برای رفع مشکلات نمرات     z ابداع شده اند.     منبع: اندازه گیری سنجش و ارزشیابی آموزشی نوشته دکتر علی اکبر سیف
آزمون روایی:

تعریف و انواع روایی
روایی اصطلاحی است که به هدفی که آزمون برای تحقق بخشیدن به آن درست شده است اشاره می‌کند.لین وگرانلاند (۲۰۰) روایی را یه صورت “یک ارزشیابی از کفایت و مناسبت تفسیرها و استفاده های نتایج سنجش” (ص۷۳) تعریف کرده‌اند. کاپلان و ساکوزو (۲۰۰۱) گفته‌اند “روایی می‌توان به صورت به صورت توافق بین نمرۀ آزمون و کیفیتی که قرار است اندازه بگیرد تعریف کرد” (ص۱۳۲). بنابر آنچه گفته شد، آزمونی دارای روایی است که برای اندازه گیری آنچه مورد نظر است کافی و مناسب باشد. برای مثال، یک آزمون پیشرفت تحصیلی ریاضی پنجم دبستان در صورتی یک آزمون رواست که محتوا و هدفهای آن درس را به خوبی آندازه گیری کند و بجز یادگیری دانش‌آموزان از آن درس چیز دیگری را شامل نباشد به عنوان مثالی دیگر از روایی، یک آزمون هوشی روا آزمونی است که تنها هوش افراد را اندازه گیری کند نه چیز دیگری را. بنابراین، یک آزمون ممکن است از جهتی روا باشد اما از جهاتی دیگر روا نباشد. پس، روایی یک امر نسبی است، نه یک ویژگی که هست یا نیست.آزمونهای مورد استفاده در آموزش و پرورش و روانشناسی دارای سه هدف عمده هستند که به سه پرسش زیر پاسخ می‌دهند.
۱٫ آیا سوالهای آزمون از محتوای درس یا موضوع مورد نظر بک نمونۀ خوب ارائه می‌دهند؟
۲٫ آیا نمرات آزمون عملکرد فعلی یا آتی دانش آموزان را پیش بینی می کنند.
۳٫ آیا نمرات آزمون به مفاهیم نظری یا سازه هایی که آزمون برای سنجش آنها درست شده است مربوط اند؟
سه مورد بالا به ترتیب سه نوع روایی محتوایی، ملاکی، و سازه را نشان می دهند.     منبع: اندازه گیری سنجش و ارزشیابی آموزشی نوشته دکتر علی اکبر سیف

آزمون پایایی:

تعریف پایایی پایایی یک وسیلۀ اندازه گیری عمدتاً به دقت نتایج حاصل از آن اشاره می کند. کاپلان و ساکوزوا (۲۰۰۱) گفته‌اند” پایایی به دقت، اعتماد پذیری، ثبات، با تکرار پذیری نتایج آزمون اشاره می‌کند” (ص ۱۱). رابطۀ بین روایی و پایایی از این قرار است که یک آزمون باید پایا باشد تا بتواند روا باشد. اگر آزمونی در هر با اجرا بر روی تعدادی از دانش آموز نتایج مختلفی به دست بدهد آن آزمون یک آزمون پایا نخواهد بود و در واقع هیچ چیز را به درستی اندازه نخواهد گرفت، و اگر یک آزمون چیزی را به درستی اندازه‌گیری نکند هیچ اطلاع مفیدی به ما نخواهد داد. برای مثال، یک آزمون حساب برای اندازه گیری محتوا و هدفهای درس تاریخ روا (مناسب) نیست، اما این آزمون می تواند مطالب حساب را که اندازه می‌گیرد با دقت (به طور پایا) اندازه گیری کند. پس، برای اینکه یک آزمون روا باشد باید نخست پایا باشد. یعنی پایایی شرط روایی است، اما روایی برای پایایی ضروری نیست.
روشهای تعیین پایایی روشهای تعیین پایایی متنوع‌اند و ما آنها را با استفاده از پیشنهادهای ایبل (۱۹۷۲)، ویرسما و جورس (۱۹۹۰)، و مرفی و دیویدشوفر(۱۹۹۴) به شرح زیر دسته بندی می‌کنیم:     روش پایایی مصححان، روش بازآزمایی، روش فرم‌های هم ارز، و روشهای همسانی درونی (روش دو نیمه کردن آزمون، روش کودر- ریچاردسون، و روش ضریب القای کرانباخ).    
روش دو نیمه کردن آزمون     در روش دو نیمه کردن آزمون، آزمون‌ مورد نظر را یک بار با گروه واحدی از آزمون     شوندگان اجرا می کنیم و، پس از اجرا، آن را به دو نیمه تقسیم می‌نماییم. در این     روش، بهترین راه دو نیمه کردن آزمون این است که همۀ سوالهای فرد را یک آزمون به     حساب آوریم، و همۀ سوالهای زوج را نیز آزمون دیگری بدانیم. ضریب همبستگی حاصل از     نمرات دو نیمۀ آزمون ضریب پایایی هر یک از دو نیمه خواهد بود.   
روش کورد ریچاردسون         در روش کودر-ریچاردسون نیز آزمون تنها یک بار اجرا می‌شود، اما در این روش همۀ     ماده‌های آزمون تحلیل می‌شوند. کودر و ریچاردسون برای همسانی درونی آزمون و تعیین     پایایی آن دو فرمول مورد استفاده قرار داده‌اند که به ۲۰kR و ۲۱ KR شهرت دارند.   
روش ضریب الفا     سومین روش تعیین پایایی آزمون با تاکید بر همسانی درونی روش ضریب آلفا نام دارد که     به آن ضریب آلفا یا ضریب آلفای کرانباخ یا حتی آلفا نیز گفته می‌شود          منبع: اندازه گیری سنجش و ارزشیابی آموزشی نوشته دکتر علی اکبر سیف

حد تسلط:

تمیز بین حد تسلط و غیر حد تسلط :

از آنجا که آزمونهای وابسته به ملاک دارای یک نمرۀ مرزی برای حد تسلط هستند، مثلاً نمره ۸۵ از ۱۰۰، بنابراین لازم است معلوم شود که آیا سوالهای آزمون در آن نقطه بین آزمون شوندگان قوی و ضعیف تمیز قائل می شوند یا نه.در شکل زیر حرف a معرف تعداد آزمون شوندگانی است که سوال را درست جواب داده اند اما در کل آزمون نمره ای کمتر از حد تسلط گرفته اند .همچنین b تعداد آزمون شوندگانی است که سوال را درست جواب داده اند و در نمره کل آزمون نیز به حد تسلط رسیده اند .حرف c نشان دهندۀ تعداد آزمون شوندگانی است که سوال را غلط جواب داده اند و در کل به حد تسلط نرسیده اند. و بالاخره حرف d معرف تعداد کسانی است که سوال مورد نظر را درست جواب نداده اند اما در نمره کل آزمون به حد تسلط رسیده اند. تعداد آزمون شوندگانی که به حد تسلط رسیده اند برابر است با b+d و تعداد کسانی که به حد تسلط نرسیده اند مساوی است با a+c .

ضریب تمیز، یعنی D، برابر است با تفاوت بین سطوح دشواری سوال برای کسانی که به حد تسلط رسیده و آنهایی که به حد تسلط نرسیده اند، مطابق با فرمول زیر:

این ضریب تمیز از ۱- تا ۱+ متغیر است. مقدار مثبت D نشان می دهد که سوال بین کسانی که به حد تسلط رسیده و کسانی که به حد تسلط نرسیده اند تمیز قائل شده است . وقتی که ضریب تمیز سوالی منفی است، نشان دهنده آن است که سوال در جهت خلاف سوالهای دیگر تمیز قائل می شود. چنین سوالی نیاز به بازبینی دارد.

منبع: اندازه گیری سنجش و ارزشیابی آموزشی نوشته دکتر علی اکبر سیف

نمرهz :  آن دسته از نمرات معیار که دارای توزیعی با میانگین صفر و انحراف معیار واحد(۱) هستند به نمرات z (نمرات زی) شهرت دارند .     برای تبدیل نمرات خام به نمرات z از فرمول زیر استفاده می شود:

نمرۀ z نشان می دهد که یک نمرۀ خام به اندازۀ چه تعداد از واحدهای انحراف معیار     بالاتر یا پایین تر از میانگین است.      
منبع: اندازه گیری سنجش و ارزشیابی آموزشی نوشته دکتر علی اکبر سیف

نمره T: مجموعه نمرات معیار دیگری که به نمرات( T Score ) شهرت دارند برای رفع مشکلات نمرات     Z ابداع شده اند. مقیاس نمرات T با ضرب نمرات Z در ۱۰ و جمع کردن نمرات حاصل با ۵۰ به دست می آید .بنابراین، آن دسته از نمرات معیار که دارای توزیعی با میانگین ۵۰ و انحراف معیار ۱۰ است توزیع نمرات T نام دارد. می توان فرمول محاسبۀ نمرات T را به صورت زیر نوشت: T=10(z)+50      
منبع: اندازه گیری سنجش و ارزشیابی آموزشی نوشته دکتر علی اکبر سیف

نمرات ۹ بخشی:

نوع دیگری از نمرات هنجار به نام نمرات ۹ بخشی (Standard Nine)وجود دارد که به صورت نمرات معیار یک رقمی نشان داده می‌شود. علت نام گذاری این مقیاس نمرات به ۹ بخشی آن است که توزیع این نمرات به ۹ بخش محدود می‌شود.این مقیاس دارای میانگین۵ و انحراف معیار ۲ است.نیکتو (۱۹۸۳) نمرات ۹ بخشی را برای نمره‌گذاری آزمونهای آزمونهای تشریحی که ارزشیابی آنها جنبۀ کیفی دارد، به ویژه آزمونهای خواندن و فهمیدن، به شرح زیر پیشنهاد داده است:

۹- بسیار عالی ( ۴% بالا)
۸- عالی(۷% بعدی)
۷- خیلی خوب(۱۲% بعدی)
۶- خوب (۱۷% بعدی)
۵- متوسط(۲۰%)
۴- نسبتاً ضعیف(۱۷% بعدی)
۳- ضعیف(۱۲% بعدی)
۲- خیلی ضعیف(۷% بعدی)
۱-بیش از حد ضعیف(۴% آخر)

منبع: اندازه گیری سنجش و ارزشیابی آموزشی نوشته دکتر علی اکبر سیف

گزینه های انحرافی :

علاوه بر تعیین ضریبهای دشواری و تمیز برای هر سوال، بررسی نحوۀ پراکندگی پاسخهای مربوط به گزینه های انحرافی هر سوال ضروری است.در تحلیل گزینه های انحرافی قاعدۀ کلی به شرح زیر است: هر گزینۀ انحرافی دست کم باید یک نفر از افراد گروه ضعیف را به خود جلب می کند تعداد افراد گروه ضعیف باید بیشتر از تعداد افراد گروه قوی باشد.دلیل اسن امر را به این گونه می توان توضیح داد که افراد گروه ضعیف در مجموع اطلاعات کمتری از مطالب آزمون دارند. بنابراین، در صورتی یک سوال به خوبی عمل می کند که افراد ضعیف بیشتر از افراد گروه قوی گزینه های انحرافی آن سوال را انتخاب نمایند.

تحلیل گزینه های انحرافی به کمک منحنی ویژگی سوال:

در نظریه سوال- پاسخ هر یک از گزینه های یک سوال چند گزینه ای ( چه گزینه درست و چه گزینه های انحرافی) می تواند اطلاعاتی دربارۀ دانش یا مهارت پاسخ دهنده به دست دهد.برای این منظور، لازم است، علاوه بر منحنی ویژگی  گزینۀ درست، برای گزینه های غلط نیز منحنی ویژگی رسم کنیم.به عنوان نمونه، شکل ۱۵-۱۳ هم منحنی ویژگی گزینۀ درست (الف) و هم منحنیهای ویژگی گزینه های انحرافی، (ب،ج،د) را نشان می دهد.چنان که در شکل دیده می شود، گزینۀ درست یا گزینۀ الف دارای قدرت تمیز مثبت و بالاست.گزینۀ انحرافی ج نیز دارای قدرت تمیز مثبت و نسبتاً بالاست.اما گزینۀ د را کمتر کسی انتخاب کرده و قدرت تمیز ندارد.گزینۀ ب دارای قدرت تمیز منفی است، یعنی پاسخ دهندگان ضعیف بیشتر از پاسخ دهندگان قوی آن را انتخاب کرده اند.

منبع: اندازه گیری سنجش و ارزشیابی آموزشی     نوشته دکتر علی اکبر سیف

منحنی سوال: منحنی ویژگی سوال  یک بازنمایی نموداری از رابطۀ بین احتمال پاسخ درست دادن به یک سوال و موقعیت آزمون شونده در صفت مورد اندازه گیری توسط آزمون است.همچنین می توان گفت که منحنی ویژگی سوال احتمال پاسخ درست دادن را نسبت به صفت مکنون تعیین می کند.برای تهیه منحنی ویژگی یک سوال، نسبت یا درصد آزمون شوندگانی که آن سوال را درست جواب داده اند در رابطه با نوعی ملاک یا معیار، مثلا نمرۀ کل آزمون آنها، رسم می شود. به سخن دیگر، بر روی منحنی افقی نمرۀ کل آزمون و بر روی محور عمودی نسبت آزمون شوندگانی که به سوال پاسخ درست داده اند مشخص می شود.    دقت کنید که در منحنی ویژگی سوال ۱ (شکل زیر) نسبتهای درست برای این سوال همراه با افزایش نمرۀ کل آزمون افزایش می یابد.این مطلب نشان می دهد که: هر چه نمرۀ کل آزمون یک فرد بزرگتر باشد با احتمال بیشتری به این سوال پاسخ درست خواهد داد. از روی منحنی ویژگی سوال می توان ضریبها دشواری و تمیز را تعیین نمود. ضریب دشواری     عبارت است از نمره معیاری که در ان ۵۰ درصد آزمون شوندگان سوال درست را پاسخ داده     اند. ضریب تمیز برابر است با شیب منحنی ویژگی سوال.    اگر همه آزمون شوندگان به یک سوال جواب درست بدهند منحنی آن یک خط افقی واقع در     بالای محور عمودی خواهد بود و اگر همه آزمون شوندگان به یک سوال جواب غلط بدهند     منحنی ویژگی سوال آن نیز یک خط افقی خواهد بود. در شکل زیر منحنی ویژگی های پنج سوال با هم مقایسه شده اند. سوال الف) یک سوال ضعیف است زیرا بین آزمون شوندگان قوی و ضعیف تمیز قائل نمی شود. سوال ب)  یک سوال معیوب است زیرا این سوال با کل آزمون رابطه معکوس دارد به     عبارت دیگر ضریب تمیز منفی دارد     سوال های  پ) و ت)  سوال های نسبتا خوبی هستند.    منحنی ویژگی سوال ث از منحنی ویژگی سوال پ  و   ت شیب کمتری دارد و     نتیجه می گیریم که نمی تواند به خوبی سوالات پ وت تیمز بین گروه های قوی و ضعیف را     انجام دهد
    برازنده کردن منحنی ویژگی سوال: برای استفاده بیشتر از منحنی سوال ، سعی می شود که مناسب ترین منحنی ریاضی آن سوال     رسم شود. در صورتی که منحنی ریاضی سوال به نحو صحیحی رسم شود با کمک آن چند پارامتر     مهم سوال را تعیین نمود:
۱٫ پارامتر a که نشان دهندۀ شکل یا شیب منحنی ویژگی سوال است. چنان که قبلا دیدیم، شیب صعودی یا منحنی دارای شکل پلکانی نشان دهندۀ قدرت تمیز زیاد سوال است. ۲٫ پارامتر b معرف آستانه یا همان ضریب دشواری سوال است. ضریب دشواری سوال برابر است با نمره ای از آزمون که آزمون که مقابل با نقطۀ تغییر یا نقطۀ عطف منحنی ویژگی سوال است. ۳٫ پارامتر c یا پارامتر تصادف میزان حدس پذیری سوال را مشخص می کند.هر چه امکان کسب نمره از راه حدس زدن در یک سوال بیشتر باشد مقدار c برای آن سوال نیز بزرگ تر است. 

منبع: اندازه گیری سنجش و ارزشیابی آموزشی نوشته دکتر علی اکبر سیف

ضریب تمیز:

ضریب تمیز که با d نشان داده می شود قدرت سوال را در تمایز گذاری         یا تشخیص بین گروه قوی و گروه ضعیف آزمون شوندگان مشخص می کند،(بر خلاف ضریب دشواری که میزان آسان بودن یا دشوار بودن یک سوال را برای گروه آزمون شوندگان نشان می دهد،)  یعنی معلوم می‌نماید که سوال تا چه اندازه می تواند گروه قوی را از گروه ضعیف جدا سازد. برای محاسبۀ ضریب تمیز یک سوال از فرمول زیر استفاده می شود:       

تفسیر ضریب :

تمیز هر قدر ضریب تمیز بزرگتر باشد، قوه تمیز آن سوال بیشتر و هر قدر این ضریب کوچکتر باشد قوۀ تمیز آن کمتر است. گاه اتفاق می افتد که ضریب تمیز سوالی منفی است.این نوع ضریب تمیز نشان می دهد مه در آن سوال گروه قوی بدتر از گروه ضعیف عمل کرده است. این گونه سوالها دارای معایب اساسی هستند که یا باید به کلی کنار گذاشته شوند یا در آنها تجدید نظر اساسی صورت پذیرد.اگر سوال دارای اشکال فنی  نباشد، دلیل چنین ضریبی می تواند این باشد که افراد گروه بالا یا آن سوال را به طور   کامل یاد نگرفته اند یا آن را به غلط آموخته اند.بنابراین، تمامی ضریبهای تمیز         سوالهای آزمون باید مثبت باشند.

رابطه بین ضریب تمیز و ضریب دشواری به صورت زیر است:

منبع: اندازه گیری سنجش و ارزشیابی آموزشی نوشته دکتر علی اکبر سیف

ضریب دشواری:

    محاسبه ضریب دشواری سوال بنا به تعریف، درصد کل آزمون شوندگانی که به سک سوال جواب درست میدهند ضریب دشواری آن سوال است که با حرف P نشان داده می‌شود.اگر در تحلیل یک سوال کلیه افراد یا کلیه برگه‌های امتحانی دخالت داشته باشند برای محاسبه‌ی ضریب دشواری سوال آن کافی است که تعداد کل افرادی را که به آن سوال جواب درست داده‌اند بر تعداد کل آزمون شوندگان تقسیم کنیم و نتیجه را در ۱۰۰ ضرب نماییم. رقم حاصل ضریب دشواری سوال است. مطابق فرمول زیر:   

در این فرمول R معرف تعداد کسانی است که به سوال جواب درست داده و T نشان دهنده         تعداد کل آزمون شوندگان است. در مواردی که تعداد آزمون شوندگان( تعداد برگه‌های         آزمون) زیاد است و اطلاعات ما به نحوۀ پاسخدهی افراد گروه بالا و گروه پایین محدود         می‌شود، لازم است از فرمول زیر استفاده کنیم:

بر اساس توضیحات بالا، هر اندازه ضریب دشواری یک سوال بزرگ‍‌تر (به ۱۰۰ نزدیک تر)     باشد، آن سوال آسان تر است و هر اندازه که این ضریب کوچک تر (به صفر نزدیک تر) باشد     سوال دشوارتر است. چنان که ملاحظه شد، فرمول بالا ضریب دشواری را بر حسب یک عدد     صحیح دو رقمی نشان می‌دهد. برخی از متخصصان اندازه گیری و ارزشیابی ترجیح می‌دهند     که این ضریب، مانند ضریب تمیز، بر حسب اعداد اعشاری باشد که تفسیر آن با تفسیر ضریب     تمیز همانند صورت گیرد.   

تفسیر ضریب دشواری:  

اگر در تفسیر ضریب دشواری یا ضریب سهولت سوال با آزمونهای وابسته به هنجار سر و کار داشته باشیم، می‌توانیم این ضریت را از دیدگاه آماری مورد بررسی قرار دهیم. یکی از انتظارات ما از آزمون‌های وابسته به هنجار این است که برای آزمون شوندگان مختلف نمراتی به دست می‌دهد که در طول یک پیوستار پراکنده باشند، و هر چه این پراکندگی بیشتر باشد بهتر است. به سخن دیگر، هر چه واریانس نمرات حاصل از یک آزمون وابسته به هنجار بزرگ تر باشد آن آزمون آزمون بهتری است. در نتیجه، از لحاظ انتخاب برای گنجانیدن در فرم نهایی آزمون، سوالهایی بهتر هستند که ضریب دشواری آنها از ۱ کمتر و از صفر بیشتر و به ۵/۰ نزدیک باشد.البته انتخاب سوالهایی با ضرایب دشواری مناسب به نوع سوالهای آزمون مربوط است. در آزمونهای صحیح – غلط ضریب دشواری۵/۰ P= زمانی بدست می آید که همۀ آزمودنیها با حدس زدن به سوال جواب بدهند.آلن وین (۱۹۷۹) گفته اند برای آزمونهای چند گزینه‌ای سطح بهینۀ دشواری اندکی کمتر از وسط فاصلۀ بین ۱ و سطح موفقیت با حدس زدن است.منظور از سطح موفقیت با حدس زدن عبارت است از نسبت پاسخهای درستی که با حدس زدن حدود ۲۵/۰ است، و لذا سطح بهینۀ دشواری در وسط ۲۵/۰ و ۱ یعنی در حدود ۶/۰ خواهد بود.برای تعیین رقم دقیق معرف ضریب دشواری بهینۀ سوال، ابتدا سطح موفقیت ۱۰۰% را از سطح عملکرد با حدس زدن (مثلاً ۲۵%) کم می کنیم و نتیجه را به ۲ تقسیم می نماییم و نقطۀ میانی را مشخص می کنیم.   

پس از آن، حاصل از محاسبات بالا ( یعنی نقطۀ میانی ) را با سطح معرف عملکرد از طریق حدس زدن جمع می کنیم .به طور کلی، ضریبهای دشواری بین ۳/۰ و ۷/۰ حداکثر اطلاع را دربارۀ تفاوت بین آزمودنیها به دست می دهند.   

منبع: اندازه گیری سنجش و ارزشیابی آموزشی نوشته دکتر علی اکبر سیف

ضریب کودر ریچاردسون:

در روش کودر-ریچاردسون نیز آزمون تنها یک بار اجرا می‌شود، اما در این روش همۀ     ماده‌های آزمون تحلیل می‌شوند. کودر و ریچاردسون برای همسانی درونی آزمون و تعیین     پایایی آن دو فرمول مورد استفاده قرار داده‌اند که به۲۰ kR و ۲۱ KR شهرت دارند.    
به فرض اینکه تمام سوالهای آزمون دارای ضریب دشواری متوسط باشند، می توان به جای     فرمول ۲۰ KR از فرمول ۲۱ KR به شرح زیر استفاده کرد:  چنان ‌که گفتیم، در استفاده از فرمول ۲۱ KR فرض بر این است که همۀ سوالها یا     ماده‌های آزمون از لحاظ درجۀ دشواری شبیه به هم هستند. هر قدر از لحاظ درجۀ دشواری     میان سوالهای آزمون تفاوت وجود داشته باشد، به همان نسبت از ضریب پایایی حاصل از     فرمول۲۱ KR کاسته می‌شود. اگر فرض شباهت درجۀ دشواری سوالها صحیح باشد، استفاده از     این فرمول بسیار ساده‌تر از فرمول ۲۰ kR است، زیرا در استفاده از فرمول ۲۱ KR نیازی     به محاسبۀ نسبت پاسخهای درست برای تک تک سوالهای آزمون نیست و تنها با داشتن سه جزء     اطلاع زیر: یعنی تعداد سوالها (n) میانگین نمرات آزمون (  X ̅) و واریانس کل آزمون     محاسبۀ ضریب پایایی مسیر است.    
فرض اساسی فرمولهای کودر و ریچاردسون این است که سوالهای آزمون را می‌توان به صورت     ۱ برای پاسخ درست و ۰ (صفر) برای پاسخ غلط تصحیح کرد. بنابراین نمی‌توان این     فرمولها را برای محاسبۀ ضریب پایایی پرسشنامه‌هایی که پاسخهای آنها از ۱ تا ۴ یا ۵     را شامل می‌شوند مورد استفاده قرار داد    
منبع: اندازه گیری سنجش و ارزشیابی آموزشی نوشته دکتر علی اکبر     سیف

ضریب آلفای کرونباخ:

سومین روش تعیین پایایی آزمون با تاکید بر همسانی درونی روش ضریب آلفا نام دارد که به آن ضریب آلفا یا ضریب آلفای کرانباخ یا حتی آلفا نیز گفته می‌شود     روش آلفای کرانباخ در شرایطی که نمرات سوال نه به صورت دو ارزشی صفر و ۱ بلکه به     صورت چند ارزشی تعیین می‌شود و ۲۰ KR برای آن مناسب نیست قابل استفاده است – مثلاً     در رابطه با نمرات حاصل از پرسشنامه‌های شخصیت یا نگرش‌سنج که پاسخ دهنده به هر     سوال در طیفی از مثلاً کاملاً موافق تا کاملاً مخالف (۵ تا ۱) جواب می‌دهد و هیچ یک     از آنها درست یا غلط محسوب نمی‌شود .    اگر بخشهای آزمون یا خرده آزمونهایی که از مجموع آنها آزمون کلی تشکیل شده است به     طور جداگانه نمره گذاری بشوند، در آن صورت ضریب آلفا مستلزم این نیست که سوالهای     انفرادی به صورت درست و غلط تصحیح شوند کرانباخ (۱۹۵۱) واضع این روش تعیین پایایی است. در این روش، اجزا یا قسمتهای آزمون برای سنجش ضریب پایایی آزمون به کار می‌روند. اگر قسمتهای “آزمون همان سوالهای آزمون باشند و سوالها به صورت درست (۱) و غلط (۰) تصحیح بشوند، ضریب آلفا برابر خواهد بود با ۲۰ KR     (روش کودر ریچارسون)که قبلا معرفی شد. اما اگر، به جای سوالها یا ماده‌ها، آزمون از بخشها یا قسمنهایی تشکیل شده باشد، مثل زمانی که یک آزمون از تعدادی خرده آزمون تشکیل یافته است، و بخواهیم از آنها در محاسبۀ ضریب پایایی کل آزمون استفاده کنیم، آنگاه از روش کرانباخ مطابق با فرمول زیر استفاده می‌کنیم:
منبع: اندازه گیری سنجش و ارزشیابی آموزشی نوشته     دکتر علی اکبر سیف

ضریب همبستگی:

همبستگی بین نمرات در تعبیر و تفسیر نمرات دانش‌آموزان و دانشجویان، گاه لازم می‌آید که رابطۀ بین دو یا چند دسته نمره را تعیین کنیم. برای مثال، اغلب سوال می‌شود که نمرات هوش و نمرات پیشرفت تحصیلی چه رابطه‌ای با هم دارند، و بسیاری از معلمان علاقه مندند که بدانند بین نمرات پیشرفت تحصیلی  سالهای قبل و بعد رابطه‌ای وجود دارد یا نه .میزان رابطۀ بین دو دسته نمرۀ متعلق به گروه واحدی از دانش‌آموزان یا دانشجویان را با محاسبۀ ضریب همبستگی مشخص می‌کنند متداولترین روش تعیین همبستگی، روش محاسبۀ ضریب همبستگی گشتاوری پیرسون است.این ضریب همبستگی با r نشان داده می‌شود.

تفسیر ضریب همبستگی

۱٫ رابطۀ بین متغیرهای مورد نظر ممکن است از جمعیتی به جمعیت دیگر فرق کند.

۲٫ هر چه افراد مورد نظر در متغیرهایی که ضریب همبستگی بین آنها محاسبه می‌شود نامتناجس تر باشند ضریب همبستگی حاصل بزرگتر است.

۳٫ ممکن است وجود همبستگی بین دو متغیر به علت یک رابطۀ واقعی بین آن دو نباشد، بلکه دلیل آن، ارتباط بین این دو متغیر با یک متغیر ثالث باشد. برای مثال، در روزهای برفی و بارانی زمستان، بین پوشیدن پالتو و استفاده از چتر، ضریب همبستگی مثبت وجود دارد. اما بر اساس این همبستگی نه می‌توان گفت که پالتو پوشیدن دلیل استفاده از چتر است، نه استفاده از چتر دلیل پالتو پوشیدن.

۴٫ ضریب همبستگی را نباید به صورت درصد تعبیر کرد.اما مجذور ضریب همبستگی نشان دهندۀ درصد وجه مشترک بین دو متغیر است.

۵٫ هر چه قدر م ۵٫ هر چه قدر مطلق ضریب همبستگی بین دو متغیر بیشتر باشد، مقدار رابطۀ بین آنها بیشتر است . بنابراین، ضریب همبستگی ۶۰/۰ + بیشتر از ضریب همبستگی ۵۵/۰+ است و ضریب همبستگی ۷۲/۰- از هر دو آنها بزرگ تر است. تنها تفاوت بین ضرایب مثبت و منفی در جهت رابطۀ بین متغیرهاست.ضریب همبستگی مثبت نشان دهندۀ رابطۀ مستقیم، اما ضریب همبستگی منفی نشان دهندۀ رابطۀ معکوس است.

منبع: اندازه گیری سنجش و ارزشیابی آموزشی نوشته دکتر علی اکبر سیف

ضریب همبستگی دو رشته ای نقطه ای:

زمانی که از دو متغیر مورد نظر که می‌خواهیم بین آنها ضریب همبستگی به دست آوریم یکی پیوسته و دیگری دو مقولگی یا دو ارزشی باشد از روش همبستگی دو رشته‌ای نقطه‌ای استفاده می‌کنیم . منظور از متغیر دو ارزشی آن است که تنها یکی از دو مقدار یک یا صفر را شامل می شود، مانند بله- نه، زن_مرد ، و قبول- رد. معمولا به منظور انجام محاسبات به یکی از این دو مقوله نمره ۱ و به یکی نمرۀ صفر(۰) داده می‌شود. نمونۀ روشن این نوع نمرۀ گذاری، نمره دادن به سوالهای آزمونهای عینی، مانند آزمونهای چند گزینه‌ای است.در این آزمونها به هر سوال درست نمرۀ ۱ و به هر سوال غلط نمرۀ ۰ داده می‌شود. فرمول محاسبه ضریب همبستگی دو رشته ای نقطه ای که مورد خاصی از ضریب همبستگی     گشتاوری است به صورت زیر است:

منبع: اندازه گیری سنجش و ارزشیابی آموزشی نوشته دکتر علی     اکبر سیف

ضریب همبستگی گشتاوری پیرسون:

متداول ترین روش همبستگی، همبستگی گشتاوری پیرسون است. اگر دو دسته نمرات X و Y     برای دو درس داشته باشیم با استفاده از نمرات خام می توان از فرمول زیر ضریب     همبستگی را به دست آورد:   

منبع: اندازه گیری سنجش و ارزشیابی آموزشی نوشته دکتر علی     اکبر سیف

آشنائی با روش ها و آزمونهای آماری

۱٫ آمار استنباطی و آمار توصیفی

در یک پژوهش جهت بررسی و توصیف ویژگیهای عمومی پاسخ دهندگان از روش های موجود در  آمار توصیفی مانند جداول توزیع فراوانی، در صد فراوانی، درصد فراوانی تجمعی و  میانگین استفاده میگردد. بنابراین هدف آمار توصیفی یا descriptive محاسبه  پارامترهای جامعه با استفاده از سرشماری تمامی عناصر جامعه است.

در آمار استنباطی یا inferential پژوهشگر با استفاده مقادیر نمونه آماره ها را  محاسبه کرده و سپس با کمک تخمین و یا آزمون فرض آماری، آماره ها را به پارامترهای  جامعه تعمیم می دهد.برای تجزیه و تحلیل داده ها و آزمون فرضیه های پژوهش از روش های  آمار استنباطی استفاده می شود.

پارامتر شاخص بدست آمده از جامعه  آماری با استفاده از سرشماری است و  شاخص بدست آمده از یک نمونه n تائی از جامعه   آماره نامیده می شود. برای مثال میانگین جامعه یا µ یک پارامتر مهم جامعه است. چون  میانگین جامعه همیشه در دسترس نیست  به همین خاطر از میانگین نمونه یا که آماره برآورد کننده پارامتر  µ است در بسیاری موارد  استفاده می شود.

۲٫ آزمون آماری و تخمین آماری

همانطور که در بخش روش  نگارش یک مقاله علمی-پژوهشی عنوان شد در یک مقاله پژوهشی یا یک پایان نامه باید  سوال پژوهش یا فرضیه پژوهش مطرح شود. اگر تحقیق از نوع سوالی و صرفا حاوی پرسش  درباره پارامتر باشد، برای پاسخ به سوالات از تخمین آماری استفاده می شود و اگر  حاوی فرضیه ها بوده و از مرحله سوال گذر کرده باشد، آزمون فرضیه ها و فنون آماری آن  به کار می رود.

هر نوع تخمین یا آزمون فرض آماری با تعیین صحیح آماره پژوهش شروع می شود. سپس  باید توزیع آماره مشخص شود. براساس توزیع آماره آزمون با استفاده از داده های بدست  آمده از نمونه محاسبه شده آماره آزمون محاسبه می شود. سپس مقدار بحرانی با توجه به  سطح خطا و نوع توزیع از جداول مندرج در پیوست های کتاب آماری محاسبه می شود. در  نهایت با مقایسه آماره محاسبه شده و مقدار بحرانی سوال یا فرضیه تحقیق بررسی و  نتایج تحلیل می شود. در ادامه این بحث موشکافی می شود.

۳٫ آزمون های آماری پارامتریک و ناپارامتریک

آمار پارامتریک که در خلال جنگ جهانی دوم شکل گرفت در برابر آمار پارامتریک قرار  می گیرد. آمار پارامتریک مستلزم پیش فرضهائی در مورد جامعه ای که از آن نمونه گیری  صورت گرفته می باشد. به عنوان مهمترین پیش فرض در آمار پارامترک  فرض می شود که  توزیع جامعه نرمال است اما  آمار ناپارامتریک مستلزم هیچگونه فرضی در مورد توزیع  نیست. به همین خاطر بسیاری از تحقیقات علوم انسانی که با مقیاس های کیفی سنجیده شده  و فاقد توزیع  (Free of distribution) هستند از شاخصهای آمارا ناپارامتریک استفاده  می کنند.

فنون آمار پارامتریک شدیداً تحت تاثیر مقیاس سنجش متغیرها و توزیع آماری جامعه  است. اگر متغیرها از نوع اسمی و ترتیبی بوده حتما از روشهای ناپارامتریک استفاده می  شود. اگر متغیرها از نوع فاصله ای و نسبی باشند در صورتیکه فرض شود توزیع آماری  جامعه نرمال یا بهنجار است از روشهای پارامتریک استفاده می شود در غیراینصورت از  روشهای ناپارامتریک استفاده می شود.

۴٫ خلاصه آزمونهای پارامتریک

آزمون t تک نمونه : برای آزمون فرض پیرامون میانگین یک جامعه  استفاده می شود. در بیشتر پژوهش هائی که با  مقیاس لیکرت انجام می شوند  جهت بررسی  فرضیه های پژوهش و تحلیل سوالات تخصصی مربوط به آنها از این آزمون استفاده می شود.

آزمون t وابسته : برای آزمون فرض پیرامون دو میانگین از یک  جامعه استفاده می شود. برای مثال اختلاف میانگین رضایت کارکنان یک سازمان قبل و بعد  از تغییر مدیریت یا زمانی که نمرات یک کلاس با پیش آزمون و پس آزمون سنجش می شود.

آزمون t  دو نمونه مستقل:جهت مقایسه میانگین دو جامعه استفاده  می شود. در  آزمون  t برای دو نمونه مستقل فرض می شود واریانس دو جامعه برابر است. برای نمونه به منظور بررسی معنی دار بودن تفاوت میانگین نمره نظرات پاسخ دهندگان بر  اساس جنسیت  در خصوص هر یک از فرضیه های پژوهش استفاده میشود.

آزمون t  ولچ: این آزمون نیز مانند آزمون  t  دو نمونه جهت  مقایسه میانگین دو جامعه استفاده می شود. در  آزمون  t ولچ فرض می شود واریانس دو  جامعه برابر نیست. برای نمونه به منظور بررسی معنی دار بودن تفاوت میانگین نمره  نظرات پاسخ دهندگان بر اساس جنسیت  در خصوص هر یک از فرضیه های پژوهش استفاده  میشود.

آزمون t هتلینگ : برای مقایسه چند میانگین از دو جامعه استفاده  می شود. یعنی دو جامعه براساس میانگین چندین صفت مقایسه شوند.

تحلیل واریانس (ANOVA): از این آزمون به منظور بررسی اختلاف  میانگین چند جامعه آماری استفاده می شود. برای نمونه جهت بررسی معنی دار بودن تفاوت  میانگین نمره نظرات پاسخ دهندگان بر اساس سن یا تحصیلات در خصوص هر یک از فرضیه های  پژوهش استفاده می شود.

برای مقایسه میانگین دو یا چند جامعه (یعنی تاثیر یک متغیر مستقل گروه بندی بر یک متغیر کمی وابسته) از این آزمون استفاده می شود.

نکته: در این آزمون نیز باید متغیر وابسته کمی و متغیر مستقل گروه بندی (Factor) دارای سطوح محدودی باشد.

در تحلیل واریانس فرضیه های تحقیق ممکن است به دو صورت درآیند،که عبارتند از :

۱٫ وجود تفاوت معنی دار بین گروههای متغیر :آیا میانگین های متغیر وابسته در گروههای ایجاد شده بوسیله متغیر فاکتور تغیر می کنند یا برابر هستند.

۲٫ وجود رابطه علت و معلولی در بین متغیرها: اگر میانگینهای متغیر وابسته در گروههای  ایجاد شده بوسیله متغیر فاکتور با هم برابر نباشند به این معناست که متغیر مستقل  بر مقادیر متغیر وابسته در گروهها ی متغیر فاکتور تاثیر دارد.اگر چنین باشد این دو متغیر (مستقل و وابسته)می توانند رابطه علت ومعلولی داشته باشند.در تحلیل واریانس،متغیر وابسته کمی است و عامل ها  که متغیرهای کیفی هستند. عامل نیزمی تواند بین آزمودنیها ( Between groups) یا درون آزمودنیها (within groups) باشد.

درآنالیز واریانس برای محاسبه تفاوت بین گروه ها از آزمون های تعقیبی استفاده می کنیم.

تحلیل واریانس چند عامله

در قسمت فوق تحلیل واریانس یک عامله مطرح شد یعنی تفاوت بین میانگین جوامع مختلف فقط بر حسب یک متغیر مستقل(Factor) بیان می شود. در صورتی که بخواهیم تفاوت بین میانگین جوامع را بر حسب دو یا چند متغیر مستقل بیان کنیم، به عبارتی بخواهیم اثر دو یا چند عامل را همزمان روی متغیر وابسته بررسی کنیم، لازم است از تحلیل واریانس چند عامله استفاده شود.

تحلیل واریانس چندعاملی (MANOVA): از این آزمون به منظور  بررسی اختلاف چند میانگین از چند جامعه آماری استفاده می شود.

پیش فرض آن:

-مشاهدات مستقل

– برابری واریانس ها

– برابری کواریانس ها

– نرمال بودن جامعه

شامل مانوا یک راهه و دو راهه و چند راهه میشود.

برای مقایسه میانگین اثرات یک یا چند متغیر مستقل بر روی یک متغیر وابسته براساس طرح های آزمایشی مختلف، روش های آماری متعددی مانند آزمون t و آزمون تحلیل واریانس تک متغیری ANOVAبکار گرفته می شود.اما در حالتی که بیش از یک متغیر وابسته مدنظر قرار دارد، با توجه به وابستگی بین متغیرهای وابسته از روش های تحلیل چند متغیره استفاده می شود.

در طرح تحلیل واریانس چند متغیری دو یا چند متغیر وابسته پیوسته با یک یا چند متغیر مستقل مقوله ای ارزیابی می شوند. برای مثال مطالعه اثرات جنسیت(مرد، زن) روی رضایت شغلی کارگران و غیبت آنان از کار و یا بررسی اثرات نوع تدبیر درمانی (رفتاری-شناختی، روان کاوی، درمان فشرده) روی ارزیابی کارکرد کلی(پیامد بالینی) و رضایت مراجع از خدمات درمانی، از این قبیل می باشد. فرضیه صفر برای این آزمون در حالت کلی به صورت زیر است :H_0: μ_۱=μ_۲=⋯=μ_i

این فرضیه بیان می کند که میانگین همه گروه ها در جامعه برابر می باشد. در روش MANOVA ماتریس حاصلضرب برداری کل(T) به دو گروه ماتریس حاصلضرب برداری بین گروه ها (B) و ماتریس حاصلضرب برداری درون گروه ها(W) تفکیک می شود.T=B+W Tمیزان انحراف نمونه ها از میانگین را در هر سطح متغیر مستقل یا گروه از میانگین کل هر متغیر وابسته را نشان می دهد.ماتریس B اثرات متفاوت تدابیرآزمایشی را روی مجموعه متغیرهای وابسته نشان می دهد.در نهایت W نشان می دهد که نمونه ها در هر سطح یا گروه متغیر مستقل چگونه از میانگین های متغیرهای وابسته منحرف می شوند. چهار آزمون آماری متعارف در این زمینه وجود دارد : اثر پیلایی، لامبدای ویلکز، اثر هتلینگ و روش بزرگترین ریشه دوم. پرکاربردترین این آماره ها لامبدای ویلکز می باشد که براساس نسبت Wبر B+Wساخته می شود.در عمل اگر اثرمتغیر مستقل بر متغیرهای وابسته از نظر آماری معنادار باشد، یعنی اگر تدابیرآزمایشی اثرگذار باشند، در اینصورت مقدار B نسبتا بزرگ و Wکوچک خواهد بود.

دلایل استفاده از MONOVA

اغلب اتفاق می افتد زمانی که هدف محقق بررسی بیش از یک متغیر وابسته است، به جای استفاده از روش های چند متغیری هر بار یکی از متغیرهای وابسته را در نظر گرفته و از روش ANOVA برای تحلیل استفاده می نماید. استفاده از این روش می تواند اشکالاتی را به وجود آورد که در ادامه به بیان آن ها می پردازیم : ۱- آزمون های آماری تک متغیری به طور معمول همبستگی متقابل متغیرهای وابسته را نادیده می گیرد. در حالیکه روش MANOVAهمبستگی متقابل بین متغیرهای وابسته را با بررسی ماتریس های واریانس کواریانس در نظر می گیرد.
۲- روش MANOVA محققان را قادر می سازد تا روابط بین متغیرهای وابسته را در هر سطحی از متغیرهای مستقل بررسی کنند. ۳- این روش به شناسایی متغیرهای وابسته با بیشترین توان تفکیک در گروه بندیکمک می کند. ۴- MANOVAبه واسطه توان افزایش یافته در موقعیت چند متغیری می تواند تفاوت های گروهی نامشخص تحت شرایط تحلیل های آماری تک متغیری را آشکار نماید. ۵- روش MANOVA سطح آلفای کلی یا میزان خطای نوع اول (یعنی احتمال این که فرض صفر درست بوده و به اشتباه رد شود)را کنترل می کند. برای مثال اگر بخواهیم تفاوت های جنسیتی(متغیر مستقل) را با چهار متغیر وابسته رضایت شغلی (پرداخت، مزایا، همکاران و محل کار) بررسی کنیم و برای این کار از چهار آزمون جداگانه t و یا روش ANOVAاستفاده نماییم، با سطح خطای ۵% برای هر آزمون با خطای نوع اول برابر ۰٫۰۵۴ مواجه خواهیم شد. در این حالت استفاده از روش MANOVA این مشکل را برطرف می کند.

چه موقع نباید از MANOVA استفاده کرد

حداقل دو حالت وجود دارد که تحت آن شرایط نباید از MANOVA استفاده نمود و یا اینکه در کاربرد آن ها باید جانب احتیاط رعایت شود : ۱- اگر همبستگی بین متغیرهای وابسته وجود نداشته باشد. موقعیت ایده آل برای استفاده از تحلیل واریانس چند متغیری زمانی است که متغیرهای وابسته دارای همبستگی متوسط باشند. ۲- در شرایطی که متغیرهای وابسته دارای همبستگی بسیار بالایی هستند نیز نباید از MANOVA استفاده شود. از نظر آماری اینگونه همبستگی ها خطر هم خطی چندگانه را افزایش می دهد. از لحاظ مفهومی متغیرهایی که دارای همبستگی بالایی هستند، ممکن است سازه ی یکسانی را اندازه گیری کنند و بنابراین در مطالعه به عنوان متغیرهای زائد تلقی شوند.

مفروضه ها و محدودیت های آماری در تحلیل واریانس چند متغیری

نرمال بودن چند متغیری : یکی از شرایط استفاده از تحلیل واریانس چند متغیری نرمال بودن چند متغیری متغیرهای وابسته می باشد.در صورت عدم برقراری این فرض از روش های مختلف تبدیل داده ها مختلف استفاده می شود. استقلال : شرکت کننده گان در تحقیق باید مستقل از یکدیگر باشند، به لحاظ آزمایشی می توان گفت اگر شرکت کنندگان به صورت تصادفی انتخاب شوند، فرض استقلال برقرار می شود. مقادیر پرت و گمشده : روش تحلیل واریانس چند متغیری به مقادیر پرت یا کرانه های متغیرهای وابسته بسیار حساس است. خارج نکردن مقادیر پرت از تحلیل و یا تبدیل نکردن این داده ها می تواند میزان خطای نوع اول و دوم را افزایش دهد.
همگنی ماتریس های واریانس-کواریانس : روش استاندارد برای ارزیابی برابری ماتریس های کواریانس آزمونت M باکس است، که در آن معناداری آماری شاخص ناهمگنی یا نابرابری محسوب می شود. از جمله روش های اصلاح نقض این مفروضه ها تبدیل متغیرهای وابسته است. خطی بودن : فرض بر آن است که بین جفت متغیرهای وابسته روابط خطی برقرار است. در صورت مشاهده روابط غیرخطی می توان از تبدیل های مناسب استفاده نمود.

تحلیل کوواریانس چندعاملی (MANCOVA): چنانچه در MANOVA بخواهیم  اثر یک یا چند متغیر کمکی را(به عنوان متغیر کنترل) حذف کنیم استفاده می شود.

ضریب همبستگی گشتاوری پیرسون: برای محاسبه همبستگی دو مجموعه  داده استفاده می شود.

۵٫ خلاصه آزمونهای ناپارامتریک

آزمون علامت تک نمونه : برای آزمون فرض پیرامون میانگین یک  جامعه استفاده می شود.

آزمون علامت زوجی : برای آزمون فرض پیرامون دو میانگین از یک  جامعه استفاده می شود.

ویلکاکسون : همان آزمون علامت زوجی است که در آن اختلاف نسبی  تفاوت از میانگین لحاظ می شود.

مان-ویتنی: به آزمون U نیز موسوم است و جهت مقایسه میانگین دو  جامعه استفاده می شود.

کروسکال-والیس: از این آزمون به منظور بررسی اختلاف میانگین  چند جامعه آماری استفاده می شود. به آزمون H نیز موسوم است و تعمیم آزمون U مان-ویتنی می باشد. آزمون کروسکال-والیس معادل روش پارامتریک آنالیز واریانس تک  عاملی است.

مفروضه های آزمون کروسکال والیس:

·        توزیع یکسان جامعه

·        انتخاب تصادفی نمونه از جامعه

·        گروهها با نمونه های مستقل ازهم باشند. 

نکته: آزمون H کروکسال والیس نیازمند این است که نمونه های مورد آزمایش از لحاظ شکل،مشابه باشند.

شرایط استفاده از آزمون H کروکسال والیس:

بیش از دو گروه را در یک متغییر که رتبه ای ، فاصله ای یا نسبی داشته باشیم–

  1. توزیع داده ها غیر طبیعی باشد.

  این آزمون معادل آزمون ANOVAاست.

فریدمن: این آزمون معادل روش پارامتریک آنالیز واریانس دو  عاملی است که در آن k تیمار به صورت تصادفی به n بلوک تخصیص داده شده اند.

آزمون فریدمن جهت اولویت بندی و رتبه بندی متغیر ها بر اساس بیشترین تاثیر بر متغیر وابسته می باشد. این آزمون برای طرح بلوکی کامل تصادفی شده است که به نام ابداع کننده آن میلتن فریدمن اقتصاددان معروف نامگذاری شده است در واقع آزمون فریدمن تعمیمی از آزمون علامت است یعنی برای ۲ تیمار، آزمون فریدمن هم ارز آزمون علامت است. آزمون فریدمن برای مقایسه چند گروه از نظر میانگین رتبه های آنهاست و معلوم می‌کند که آیا این گروه ها می‌توانند از یک جامعه باشند یا نه؟ مقیاس در این آزمون باید حداقل رتبه ای باشد. این آزمون متناظر غیر پارامتری آزمون F است و معمولا در مقیاس های رتبه ای به جای F به کار می‌رود و جانشین آن می‌شود (چون در F باید همگنی واریانس ها وجود داشته باشد که در مقیاسهای رتبه ای کمتر رعایت می‌شود). همچنین آزمون فریدمن برای تجریه واریانس دو طرفه (برای داده های غیر پارامتری) از طریق رتبه بندی به کار می‌رود و نیز برای مقایسه میانگین رتبه بندی گروه های مختلف. تعداد افراد در نمونه ها باید یکسان باشند که این از معایب این آزمون است. نمونه ها باید همگی جور شده باشند. بعبارت دیگر از این آزمون برای آزمون کردن فرضیه هایی استفاده می شود که از یک فرد چندین اندازه گیری بدست آمده است. برای محاسبه آزمون فریدمن، در هر فرد مقادیر متغیرهای وابسته را مرتب می کنید و سپس متوسط رتبه ها را مقایسه می کنید. اگر تمایل داشته باشید با نرم افزار این آزمون را انجام دهید می توانید از نرم افزار SPSS روند زیر را اجرا کنید: Analyze, Nonparametric tests, k related sample پس از انجام دستورات فوق در spss صفحه ای باز می شود که برای اجرای آزمون فریدمن باید گزینه مربوط به آزمون فریدمن را تیک بزنید. سپس، متغیر هایی که می خواهید از نظر میزان تاثیر مقایسه کنید به قسمت Test variable انتقال دهید و سپس گزینه ok را بزنید. برنامه spss در قسمت output دو جدول به شما ارائه می دهد.
آزمون کی دو (خی دو یا مربع کای، کای اسکوئر) این آزمون از نوع ناپارامتری است و برای ارزیابی همقوارگی متغیرهای اسمی به کار می‌رود. این آزمون تنها راه حل موجود برای آزمون همقوارگی در مورد متغیرهای مقیاس اسمی با بیش از دو مقوله است، بنابراین کاربرد خیلی زیادتری نسبت به آزمونهای دیگر دارد. این آزمون نسبت به حجم نمونه حساس است. این آزمون از جنبه‌ی کاربرد در تحلیل فرضیه‌ها٬ هم‌ردیف آزمون پارامتری T می‌باشد.
همچنین در نرم افزار SPSS به طریق زیر می توانید این آزمون را انجام دهید: Analyze, Nonparametric tests, chi-square نکته: اگر هدف، مقایسه سه گروه یا بیشتر(وابسته) باشد و داده ها رتبه ای یا داده های کمی غیر نرمال باشند از آزمون فریدمن استفاده می شود. اما اگر هدف، مقایسه سه گروه یا بیشتر(مستقل) باشد و داده ها کیفی اسمی باشند از آزمون خی دو استفاده می شود. همچنین انتخاب آزمون آماری برای دو متغیر که هر دو مقوله ای هستند آزمون خی دو است.
همانطور که که در مطالب فوق مشخص است این دو آزمون، آزمونهای ناپارامتری هستند. آزمونهای ناپارامتری، آزمون هائی می باشند که داده ها توزیع غیر نرمال داشته و در مقایسه با آزمون های پارامتری از توان تشخیصی کمتری برخوردارند. البته باید به یک نکته نیز توجه داشت که اگر نمونه بزرگ باشد، طبق قضیه حد مرکزی حتی اگر جامعه نرمال نباشد می توان از آزمون های پارامتریک استفاده نمود. موفق باشید.

نیکوئی برازش : برای مقایسه یک توزیع نظری با توزیع مشاهده شده  استفاده می شود و به  آزمون خی-دو یا χ² نیز موسوم است.  مدل معادلات ساختاری که در  آن پژوهشگر یک مدل نظری را براساس روابط متغیرها ترسیم کرده است از همین ازمون بهره  گرفته می شود. اکنون به تبع افزایش توانمندی نرم افزارهایی مانند LISREL می توان از  آن به سهولت استفاده کرد.

کولموگروف-اسمیرنف : نوعی آزمون نیکوئی برازش برای مقایسه یک  توزیع نظری با توزیع مشاهده شده است.

آزمون تقارن توزیع  : در این آزمون شکل توزیع مورد سوال قرار  می گیرد. فرض بدیل آن است که توزیع متقارن نیست.

آزمون میانه  : جهت مقایسه میانه دو جامعه استفاده می شود و  برای k جامعه نیز قابل تعمیم است.

مک نمار  : برای بررسی مشاهدات زوجی درباره متغیرهای دو ارزشی  استفاده می شود.

آزمون Q کوکران: تعمیم آزمون مک نمار در k نمونه وابسته است.

ضریب همبستگی اسپیرمن: برای محاسبه همبستگی دو مجموعه داده که  به صورت ترتیبی قرار دارند استفاده می شود.

مطالب ارائه شده  مقدمه ای بر روش ها و آزمونهای آماری بود. برای دانلود  متن کامل کتاب کلیک کنید.

جهت تدوین پژوهش های ISI و به زبان لاتین می توانید از مقاله  لاتین آمار کاربردی استفاده کنید.

منابع

۱- آذر، عادل(۱۳۸۴).  آمار و کاربرد آن در مدیریت، جلد اول، انتشارات سمت،  تهران، چاپ دوازدهم ۲- آذر، عادل(۱۳۸۶).  آمار و کاربرد آن در مدیریت، جلد دوم،  انتشارات سمت، تهران، چاپ یازدهم ۳- حبیبی، آرش(۱۳۸۵).بکارگیری نرم افزار CRM در شرکت ذوب آهن، پایان نامه کارشناسی ارشد ۴- سرمد، زهره و دیگران(۱۳۷۸). روش  های تحقیق در علوم رفتاری، انتشارات آگاه، تهران، چاپ دوم ۵- فرجی، نصرالله (۱۳۸۶). آمار علوم انسانی برای آمادگی داوطلبان کنکور کارشناسی ارشد، انتشارات  پوران پژوهش

یکی از تعاریف اساسی در علم آمار تعریف همبستگی و رابطه بین دو متغیر می باشد. بطور کلی شدت وابستگی دو متغیر به یکدیگر را همبستگی تعریف می کنیم. و ممکن علاوه بر شدت همبستگی جهت همبستگی نیز مورد نیاز پژوهشگر باشد. در آمار انواع زیادی از ضرایب همبستگی­ متفاوت وجود دارند که هر کدام همبستگی بین دو متغیر را با توجه به نوع داده­ها و شرایط متغیرها اندازه­گیری می­کنند. لذا با توجه به اهمیت این موضوع  که چه ضریب همبستگی را در چه زمانی مورد استفاده قراردهیم،

در اینجا قصد داریم به تعریف انواع همبستگی بپردازیم.

انواع ضرایب همبستگی

محاسبه ضرایب همبستگی تا حدود زیادی متاثر از مقیاس اندازه گیری متغیر ها است، بعنوان مثال برای متغیر­های اسمی جهت رابطه اصلا معنی ندارد، بین جنس و معدل تنها می­توان گفت که شدت وابستگی چه مقدار است اما افزایش یا کاهش جنس معنی ندارد.

با توجه به نوع متغیر ها ضریب همبستگی می­تواند یکی از حالت­های زیر را داشته باشد.

۱-   دو متغیر اسمی

۲-   دو متغیر رتبه­ای

۳-   دو متغیر فاصله­ای- نسبی

۴-   متغیر اسمی و متغیر رتبه ای

۵-   متغیر اسمی و متغیر فاصله­ای – نسبی

۶-   متغیر رتبه­ای و متغیر فاصله­ای – نسبی

برای هر کدام از حالت­های بالا ضرایب همبستگی متفاوتی وجود دارند  و محاسبه آنها  در نرم افزار های spss ، lisrel و R امکان پذیراست.

از آنجا که انتخاب ضریب همبستگی مناسب برای بررسی روابط بین متغیرها تحت تاثیر مقیاس اندازه گیری متغیرهای مورد بررسی است لذا تناسب بین سطوح اندازه گیری و ضریب همبستگی سازگار از این جدول برای تصمیم گیری مناسب است

آزمون های آماری

سطح سنجش متغیرها

متغیر وابستهy

متغیر مستقلx

خی دو – فی – وی کرامر – لاندا

اسمی

اسمی

خی دو – فی – وی کرامر – لاندا

ترتیبی

اسمی

تحلیل واریانس یکطرفه – تی تست

فاصله ای یا نسبی

اسمی

خی دو – فی – وی کرامر – لاندا

اسمی

ترتیبی

ضریب همبستگی رتبه ای اسپیرمن

ترتیبی

ترتیبی

خی دو – فی – وی کرامر – لاندا

اسمی

فاصله ای – نسبی

ضریب همبستگی پیرسون  r

فاصله ای – نسبی

فاصله ای – نسبی

ضریب همبستگی رتبه ای اسپیرمن

ترتیبی

فاصله ای – نسبی

هرگاه رابطه بین دو متغیر را بررسی کردیم و بین آن دو رابطه معنی دار وجود داشت می توانیم ضریب همبستگی و میزان شدت همبستگی را نیز محاسبه کنیم .

ضرایب همبستگی در واقع وابستگی دو متغیر را مشخص می کنند:

اگر ضریب همبستگی بین ۲۵/۰ تا ۳۵/۰ ضریب بسیار پایین است  – تنها ۴% تغییرات مشترک میان دو متغیر را نشان می دهد اگر ضریب همبستگی بین ۳۵/۰ تا ۶۵/۰ ضریب متوسط است – حدود ۲۵% تغییرات مشترک میان دو متغیر را نشان می دهد

اگر ضریب همبستگی بین ۶۵/۰ تا ۸۵/۰ ضریب بالایی است –تا ۷۲% تغییرات مشترک میان دو متغیر را نشان می دهد

انواع ضرایب همبستگی:

ضریب همبستگی چوپروف T :ضریب هبستگی چوپروف به منظور تعیین شدت وابستگی بین متغیرهای مورد مطالعه به کار گرفته می شود و مقدار آن همواره بین صفر ویک در نوسان می باشد زمانی از آن استفاده کرده که هر دو متغیر اسمی و یا یکی اسمی و دیگری ترتیبی باشد. اما نباید تعداد سطر و ستون با هم برابر باشند.یعنی در جدول توافقی ۲در۲ نمی توان از آن استفاده کرد. در چنین مواردی باید از ضریب فی استفاده کرد.

ضریب همبستگی فی: به منظور بررسی شدت همبستگی بین دو متغیر اسمی که جدول توافقی ۲ در ۲ می باشد مورد استفاده قرار می گیرد.خی دو سطح معنی دار بودن همبستگی بین دو متغیر را تعیین میکند اما ضریب فی شدت همبستگی آنها را نشان می دهد. مقدار آن همواره بین صفر و یک در نوسان است.

ضریب همبستگی پیرسون r : این ضریب میزان همبستگی بین دو متغیر فاصله ای یا نسبی را محاسبه کرده مقدار آن بین ۱+ و ۱-  می باشد اگر مقدار بدست آمده مثبت باشد به معنی این است که تغییرات دو متغیر به طور هم جهت اتفاق می افتد یعنی با افزایش در هر متغیر، متغیر دیگر نیز افزایش می یابد و برعکس اگر مقدار r منفی شد یعنی اینکه دو متغیر در جهت عکس هم عمل می کنند یعنی با افزایش مقدار یک متغیر مقادیر متغیر دیگر کاهش می یابد و برعکس.اگر مقدار بدست آمده صفر شد نشان میدهد که هیچ رابطه ای بین دو متغیر وجود ندارد و اگر ۱+ شد همبستگی مثبت کامل و اگر ۱- شد همبستگی کامل و منفی است.

ضریب کرامر: این ضریب برای تغیین میزان شدت همبستگی بین دو متغیر اسمی مورد استفاده قرارمی گیرد و آن را با (V2) نشان می دهند و مقدار آن نیز همواره بین صفر ویک در نوسان است.هم جدول توافقی بیشتر از ۲ در ۲ وهم برای مستطیلی بکار می رود .

ضریب همبستگی رتبه ای اسپیرمن : آن را با علامتP نشان می دهند و همواره بین ۱+ و ۱- می باشد از لحاظ سطح سنجش ترتیبی است.در صورتی که داده های ما به صورت فاصله ای و نسبی باشند می توانیم آنها را به رتبه تبدیل کنیم.مهم نیست کدام متغیر وابسته و کدام متغیر مستقل است.

نکته مهم : اگر ضریب همبستگی صفر باشد نشاندهنده عدم وجود همبستگی است ضریب همبستگی همواره بین ۱+ و ۱- در نوسان است اگر ضریب همبستگی کمتر از صفر باشد همبستگی ناقص و منفی است یعنی با افزایش یک متغیر دیگری کاهش می یابد اگر ضریب همبستگی بزرگتر از صفر باشد ناقص و مثبت است یعنی با افزایش یک متغیر، دیگری  نیز افزایش می یابد اگر صفر باشد نشاندهنده عدم وجود همبستگی است.

تحلیل رگرسیون

تحلیل رگرسیون چند متغییری روش تحلیل نیرومندی است که در انواع مسایل می توان از آن استفاده کرد و در تحقیقات جامعه شناسی، روانشناختی، اقتصادی و … کاربرد دارد.از آن در متغیرهای پیوسته و متغیرهای طبقه ای استفاده می شود و آن را می توان با دو متغییر مستقل، سه متغیر مستقل و یا بیشتر استفاده کرد. یکی از انواع روش های تحقیق توصیفی (غیر آزمایشی) تحقیق همبستگی است. در این نوع تحقیق رابطه میان متغیرها بر اساس هدف تحقیق تحلیل می‌گردد(کلینجر، ۱۳۸۹: ۱۲).

رگرسیون تکنیکی است که از طریق آن به  تغییر متغیر وابسته از طریق تغییرات متغیر مستقل یا  از طریق ترکیب خطی دو یا چند متغیر مستقل تبیین و پیش بینی می شود . دقت و توانایی اندازه گیری در روش تحلیل رگرسیون بالاست.

تحلیل رگرسیون از لحاظ ساختاری را می توان به سه دسته تقسیم کرد.

۱تحلیل رگرسیون ساده: تغییرات متغیرy  را از طریق یک متغیرx برآورد می کند و تابع رگرسیون خطری بصورت  y=a+bx  است.

۲٫   تحلیل رگرسیون چند گانه:  در آن واریانس متغیر y از طریق مشارکت نسبی و ترکیب خطی دو یا چند متغیر مستقل تبیین می شود و یک متغیروابسته و مجموعه ای از متغیرهای مستقل وجود دارد.

ترکیب خطی:   b2x2+….+ bixi y=a+b1x1+

X3

۳٫      تحلیل رگرسیون چندگانه چند متغیره (ساعی، ۱۳۸۷: ۱۵۲).

تحقیقات همبستگی را می‌توان بر حسب هدف به سه دسته تقسیم کرد:

الف) مطالعه همبستگی دو متغیری، ب) تحلیل رگرسیون، ج) تحلیل ماتریس همبستگی یا کواریانس. در مطالعات همبستگی دو متغیری، هدف بررسی رابطه دو به دو متغیرهای موجود در تحقیق است. در تحلیل رگرسیون هدف پیش بینی تغییرات یک یا چند متغیر وابسته (ملاک) با توجه به تغییرات متغیرهای مستقل (پیش بین) است. در بعضی بررسی ها از مجموعه همبستگی های دو متغیری متغیرهای مورد بررسی در جدولی به نام ماتریس همبستگی یا کواریانس استفاده می‌شود. از جمله تحقیقاتی که در آن ها ماتریس همبستگی یا کواریانس تحلیل می شود، تحلیل عاملی و مدل معادلات ساختاری است. در تحلیل عاملی هدف تلخیص مجموعه ای از داده ها یا رسیدن به متغیرهای مکنون (سازه) و در مدل معادلات ساختاری آزمودن روابط ساختاری مبتنی بر نظریه ها و یافته های تحقیقاتی موجود است. در زیر با تفضیل بیشتر هر یک از موارد فوق مورد بحث قرار می‌گیرد. (سرمدی، ۱۳۷۶: ‌)

تحقیق همبستگی دو متغیری

   در این گونه تحقیقات هدف تعیین میزان هماهنگی تغییرات دو متغیر است. برای این منظور بر حسب مقیاس های اندازه گیری متغیرها شاخص های مناسبی اختیار می‌شود از آنجا که در اکثر تحقیقات همبستگی دو متغیری از مقیاس فاصله ای با پیش فرض توزیع نرمال دو متغیری برای اندازه گیری متغیرها استفاده می شود، لذا ضریب همبستگی محاسبه شده در این گونه تحقیقات ضریب همبستگی گشتاوری پیرسون یا به طور خلاصه ضریب همبستگی پیرسون است.

به عنوان مثالی از تحقیق همبستگی دو متغیری به تحقیقی از این نوع در اینجا اشاره می‌شود: پژوهشگران برای آزمودن رابطه ”استادهای درونی و باثبات“ با متغیر ”احساس لیاقت“ در عملکردهای موفق و ناموفق فرضیه هایی را مورد آزمون قرار دادند و برای این امر از ضرایب همبستگی دو متغیری پیرسون استفاده کردند. نمره مثبت اسناد مرکز علیت نشانگر اسنادهای درونی و نمره منفی آن نشانگر اسنادهای بیرونی بود. نمره مثبت اسناد ثبات نشانگر اسنادهای باثبات و نمرات منفی آن نشانگر اسنادهای بی ثبات بود.

فرضیه های مورد آزمون عبارت بودند از:

فرضیه ۱: احساس لیاقت با اسنادهای درونی و باثبات برای عملکردهای موفق همبستگی مثبت دارد.

فرضیه ۲: احساس لیاقت با اسنادهای درونی و باثبات برای عملکردهای ناموفق همبستگی منفی دارد.

در این تحقیق متغیرهای مورد بررسی به شرح زیر است: ۱-احساس لیاقت، ۲-عملکرد در آزمون، ۳-اسناد مرکز علیت برای عملکرد ناموفق، ۴-اسناد باثبات برای عملکرد ناموفق، ۵-اسناد مرکر علیت برای عملکرد موفق و ۶-اسناد ثبات برای عملکرد موفق.

باید توجه داشت که نمره مثبت اسناد مرکز علیت نشانگر اسنادهای درونی و نمره منفی آن نشانگر اسنادهای بیرونی بود. نمره مثبت اسناد ثبات نشانگر اسنادهای باثبات و نمرات منفی آن نشانگر اسنادهای بی ثبات بود.

فرضیه های مورد بررسی عبارت است از:

۱- در عملکردهای موفق، احساس لیاقت با اسناد درونی همبستگی مثبت دارد.

۲- در عملکردهای موفق، احساس لیاقت با اسنادهای باثبات همبستگی مثبت دارد.

۳- در عملکردهای ناموفق، احساس لیاقت با اسناد درونی همبستگی منفی دارد.

۴- در عملکردهای ناموفق، احساس لیاقت با اسنادهای باثبات همبستگی منفی دارد.

ضرایب همبستگی این متغیرها در جدول زیر داده شده است و معنی داری این ضرایب همبستگی با یک یا دو ستاره مشخص شده است. (سرمدی، ۱۳۷۶: ‌)

جدول ضرایب همبستگی متغیرهای اندازه گیری شده در بررسی رابطه های اسنادهای درونی و باثبات با احساس لیاقت: در مثال فوق با توجه به معنی دار بودن برخی از ضرایب همبستگی ملاحظه می‌شود که فرضیه ۱ که به رابطه احساس لیاقت با اسنادهای باثبات در عملکردهای موفق مربوط است تایید می‌گردد. (r=0.22  , Pهمبستگی احساس لیاقت با اسناد درونی و باثبات برای عملکردهای ناموفق منفی و معنی دار است (r=-.029 , P پژوهشگران با توجه به نتایج به دست آمده از همبستگی های دو متغیری به آزمودن فرضیه های یاد شده پرداخته اند. ( همان: )

در تحقیقاتی که از تحلیل رگرسیون استفاده می شود، هدف معمولا پیش بینی یک یا چند متغیر ملاک از یک یا چند متغیر پیش بین است. چنانچه هدف پیش بینی یک متغیر ملاک از چند متغیر پیش بین باشد از مدل رگرسیون چندگانه استفاده می‌شود. در صورتی که هدف، پیش بینی همزمان چند متغیر ملاک از متغیرهای پیش بین یا زیر مجموعه ای از آنها باشد از مدل رگرسیون چند متغیری استفاده می‌شود. در تحقیقات رگرسیون چندگانه هدف پیدا کردن متغیرهای پیش بینی است که تغییرات متغیر ملاک را چه به تنهایی و چه مشترکا پیش بینی کند. ورود متغیرهای پیش بین در تحلیل رگرسیون به شیوه های گوناگون صورت می‌گیرد. در این جا سه روش اساسی مورد بحث قرار می‌گیرد:

الف) روش همزمان،    ب)روش گام به گام،     ج) روش سلسله مراتبی.

در روش همزمان تمام متغیرهای پیش بین با هم وارد تحلیل می‌شود. در روش گام به گام اولین متغیر پیش بین بر اساس بالاترین ضریب همبستگی صفرمرتبه با متغیر ملاک وارد تحلیل می‌شود. از آن پس سایر متغیرها پیش بین بر حسب ضریب همبستگی تفکیکی (جزئی) و نیمه تفکیکی (نیمه جزئی) در تحلیل وارد می‌شود. در این روش پس از ورود هر متغیر جدید ضریب همبستگی نیمه تفکیکی یا تفکیکی ، تمام متغیرهایی که قبلا در معادله وارد شده اند به عنوان آخرین متغیر ورودی مورد بازبینی قرار می‌گیرد و چنانچه با ورود متغیر جدید معنی داری خود را از دست داده باشد، از معادله خارج می‌شود. به طور کلی در روش گام به گام ترتیب ورود متغیرها در دست محقق نیست.

در روش سلسله مراتبی ترتیب ورود متغیرها به تحلیل بر اساس یک چارچوب نظری یا تجربی مورد نظر محقق صورت می‌گیرد. به عبارت دیگر پژوهشگر شخصا درباره ترتیب ورود متغیرها به تحلیل تصمیم گیری می‌کند. این تصمیم گیری که قبل از شروع تحلیل اتخاذ می‌شود می‌تواند بر اساس سه اصل عمده زیر باشد:

– رابطه علت و معلولی.

– رابطه متغیرها در تحقیقات قبلی.

– ساختار طرح پژوهشی (برای مثال در طرح های عاملی ابتدا اثرهای اصلی و سپس اثرهای متقابل آنها وارد تحلیل می‌شود).

از آن جا که روش تحلیل رگرسیون سلسله مراتبی با توجه به چارچوب نظری یا تجربی وپژه ای صورت می گیرد، در تحقیقات علوم رفتاری از اهمیت خاصی برخوردار است. لازم به تذکر است که برای این گونه تحقیقات آشنایی با روشهای آماری تحلیل رگرسیون الزامی است.(سرمدی،۱۳۷۶: )

رگرسیون چند متغیری

روشی است که برای تحلیل مشارکت جمعی و فردی دو یا چند متغیر مستقل X در تغییرات متغیر وابسته Y، وظیفه اساسی علم تبیین پدیده هاست. در واقع مجموعه ای از سازه ها یا متغیرهاست که با مشخص کردن روابط موجود میان متغیرها به تبین آنها می پردازیم.(کلینجر، ۱۳۸۹: ۱۲ )

بررسی علمی هر سازه یا متغیر مستلزم آن است که منابع تغییر آن سازه یا متغیر تشخیص داده شود، می گویند که متغیر تغیر کرده است.وظیفه رگرسیون چند متغییری این است که به تبیین واریانس متغیر وابسته کمک کند و این وظیفه را تا حدودی از طریق برآورد مشارکت متغییرها (۲ یا چند متغیر مستقل) در واریانس به انجام می رسانند. (همان: ۱۳)

در نظریه سنتی ، محقق ابتدا رابطه یک متغیر مستقل را با متغیر وابسته مطالعه می کند، سپس رابطه متغیرمستقل دیگری را با آن متغیر وابسته مطالعه می کنند و این کار تا آخر ادامه می یابد.طرح سنتی تحقیق هم بصورت کلاسیک گروه آزمایش و گروه کنترل عرضه می شد. (همان: ۱۴)

کاربرد رگرسیون چند متغیری بر پیش بینی یک متغیر وابسته از طریق چند متغیر مستقل تاکید دارد که موجب تبیین موضوع می شود. در واقع تبیین علمی مبتنی است بر تعیین روابط موجود میان رویدادهای تجربی.متغیر وابسته به صورت Y و متغیر مستقل به صورت Xi,X1,X2.X3….. Xk نشان داده می شود.

تحلیل رگرسیون چند متغیری و تحلیل واریانس در واقع یک چیزند. تحلیل واریانس برای تحلیل داده های حاصل از آزمایشهای طرح ریزی شده است.اگر بیش از یک متغیر در آزمایش وجود داشته باشد، یکی از شرایط استفاده ار آن این است که متغیرهای آزمایشی ناوابسته باشند (همان: ۱۸).

تحلیل رگرسیون چند متغیری نظیر هر روش دیگر یک ابزار است که کمک می کند به فهم پدیده های طبیعی و این واریانس یا کوواریانس است که به لحاظ فنی راهگشای ما در روشهای تحلیلی است. همچنین به منظور جبران بعضی از اشتباهاتی که در رگرسیون چند متغیره به وجود می آید باید نمونه بزرگتر ( در حدود ۵۰۰) استفاده کرد.

متغیر مستقل:

دو نوع است

–  متغیر فعال- متغیری که براثر دخل و تصرف ایجاد می شود.

–   متغیر منسوب- متغیری است که سنجیده می شود.مثل هوس و استعداد تحصیلی.(همان: ۱۸).

روش محاسبات به شیوه ای انجام می شود که با داشتن همبستگی در بین تمام متغیرها، بهترین پیش بینی میسر می شود. به بیان دیگر بجای استفاده ازX، پس از  Y می گوییم اگر ۱,X2.X3….. Xk پس از Y و نتایج محاسبات بما بگوید که پیش بینی چقدر خوب است و بهترین ترکیب خطی متغیرها تقریبا چه مقدار از واریانس Y را تبیین می کند ( کلینجر،۱۳۸۸: ۳۳۳)

رگرسیون خطی

وقتی که الگوی اصلی رابطه بین دو متغیر به کمک نمودار پراکنش مشخص شده باشد می توان آن الگورا بطور موجز و دقیق بامعادله‌ی خط رگرسیون بیان کرد. این معادله به مثابه‌ی قاعده پیش بینی مقادیر یک متغیر بر اساس مقادیر دیگر است (مولر،۱۳۸۹: ۲۷۱).

در رگرسیون خطی، متغیر وابسته yi ترکیب خطی، خطی از ضرایب (پارامترها) است (لازم نیست که نسبت به متغیرهای مستقل خطی باشد). مثلاً تحلیل رگرسیونی سادهٔ زیر با N نقطه، متغیر مستقل xi و ضرایب β۰ و β۱ خطی است:

خط راست:

در رگرسیون چندگانه، بیش از یک متغیر مستقل وجود دارد:

سهمی:

این همچنان رگرسیون خطی است، زیرا yi همچنان ترکیب خطی پارامترها۰ و β۱) است، هرچند که نسبت به متغیر مستقل (xi) خطی نیست.

در هر دو حالت، εi مقدار خطاست و پانویس i شمارهٔ هر مشاهده (هر جفت xi و yi) را نشان می‌دهد. با داشتن مجموعه‌ای از این نقطه‌ها می‌توان مدل را به دست آورد:

عبارت ei مانده نام دارد: . روش رایج برای به‌دست‌آوردن پارامترها، روش کمترین مربعات است. در این روش پارامترها را با کمینه‌کردن تابع زیر به دست می‌آورند:

در مورد رگرسیون ساده، پارامترها با این روش برابر خواهند بود با:

که در آن و میانگین x و y هستند.(وکیپدیا)

رگرسیون خطی ساده:

رگرسیون و همبستگی بهم نزدیک هستند. r برای نشان دادن همبستگی بکار می رود و در واقع معنی رگرسیون را دارد. منظور از مطالعه رگرسیون چگونگی بازگشت نمره yبه نمره x و مطالعه چگونگی وابستگی آنها به نمره x است.( کلینجر،۱۳۸۹: ۳۳)

به لحاظ آماری اگر X و Y همبسته نباشند بهترین میانگین است. هرچه همبستگی قوی تر باشد پیش بینی هم دقیق تر می شود. وقتی قدرrبه ۰۰/۱ برسد پیش بینی کامل است. هرجه r به سمت صفر میل کند پیش بینی  Y از طریق  X هم ناقص تر می شود و به سوی میانگین بازگشت می‌کند و اگر قدر مطلق r معادل ۱ باشد بر روی خط رگرسیون قرار می گیرد.(کلینجر، ۱۳۸۸: ۳۳۳)

آزمونهای معنی دار بودن

آزمونهای معنا دار بودن آماری در تحلیل رگرسیون ( چه ساده و چه چند متغیری ) مشابه آزمون‌های معنادار بودن آماری در تحلیل واریانس اند.

با استفاده از تحلیل واریانس شخص می تواند واریانس سیستماتیک و واریانس اشتباه تجزیه کند. در ساده ترین شکل واریانس کلبه واریانس بین گروهی (یا واریانس آزمایشی) و واریانس درون گروهی( یا وارانس اشتباه) تجزیه می شود.

معادله اساسی در تحلیل واریانس چنین است:

Stt=ssb+ssw

Stt : مجموع مجذورات کل –  ssb مجموع مجذورات بین گروهی –  ssw مجموع مجزورات بیرون گروهی. (کلینجر،۱۳۸۹: ۳۳)

آزمون معنی دار بودن را به دو یا سه طریق می توان انجام داد:

۱-    از طریق جدول معنی دار بودن r ها در سطح های مختلف مراجعه کنبم و معنی دار بودن همبستگی را می آزماییم.

۲-    از طریق آزمون Tو کوکران 

۳-    نمره استاندارد

نمرا ت استاندارد در حقیقت نمره انحراف استاندارد است. اگر نمره انحراف از میانگینx=X-X را برای انحراف استانداردمجموعه نمره ها s تقسیم کنیم نمره استاندارد به دست می آید.

Zx= X-X =x

Sx    sx                                           

Zxنمره استاندارد- Sx انحراف استاندارد- X میانگین نمره های x- x نمره خام

میانگین نمره های استاندارد معادل صفر و انحراف استاندارد معادل ۱ است

تحلیل رگرسیون را می توان با نمره های استاندارد انجام داد.(کلینجر، ۱۳۸۹: ۴۳)

رگرسیون چند متغیر خطی

روش رگسیون چند متغیر خطی اندیشه های ارایه شده در قسمت بیش از پیش از یک متغیر مستقل گسترش می دهد . می خواهیم متغیر وابسته  y را از روی اطلاعات مربوط به مقادیر مستقل یا بیشتر   x1 ، x2، x3،…. xk پیش بینی کنیم.( کلینجر: ۱۳۸۸: ۳۳۸).

رگرسیون چند متغیری یک روش کلی برای تحلیل بسیاری از داده های پژوهش رفتاری است. بعضی روشهای دیگر تحلیل را می توان حالتهای خاصی از رگرسیون چند متغیری در نظر گرفت. برجسته ترین اینها تحلیل واریانس است که تمام انواع آن را می توان با تحلیل رگرسیون به مفهوم کشید و انجام داد. تحلیل رگرسیون چند متغیر را می توان به عنوان روشی نیرومند و اصلاح شده منترل واریانس در نظر گرفت. بطور خلاصه ، تحلیل رگرسیون چند متغیری یک فن فرضیه آزمایی و استنباط سازی قوی است، زیرا به دانشمندان کمک می‌کند، روابط درونی پیچیده بین متغیرهای مستقل و یک متغیر وابسته را با دقت نسبی مطالعه کند، بدین ترتیب به آنها کمک می کند پدیده احتمالی معرفی شده بوسیله متغیر وابسته را تبیین کنند.( همان: ۳۳۶)

رابطه و همستگی

همبستگی رابطه است و مجموعه ای از زوجهای مرتب را شامل می شود. همبستگی به معنای هم تغییری دو متغیر است. ضریب همبستگی شاخص جهت و مقدار رابطه است. ضریب همبستگی پیرسون (r) به وسیله چند فرمول هم ارز تعریف می شود.

x = X +X                 ,            y = Y+Y

rxy=

rxy=

rxy=

z= نمره استاندارد       و          x,y=انحراف از میانگین

نمایش نمودار در تحلیل رگرسیون بسیار اهمیت دارد که در آن مجموعه ای از زوجهای مرتب را بر روی صفحه مخــتصات می توان نشان داد. این نمودار خود یــک رابطه است چون مجموعه ای از زوجهای مرتب را نشان مــی دهد. (کلینجر،۱۳۸۹: ۲۴)

مجموع مجذورات

مجموع مجزورات ( مجموعه توانهای دوم) هر مجموعه ای از اعداد می توان به دو صورت تعریف کرد:

۱-   بصورت نمره های خام

۲-    بصورت نمره های انحراف

مجموع مجذورات نمره های خام را اغلب محاسبه می کنند و به صورت۲Xi Σ که در آن i=1.2.3…..N  و N تعداد آزمونهاست محاسبه می شود.(همان:۲۶)

و فورمول آن:

Σ X 2 = Σ X – (Σ X)2

                   N

مجموع مضروبات در شکل نمره خام به صورت ΣXY و در شکل نمره های انحراف به صورتxy  Σ نشان می‌دهند. که فورمول آن:

ΣXY= ΣXY – (ΣX) (ΣY)

                             N

مجموع های مجذورات و مضروبات ارکان تحلیل رگرسیون اند.(همان:۲۷)

واریانس و کوواریانس

معدل مجذورات انحراف مجموعه ای از اندازه‌ها از میانگین را واریانس می گویند. (ریشه دوم واریانس را انحراف استاندارد می گویند)در نظریه احتمالات و آمار واریانس یا وردایی نوعی سنجش پراکندگی است. مقدار واریانس با میانگین‌گیری از مربع فاصله مقدار محتمل و یا مشاهده شده با مقدار مورد انتظار محاسبه می‌شود. در مقایسه با میانگین می‌توان گفت که میانگین مکان توزیع را نشان می‌دهد، در حالی که واریانس مقیاسی است که نشان می‌دهد که داده‌ها حول میانگین چگونه پخش شده‌اند. واریانس کمتر بدین معنا است که انتظار می‌رود که اگر نمونه‌ای از توزیع مزبور انتخاب شود مقدار آن به میانگین نزدیک باشد. یکای واریانس مربع یکای کمیت اولیه می‌باشد. ریشه دوم واریانس که انحراف معیار نامیده می‌شود دارای واحدی یکسان با متغیر اولیه است.

واریانس فصل مشترک دو زیر مجموعه یا Y   X  را کوواریانس می گویند و از طریق گرفتن معدل مضروبات محاسبه می شود. در واقع کوواریانس رابطه بین  X و Y را بصورت دیگر بیان می کند.(همان: ۲۸)

تحلیل واریانس را می توان با استفاده از رگرسیون چند متغیری انجام داد. تحلیل کوواریانس، داده‌های پیش آزمون و پس آزمون، تعداد نابرابر موارد در هر خانه جدول (طرح های عاملی) و بررسی داده های آزمایشی و غیرآزمایشی، بطور طبیعی و به آسانی با تحلیل رگرسیون چند متغیری قابل بررسی است (کلینجر،۱۳۸۸، ۳۶۹).

تحلیل ماتریس کواریانس یا همبستگی

در مواقعی که محقق از همبستگی مجموعه ای از متغیرها بخواهد تغییرات متغیرها را در عامل های محدود تر خلاصه کند یا خصیصه های زیر بنایی یک مجموعه از داده ها را تعیین نماید از روش تحلیل عاملی استفاده می‌کند. در صورتی که محقق بخواهد مدل خاصی را از لحاظ روابط متغیرهای تحت بررسی بیازماید، از روش مدل معادلات ساختاری استفاده می‌کند. برای هر دو منظور فوق لازم است که ماتریس کواریانس متغیرهای اندازه گیری شده تحلیل شود.

ماتریس کواریانس در تحلیل عاملی با دو هدف متفاوت می‌تواند تحلیل شود: ”هدف اکتشافی“  و ”هدف تاییدی“. چنانچه هدف اکتشافی باشد دو رویکرد متفاوت وجود دارد:

۱- تعیین سازه یا متغیرهای مکنون در یک حوزه از عملکرد که به وسیله ابزارهای اندازه گیری خاصی ارزیابی شده اند. این هدف از طریق روش ”عامل مشترک“ میسر می‌شود.

۲- تلخیص داده ها: در این روش متغیرهای به دست آمده به صورت شاخص های خلاصه تری در می‌آیند. تلخیص داده ها معمولا از طریق روش ”مولفه های اصلی“ صورت می‌گیرد.

در صورتی که محقق درباره تعداد عامل های خصیصه ها فرضیه ای نداشته باشد، تحلیل اکتشافی و در صورتی که فرضیه موجود باشد تحلیل تاییدی نامیده می‌شود.(سرمدی، ۱۳۷۶:  )

تاثیر کلی دو متغیر مستقل بر متغیر واسته به وسیله مجذور ضریب همبستگی به نام ضریب همبستگی چند متغیره یا R2 بیان می شود. مجموع مجذورات رگرسیون آن نسبت را از کل مجوع مجذورات  yرا بیان می کند که از رگرسیونy یا متغیر وابسته بر x1  و x2 یعنی متغیرعای مستقل ناشی می شود و مجموع مجذورات مازاد آن نسبت از مجموع مجذورات کل را بیان یم کند که از رگرسیون ناشی نمی شود. همیشه مجزور خطاهای پیش بینی را به حد اقل رساند( کلینجر، ۱۳۸۸: ۳۴۳).

با تحلیل واریانس عاملی، تحلیل کواریانس و متغیر اسمی است که ما به ارزش تحلیل رگرسیون چند متغیره پی می بریم. اشکالی زیربنایی در تحقیق و تحلیل آن است که متغیرهای مستقل مورد علاقه ما اغلب با یکدیگر همبسته اند، اما در تحلیل واریانس فرض بر این است که آنها مستقل از یکدیگر اند( همان:۳۷۹). 

مدل معادلات ساختاری

در تحقیقاتی که هدف، آزمودن مدل خاصی از رابطه بین  متغیرها است، از تحلیل مدل معادلات ساختاری یا مدل های علّی استفاده می‌شود. در این مدل داده ها به صورت ماتریس های کواریانس یا همبستگی درآمده و یک مجموعه معادلات رگرسیون بین متغیرها تدوین می‌شود. چنانچه در مدل برای هر متغیر از بیش از یک نشانگر استفاده شود، مدل شامل مولفه اندازه گیری نیز می‌شود. تحلیل مدل معادلات ساختاری برآوردهایی از پارامترهای مدل (ضرایب مسیر و جملات خطا) و چند شاخص نیکویی برازش فراهم می آورد.(سرمدی،۱۳۷۶: )

کنترل آماری متغیرها:

بررسی روابط میان متغیرها کار ساده ای نیست و سوال اساسی آن است که آیا رابطه ای تحت بررسی است همان رابطه مورد نظر است؟ این مساله اعتبار روابط خوانده می شود. با توجه به آن که بررسی کار مشکلی است پس کنترل نیز کار پیچیده ای است.

مقصود از کنترل در تحقیقات علمی کنترل واریانس است که از چند طریق رخ می‌دهد:

۱٫   برپا داشتن یک آزمایش، که ساده ترین نوع است و شامل یک گروه کنترل و یک گروه آزمایشی است. پژوهشگر با دخل و تصرف در متغیر آزمایشی، تفاوت بین گروه آزمایشی و گروه کنترل(یعنی واریانس) را بالا می برد.

۲٫   از طریق گزینش آزمودنیها.

۳٫  آزمودنیها بصورت تصادفی به گروههای آزمایش منسب می شود.

مفهوم کنترل درواقع این است که میان آزمونها، صرف نظر از خاستگاه‌های این تغییرات، به موجب تعریف بالسویه در چند گروه آزمایش توزیع می شوند.

چون تحقیقات رفتاری اغلب از حیث ماهیت از نوع تحقیقات بعد از واقعه هستند، کنترل آنها از طریق دخل و تصرف مستقیم محقق ممکن نیست.

۴٫    بررسی صحت و سقم فرضیه های که فرضیه اصلی رقابت دارند

نتیجه: عملکرد صورتهای مختلف کنترل یکی است

مقصورد از کنترل، کنترل واریانس است.

منظور از کنترل آماری این است که شخص برای آنکه قسمتی از واریانس متغیر وابسته را که به ظاهر از یک یا چند متغیر مستقل خارج از رابطه خاص یا روابط تحت بررسی ناشی می شود از روشهای آماری استفاده کند  (کلینجر،۱۳۸۹:۱۲۱).

همبستگی تفکیکی  و رگرسیون چند متغیری

همبستگی تفکیکی رابا استفاده از تحلیل رگرسیون می توان محاسبه کرد. در واقع همبستگی تفکیکی یک فن کنترل است که بر حسب آن باقی مانده های هر یک از دو متغیر رابطه بر متغیر سومی که تاثیر آن را باید از روی رابطه برداشت شود، ابقا می کند. در همبستگی تفکیکی مرتبه اول، تاثیر یک متغیر از روی همبستگی بین دو متغیر دیگر برداشته می شود(همان:۱۲۳).

همبستگی تفکیکی فقط به سه متغیر محدود نمی شود، همبستگی های تفکیکی به اصطلاح مراتب بالاتر را هم می توان محاسبه کرد. مرتبه همبستگی تفکیکی توسط تعداد متغیرهای تفکیک شده معین می شود(همان:۱۳۱).

همبستگی نیمه تفکیکی

همبستگی نیمه تفکیکی با تحلیل رگرسیون چند متغیری مرتبط است و در آن نقش مهمی ایفا می‌کند. اهمیت آن در تفسیر داده های رگرسیون چند متغیری بیشتر جلوه می کند. همبستگی تفکیکی واریانس ناخواسته را از هر دو متغیر تحت بررسی تفکیک می کرد. نام دیگر آن همبستگی پاره ای خوانده می شود (همان: ۱۳۴).

کنترل ، تبیین و تفسیر، تحلیل

تفسیر: تفسیر نتایج حاصل تحلیل رگرسیون چند متغیری است. در تحلیل رگسیون چند متغیری منظور تنها این نیست که بدانیم چگونه ترکیبی از متغیرهای مستقل و وابسته را پیش بینی کنیم. بلکه آگاهی از مقدار مشارکت هر متغیر در پیش بینی مد نظر است. تفسیر یافته های حاصل از تحلیل رگرسیون چند متغیری ممکن است سخت باشد.

همبستگی تفکیکی و نیمه تفکیکی دارای مقاصد و کاربرهای مختلفی اند که در عین حال با هم مرتبط هم هستند. همبستگی تفکیکی بمنظور کنترل بکار می رود و زمانی که محقق بخواهد رابطه بین دو متغیر را خارج از تاثیرات متغیرهای دیگر مطالعه کند (کلینجر،۱۳۸۹: ۳۸۴).

تبیین: تبیین متغیر وابسته از طریق مشخص کردن مشارکت نسبی متغیرها و روابط میان آنها بر می‌گردد. ما به شاخص آماری صرف علاقه نداریم. علاقه ما متوجه تبیین پدیده هاست که توسط متغیر وابسته معرفی می شود .

زبان آماری ما را در رسیدن به این هدف غایی یعنی تفسیر، تبین  روابط ماهوی میان متغیرها یاری می کند و تحلیل رگرسیون چند متغیری در تصویر بزگ تر علمی آزمون قضایای استخراج شده از نظریه و مقام این روش آماری در تحقیقات علمی واضح تر است.

در مطالعات تبیینی تاکید بر تغییرات یک متغیر وابسته توسط اطلاعات حاصل از یک یا چند متغیر مستقل است. متغیرهای مستقل با توجه به جمعبندیها در نظر گرفته می شوند. در واقع تاکید اصلی آن بر تدوین و آزمون در مدلهای تبیینی است (همان:۳۸۴).

دانشمندان علوم رفتاری به دنبال تبیین پدیده ها هستند و برای همین از ملاکها مختلفی بهره گیری می کنند و در تحلیل رگرسیون ۲ ملاک مد نظر است:

۱-   مشارکت نسبی در واریانس به حساب آ,ده متغیر وابسته

۲-   مقدار مجذور نسبی بتا

در واقع تحت این شرایط است که مجموع مجزورات رگرسیون یا نسبت واریانس به حساب آمده، بدون ابهام عملی می شود.

در تحقیقات غیر آزمایشگاهی ( یا بعد از وقوع) متغیر مستقل عموما همبسته اند که گاه همبستگی بین آنها قابل ملاحظه است (همان: ۴۰۵).

پیش بینی: تاکید بر کاربرد علمی است. در این نوع مطالعات محقق می کوشد تا بر اساس اطلاع از یک یا چند متغیر مستقل به یک معادله رگرسیون دست یابد و از آن برای پیش بینی متغیر وابسته استفاده کند. گزینش متغیر مستقل در مطالعه های پیش بینی عمدتا با توجه به اثر بخشی آنها در بالا بردن دقت پیش بینی ملاک به عمل می آیند.

فنون اساسی تحلیل رگرسیون چند متغیری در هر دو مطالعه تبیین و پیش بینی یکی است و با توجه به پیش بینی و تبیین می توان از تفسیر نتایج مطمئن شد. در تحقیق های که به پیش بینی یا تبیین ناظرند، تحلیل رگرسیون می تواند نقش بارزی ایفا کند و هردو منعکس کننده علایق و تاکیدات مختلفی هستند (همان: ۳۸۴).

تحلیل اشتراک: روشی است که با تجزیه واریانس متغیر وابسته به واریانس‌های مشترک و انحصاری به تعیین اهمیت نسبی تاثیرات متغیرهای مستقل کمک می کند.اگر یک متغیر در آخر وارد معادله شود، واریانس منتسب به آن مشارکت انحصاری را نشان می دهد.

باید در نظر داشت که اجزا انحصاری متغیرها تحت تاثیر روابط میان آنها واقع می شوند. افزایش در تعداد متغیرها اجزا انحصاری متغیرها تحت تاثیر روابط میان آنها واقع می شود. در واقع هرچه همبستگی میان متغیرها قوی تر باشد اشتراک ها بزرگتر و اجزا انحصاری کوچک ترمی‌شود(همان:۴۰۷).

هرچند اشتراک های بزرگ باعث همبستگی قوی بین متغیرها می شود. اما این امر موجب نخواهد شد که همبستگی قوی منعکس کننده فقدان خاصیت انحصاری در متغیرها باشد. در نهایت می‌توان گفت استفاده از تحلیل اشتراکی در مورد پیش بینی موثر تر از استفاده از آن در مورد تبیین است(همان:۴۱۶).

تحلیل مسیر: عنوان روشی است برای مطالعه تاثیرات مستقیم و غیر مستقیم متغیرهای که علت گرفته شده اند در متغیرهایی که معلول  فرض شده اند ساخت و پرداخت. این روش برای ترکیب اطلاعات کمی بدست آمده از ضریبهای همبستگی با اطلاعات کیفی موجود درباره روابط علی به صورتی که یک تفسیر کمی حاصل شود کاربرد دارد (کلینجر،۱۳۸۹،۴۱۶).

کاربرد تحلیل مسیر:

۱-   روابط بین متغیرهای موجود در مدل خطی، جمع پذیر و علی هستند. پس روابط انحنای و تعاملی ملحوظ نمی گردد.

۲-    باقی مانده ها باهم و با متغیرهایی که قبل از آنها در مدل آمده است همبسته نیستند.

۳-    جریان علیت یک طرفه است.

۴-    متغیرها در مقیاس فاصله ای اندازه گیری می شود.

برای نشان دادن تحلیل مسیر از علامت P به انضمام دو اندیس استفاده می کنیم.

تحلیل مسیر ابزار تحلیلی مهمی برای آزمودن نظریه هاست که از کاربرد آن محقق می تواند توافق الگویی از همبستگی ها را که از مجموعه ای از مشاهدات حاصل شده است، با یک مدل معین معلوم کند.

پیراستن نظریه: در این شیوه ابتدا ضریبهای مسیر محاسبه شده و سپس با توجه به یک ملاک معین بعضا حذف می شود (همان: ۴۲۱).

نتیجه: تبیین و پیش بینی در مرکز ثقل پژوهشهای علمی قرار دارند. در مواردی که تاکید اصلی بر پیش‌بینی است محقق می تواند راه حل پیشرونده، پسرونده و قدم به قدم یا تحلیل اشتراک را بکار ببرد و روش معین به نیازها و علایق محقق بستگی پیدا می کند (همان :۴۴۷).

متغیرها متغیر طبقه ای:

متغیری است که در آن تفاوت میان آزمودنیها تفاوت در سنخ یا نوع باشد. هر طبقه به مجموعه ای از طبقات و بدون ترتیب نسبت داده می شود. هرچند طبقات به واسطه اعدادی مشخص می شنود اما این اعداد معنی مقداری ندارند.جنس ، وضعیت تاهل، وابستگی حزبی و …. جزء متغیر طبقهای هستند (کلینجر، ۱۳۸۹: ۱۴۸).

متغیر پیوسته:

در مقابل متغیر پیوسته که تفاوت میان آزمودنی‌ها در آن  تفاوت در مقدار یا درجه است.  یک متغیر پیوسته ارزشهای عددی به خود می گیرد و این ارزش ها می توانند یک مقیاس ترتیبی، فاصله ای یا نسبی را تشکیل دهند. خلاصه آنکه متغیر پیوسته مبین تغییرات تدریجی است در حالی که متغیر طبقه ای مبین این معنا نیست.هوش ، پیشرفت تحصیلی و … متغیر پیوسته اند (همان:۱۴۹).

متغیر تصنعی:

عضویت در یک طبقه معین از متغیر را می توان با استفاده از متغیر تصنعی نشان داد. متغیر تصنعی برداری است که در آن اعضا طبقه معین یک عدد دلخواه دیگر نسبت می دهند. مثلا متغیر جنس به مرد ۱ و به زن ۰ را نسبت می دهند.

وقتی سر و کار شخص با یک متغیر مستقل طبقه ای است آن را می توان به صورت مقتضی توسط متغیرهای تصنعی بیان کرد. با متغیر های تصنعی به عنوان متغیرهای مستقل رفتار کند و تحلیل رگرسیون را بکار برد.

مزایای رگرسیون چند متغیری

هرچند از تحلیل واریانس و تحلیل رگرسیون چند متغیرهای مستقل طبقه ای قابل تعویض اند  اما تحلیل در برخی از موارد ارجح است:

۱٫  وقتی متغیر مستقل پیوسته باشد.

۲٫  وقتی متغیر های مستقل هم طبقه ای و هم پیوسته باشند مثلا در تحلیل کوواریانس.

۳٫    وقتی که فراوانی در خانه های طرح فاکتوریال برابر یا نامتناسب باشد.

۴٫     وقتی که به مطالعه روند در داده ها پرداخته شود.

هرچند تحلیل واریانس و رگرسیون را می توان با متغیرهای مستقل طبقه ای بکار گرفت اما تحلیل رگرسیون انعطاف پذیرتر  و قابل استفاده در موقعیت‌های است که از تحلیل واریانس در آن موقعیت ها جایز نیست. در نتیجه رگرسیون چند متغیری کلی تر و سودمندتر است(همان : ۱۵۳).

منابع:

–          ساعی، علی- روش تحقیق در علوم اجتماعی- نشر سمت- تهران ۱۳۸۷

–          سرایی، علی- روش های تحقیق در علوم اجتماعی- انتشارات گاه- تهران ۱۳۸۹

–          سرمدی، زهره و همکاران- روش های تحقیق در علوم رفتاری- نشر آگه – تهران ۱۳۷۶

–          کرلینجر، پدهازر- رگرسیون چند متغیری در پژوهش رفتاری- مترجم دکتر حسن

–     کرلینجر، پدهازر-مبانی پژوهش در علوم رفتاری (جلد دوم)- مترجم دکتر حسن پاشا شریفی و همکارن – انتشارات آوای نور- تهران ۱۳۸۸

–  مولر، چی اچ و همکاران- استدلال آماری در جامعه شناسی- ترجمه هوشنگ نایبی- نشر نی –تهران۱۳۸۹

منابع  اینترنتی

http://www.spss-iran.com/index_files/Corrolations.htm

http://fa.wikipedia.org

انتخاب آزمون معنی داری آماری

آیا قصد دارید تحقیقی را انجام دهید؟ و یا اینکه در حال مطالعه یک تحقیق می باشید؟

چگونه میتوانید از صحت روش تجزیه و تحلیل داده ها اطمینان حاصل فرمائید؟

شاخه های مختلف علوم برای تجزیه و تحلیل داده ها از روش های مختلفی مانند روش های ذیل استفاده می نمایند:

الف) روش تحلیل محتوا

ب) روش تحلیل آماری

ج) روش تحلیل ریاضی

د) روش اقتصاد سنجی

ه) روش ارزشیابی اقتصادی

و) …

یکی از مشکلات عمومی در تحقبقات میدانی انتخاب روش تحلیل آماری مناسب و یا به عبارتی انتخاب آزمون آماری مناسب برای بررسی سوالات یا فرضیات تحقیق می باشد.

در آزمون های آماری هدف تعیین این موضوع است که آیا داده های نمونه شواهد کافی برای رد یک حدس یا فرضیه را دارند یا خیر؟

انتخاب نادرست آزمون آماری موجب خدشه دار شدن نتایج تحقیق می شود.

قبل از انتخاب یک آزمون آماری بایستی به سوالات زیر پاسخ داد:

۱- چه تعداد متغیر مورد بررسی قرار می گیرد؟

۲- چند گروه مفایسه می شوند؟

۳- آیا توزیع ویژگی مورد بررسی در جامعه نرمال است؟

۴- آیا گروه های مورد بررسی مستقل هستند؟

۵- سوال یا فرضیه تحقیق چیست؟

۶- آیا داده ها پیوسته، رتبه ای و یا مقوله ای Categorical هستند؟

قبل از ادامه این مبحث لازم است مفهوم چند واژه آماری را یاد آور شوم که زیاد وقت گیر نیست.

۱- جامعه آماری: به مجموعه کاملی از افراد یا اشیاء یا اجزاء که حداقل در یک صفت مورد علاقه مشترک باشند ،گفته می شود.

۲- نمونه آماری: نمونه بخشی از یک جامعه آماری تحت بررسی است که با روشی که از پیش تعیین شده است انتخاب می‌شود، به قسمی که می‌توان از این بخش، استنباطهایی درباره کل جامعه بدست آورد.

۳- پارامتر و آماره: پارامتر یک ویژگی جامعه است در حالی که آماره یک ویژگی نمونه است. برای مثال میانگین جامعه یک پارامتر است. حال اگر از جامعه نمونه‌گیری کنیم و میانگین نمونه را بدست آوریم، این میانگین یک آماره است.

۴- برآورد و آزمون فرض: برآوردیابی و آزمون فرض دو روشی هستند که برای استنباط درمورد پارامترهای مجهول دو جمعیت به کار می روند.

۵- متغیر: ویژگی یا خاصیت یک فرد، شئ و یا موقعیت است که شامل یک سری از مقادیر با دسته بندیهای متناسب است. قد، وزن، گروه خونی و جنس نمونه هایی از متغیر هستند. انواع متغیر می تواند کمی و کیفی باشد.

۶- داده های کمی مانند قد، وزن یا سن درجه بندی می شوند و به همین دلیل قابل اندازه گیری می باشند. داده های کمی نیز خود به دو دسته دیگر تقسیم می شوند:

الف: داده های فاصله ای (Interval data)

ب: داده های نسبتی (Ratio data)

۷- داده های فاصله ای: به عنوان مثال داده هایی که متغیر IQ (ضریب هوشی) را در پنج نفر توصیف می کنند عبارتند از: ۸۰، ۱۱۰، ۷۵، ۹۷ و ۱۱۷، چون این داده ها عدد هستند پس داده های ما کمی اند اما می دانیم که  IQ نمی تواند صفر باشد و صفر در اینجا فقط مبنایی است تا سایر مقادیر  IQ در فاصله ای منظم از صفر و یکدیگر قرار گیرند پس این داده ها فاصله ای اند.

۸- داده های نسبتی: داده های نسبتی داده هایی هستند که با عدد نوشته می شوند اما صفر آنها واقعی است. اکثریت داده های کمی این گونه اند و حقیقتاً دارای صفر هستند. به عنوان مثال داده هایی که متغیر طول پاره خط بر حسب سانتی متر را توصیف می کنند عبارتند از: ۲۰، ۱۵، ۳۵، ۸ و ۲۳، چون این داده ها عدد هستند پس داده های ما کمی اند و چون صفر در اینجا واقعاً وجود دارد این داده نسبتی تلقی می شوند.

۹- داده های کیفی مانند جنس، گروه خونی یا ملیت فقط دارای نوع هستند و قابل بیان با استفاده از واحد خاصی نیستند. داده های کیفی خود به دو دسته دیگر تقسیم می شوند:

الف: داده های اسمی  (Nominal data)

ب: داده های رتبه ای  (Ordinal data)

۱۰- داده های رتبه ای Ordinal: مانند کیفیت درسی یک دانش آموز (ضعیف، متوسط و قوی) و یا رتبه بندی هتل ها ( یک ستاره، دو ستاره و …)

۱۱- داده های اسمی (nominal ) که مربوط به متغیر یا خواص کیفی مانند جنس یا گروه خونی است و بیانگر عضویت در یک گروها category  خاص می باشد. (داده مقوله ای)

۱۲- متغیر تصادفی گسسته و پیوسته: به عنوان مثال تعداد تصادفات جاده‌ای در روز یک متغیر تصادفی گسسته است ولی انتخاب یک نقطه‌ به تصادف روی دایره‌ای به مرکز مبدأ مختصات و شعاع ۳ یک متغیر تصادفی پیوسته است.

۱۳- گروه: یک متغیر می تواند به لحاظ بررسی یک ویژگی خاص در یک گروه و یا دو و یا بیشتر مورد بررسی قرار گیرد. نکته ۱: دو گروه می تواند وابسته و یا مستقل باشد. دو گروه وابسته است اگر ویژگی یک مجموعه افراد قبل و بعد از وقوع یک عامل سنجیده شود. مثلا میزان رضایت شغلی کارکنان قبل و بعد از پرداخت پاداش و همچنین اگر در مطالعات تجربی افراد از نظر برخی ویژگی ها در یک گروه با گروه دیگر همسان شود.

۱۴- جامعه نرمال: جامعه ای است که از توزیع نرمال تبعیت می کند.

۱۵- توزیع نرمال: یکی از مهمترین توزیع ها در نظریه احتمال است. و کاربردهای بسیاری در علوم دارد.

فرمول این توزیع بر حسب دو پارامتر امید ریاضی و واریانس بیان می شود. منحنی رفتار این تابع تا حد زیادی شبیه به زنگ های کلیسا می باشد. این منحنی دارای خواص بسیار جالبی است برای مثال نسبت به محور عمودی متقارن می باشد، نیمی از مساحت زیر منحنی بالای مقدار متوسط و نیمه دیگر در پایین مقدار متوسط قرار دارد و اینکه هرچه از طرفین به مرکز مختصات نزدیک می شویم احتمال وقوع بیشتر می شود.

سطح زیر منحنی نرمال برای مقادیر متفاوت مقدار میانگین و واریانس فراگیری این رفتار آنقدر زیاد است که دانشمندان اغلب برای مدل کردن متغیرهای تصادفی که با رفتار آنها آشنایی ندارند، از این تابع استفاده می کنند. به عنوان  مثال در یک امتحان درسی نمرات دانش آموزان اغلب اطراف میانگین بیشتر می باشد و هر چه به سمت نمرات بالا یا پایین پیش برویم تعداد افرادی که این نمرات را گرفته اند کمتر می شود. این رفتار را بسهولت می توان با یک توزیع نرمال مدل کرد.

اگر یک توزیع نرمال باشد مطابق قضیه چی بی شف ۲۶٫۶۸ % مشاهدات در فاصله میانگین، مثبت و منفی یک انحراف معیار قرار دارد. و  ۴۴٫۹۵ % مشاهدات در فاصله میانگین، مثبت و منفی دو انحراف معیار قرار دارد. و ۷۳٫۹۹ % مشاهدات در فاصله میانگین، مثبت و منفی سه انحراف معیار قرار دارد.

نکته ۱: واضح است که داده های رتبه ای دارای توزیع نرمال نمی باشند.

نکته ۲: وقتی داده ها کمی هستند و تعداد نمونه نیز کم است تشخیص نرمال بودن داده ها توسط آزمونکولموگروف – اسمیرنف مشکل خواهد شد.

۱۶- آزمون پارامتریک: آزمون های پارامتریک، آزمون های هستند که توان آماری بالا و قدرت پرداختن به داده  های جمع آوری شده در طرح  های پیچیده را دارند. در این آزمون ها داده ها توزیع نرمال دارند. (مانند آزمون تی).

۱۷- آزمون های غیرپارامتری: آزمون هائی می باشند که داده ها توزیع غیر نرمال داشته و در مقایسه با آزمون های پارامتری از توان تشخیصی کمتری برخوردارند.  (مانند آزمون من – ویتنی و آزمون کروسکال و والیس)

نکته۳: اگر جامعه نرمال باشد از آزمون های پارامتریک و چنانچه غیر نرمال باشد از آزمون های غیر پارامتری استفاده می نمائیم.

نکته ۴: اگر نمونه بزرگ باشد، طبق قضیه حد مرکزی جتی اگر جامعه نرمال نباشد می توان از آزمون های پارامتریک استفاده نمود.

حال به کمک جدول زیر براحتی می توانید یکی از ۲۴ آزمون مورد نظر خود را انتخاب کنید:

هدف داده کمی و دارای توزیع نرمال داده رتبه ای و یا دادهکمی غیر نرمال داده های کیفی اسمی Categorical
توصیف یک گروه آزمون میانگین و انحراف معیار آزمون میانه آزمون نسبت
مقایسه یک گروه با یک مقدار فرضی آزمون یک نمونه ای آزمون ویلکاکسون آزمون خی – دو یا آزمون دو جمله ای
مقابسه دو گروه مستقل آزمون برای نمونه های مستقل آزمون من – ویتنی آزمون دقیق فیشر ( آزمون خی دو برای نمونه های بزرگ)
مقایسه دو گروه وابسته آزمون زوجی آزمون کروسکال آزمون مک – نار
مقایسه سه گروه یا بیشتر (مستقل) آزمون آنالیز واریانس یک راهه آزمون والیس آزمون خی – دو
مقایسه سه گروه یا بیشتر (وابسته) آزمون آنالیز واریانس با اندازه های مکرر آزمون فریدمن آزمون کوکران
اندازه همبستگی بین دو متغیر آزمون ضریب همبستگی پیرسون آزمون ضریب همبستگی اسپرمن آزمون ضریب توافق
پیش بینی یک متغیر بر اساس یک یا چند متغیر آزمون رگرسیون ساده یا غیر خطی آزمون رگرسیون نا پارامتریک آزمون رگرسیون لجستیک
در رویکردی دیگر بر مبنای تعداد متغیر، تعداد گروه و نرمال بودن جامعه نیز می توان به الگوریتم آزمون آماری مورد نظر دست یافت:

یک متغیر:

انتخاب آزمون آماری برای یک متغیر یک متغیر در یک گروه یک متغیر در دو گروه یک متغیر در سه گروه یا بیشتر
متغیر نرمال آزمون میانگین و انحراف معیار آزمون تی آزمون آنالیز واریانسANOVA
متغیر غیر نرمال آزمون نسبت (دو جمله ای) آزمون خی -دو آزمون ناپارامتریک

دو متغیر:

انتخاب آزمون آماری برایدو متغیر هر دو متغیر پیوستههستند یک متغیر پیوسته و دیگریگسسته است هر دو متغیر مقوله ایهستند
آزمون همبستگی آزمون آنالیز واریانس ANOVA آزمون خی – دو

سه متغیر و بیشتر:

انتخاب آزمون آماری برای سه متغیر و بیشتر یک گروه دو گروه و بیشتر

آنالیز کواریانس

تحلیل ممیزی

آنالیز واریانس با اندازه های مکرر

آنالیز واریانس چند متغیره

تحلیل عاملی و

رگرسیون چند گانه

قابل ذکر است قبل از ورود به الگوریتم انتخاب آزمون آماری بهتر است به سوالات زیر پاسخ دهیم:

۱- آیا اختلافی بین میانگین (نسبت) یک ویژگی در دو یا چند گروه وجود دارد؟

۲- آیا دو متغیر ارتباط دارند؟

۳- چگونه می توان یک متغیر را با استفاده از متغیر های دیگر پیش بینی کرد؟

۴- چه چیزی می توان با استفاده از نمونه در مورد جامعه گفت؟

تفسیر آزمون های معناداری آماری

۱- رگرسیون چند متغیری

تفسیر آماره های رگرسیون چند متغیری می تواند پیچیده و دشوار باشد. در حقیقت تفسیر آماره های تحلیل چند متغیری بطور کلی بسیار دشوارتر از تفسیر آماری تک متغیری است.( کرلینجر، ۱۳۸۸:۳۵۰)

اگر همبستگی ها در بین متغیرهای مستقل همه صفر باشد یا نزدیک به صفر باشد، تفسیر بسیار ساده می شود. هرچه همبستگی های درونی متغیرهای مستقل بیشتر باشد، تفسیر دشوارتر است(همان: ۳۵۲).

۲.   تحلیل مسیر:

در مرحله تفسیر با مراجعه به نتایج، مقدار واریانس تبیین شده متغیر وابسته (R2)  توسط متغیرهای مستقل مدل چقدر است. هرچه این مقدار بیشتر باشد نشان دهنده قدرت تبیین بالای مدل است و هرچه این مقدار کمتر باشد نشان دهنده ضعف مدل است. اگر مقدار ضریب تعیید چندگانه در حد مطلوب بود، مدل تایید می شود. هنگامی که مدل تایید شد نگاه می کنیم  ببینیم کدام یک از متغیرهای مستقل تاثیر بیشتری بر متغیر وابسته دارد..(گودرزی،۱۳۸۸: ۳۸۷)

۲٫  آزمون آلفای کرومباخ :

دامنه α بین ۰ تا ۱ است هرچه ضریب آلفای کرومباخ بیشتر باشد، پایایی مقیاس  بیشتر است. اندازه آلفا به پایایی تک تک گویه ها بستگی دارد. برای افزایش ضریب آلفا و در نتیجه افزایش پایایی مقیاس باید گویه های نا مناسب را حذف کرد.(ازکیا،۱۳۸۹: ۵۲۴)

۳٫    آزمون کلمو گورف- اسمیرنوف:

برای دریافت تفسیر باید به مقدار Kolmogorov-Smiron Z  نگاه می کینم. اگر مقدار آن کوچکتر از ۹۶/۱+ و بزرگتر از ۹۶/۱- بود، با ۹۵ درصد اطمینان نتیجه می گیریم، بین فراوانی های مشاهده شده و مورد انتظار تفاوتی وجود ندارد. به عبارت دیگر توزیع جامعه نرمال است. ولی اگر مقدار آن کوچکتر از ۹۶/۱- و یا بزرگتر از ۹۶/۱+ بود نتیجه می گیریم با ۹۵ درصد اطمینان بین فراوانی ها مشاهده شده و مورد انتظار تفاوت وجود دارد. به عبارتی توزیع نرمال نیست. (گودرزی، ۱۳۸۸: ۱۱۵)

۴٫  آزمون کی دو :

با توجه به نتیجه بدست آمده از قسمتAsymp.sig .(2-side)  ، اگر مقدار عددی آن از ۰۵/۰ کمتر بود، پی می بریم که دلیلی برای رد فرضیه تحقیق نداریم. سپس فرض صفر را رد می کنیم و نتیجه می گیریم با احتمال ۹۵ درصد، رابطه بین دو متغیر معنا دار است.(همان: ۱۹۵)

۵٫  آزمون فی:

با توجه به نتیجه بدست آمده از قسمت Symmetirc Measures، به بخش approx.Sig نگاه کرده، اگر مقدار آن از ۰۵/۰ کمتر بود، فرض صفر را رد می کنیم و نتیجه می گیریم، با احتمال ۹۵ درصد بین دو متغیر رابطه معنا دا وجود دارد. ولی اگر مقدار آن از ۰۵/۰ بیشتر بود ، دلیل بر درست بودن فرضیه نداریم. بنابراین فرض صفر را نمی توانیم رد کنیم و نتیجه می گیریم که با احتمال ۹۵ درصد رابطه بین دو متغیر معنادار نیست(همان: ۲۰۰).

۶٫  آزمون کرامر :

با توجه به نتیجه بدست آمده از قسمت Symmetirc Measures، به بخش approx.Sig نگاه کرده، اگر مقدار آن از ۰۵/۰ کمتر بود، فرض صفر را رد می کنیم و نتیجه می گیریم، با احتمال ۹۵ درصد بین دو متغیر رابطه معنادار وجود دارد. ولی اگر مقدار آن از ۰۵/۰ بیشتر بود ، دلیل بر درست بودن فرضیه نداریم. بنابراین فرض صفر را نمی توانیم رد کنیم و نتیجه می گیریم که با احتمال ۹۵ درصد رابطه بین دو متغیر معنادار نیست(همان: ۲۰۳).

۷٫  آزمون لامبدا:

در خروجی لامبادا سه گزینه جلوی قسمت لامبادا قرار دارد که عبارت اند از:

الف- گزینه symmetric که مقدار لامبادای میانگین را نشان می دهد

ب- در دو گزینه بعدی ، هر کدام از متغیرها یکبار متغیر وابسته در نظر گرفته شده و مقدار لامبادا و سطح معنا داری آنها آورده شده است. برای تفسیر خروجی به قسمت approx.Sig هر کدام از لامباداها نگاه می کنیم. اگر مقدار آن از ۰۵/۰ کمتر بود، فرض صفر را رد می کنیم و اگر مقدار آن از ۰۵/۰ بیشتر بود ،فرض صفر را  رد نمی کنیم.(همان:۲۱۴)

۸٫   آزمون کروکاس :

برای تفسیر خروجی به قسمت approx.Sig نگاه می کنیم. اگر مقدار آن از ۰۵/۰ کمتر بود، فرض صفر را رد می کنیم و اگر مقدار آن از ۰۵/۰ بیشتر بود ،فرض صفررا  رد نمی کنیم.(همان:۲۱۷)

۹٫     آزمون عدم اطمینان:

برای تفسیر خروجی به قسمت approx. هر کدام از ضرایب محاسبه شده نگاه می کنیم. اگر مقدار آن از ۰۵/۰ کمتر بود، فرض صفر را رد می کنیم و اگر مقدار آن از ۰۵/۰ بیشتر بود ،فرض صفر را رد نمی کنیم.(همان:۲۱۸)

۱۰٫آزمون تی یک نمونه ای:

به قسمت Sig.(2tailed) نگاه می کنیم اگر مقدار آن کمتر از ۰۵/۰ بود ، فرض صفر را رد می کنیم و نتیجه می گیریم تفاوت بین میانگین ها با احتمال بین ۹۵ درصد معنا دار است ولی اگر مقدار آن بیشتر از ۰۵/۰ بود، فرض صفر ار نمی توان رد کرد پس نتیجه می گیریم، با احتمال ۹۵ درصد تفاوت بین میانگین معنا دار نیست(همان ۲۳۲).

۱۱٫آزمون مک نمار:

به قسمت Sig.(2tailed)      Exact.نگاه می کنیم. اگر مقدار آن از ۰۵/۰ کمتر بود دلیلی برای رد فرضیه تحقیق نداریم. بنابر این نتیجه می گیریم با ۹۵ درصد اطمینان بین دو وضعیت تفاوت وجود ندارد ولی اگر مقدار آن از ۰۵/۰ بیشتر بود دلیلی برای درست بودن فرضیه تحقیق نداریم پس نمی توانیم فرض صفر را رد کنیم سپس با ۹۵ درصد اطمینان تساوی بودن دو وضعیت را نتیجه می گیریم(همان : ۲۴۶)

۱۲٫آزمون واریانس یکطرفه:

به قسمت Sig نگاه کرده و اگر مقدار آن از ۰۵/۰ کمتر بود، فرض صفر را رد می کنیم و اگر مقدار آن از ۰۵/۰ بیشتر بود، فرض صفررا  رد نمی کنیم.(همان : ۲۶۱)

۱۳٫آزمون تاو بی کندال:

با توجه به نتیجه بدست آمده از قسمت Symmetirc Measures، به بخش approx.Sig نگاه کرده، اگر مقدار آن از ۰۵/۰ کمتر بود، فرض صفر را رد می کنیم و با ۹۵ درصد اطمینان نتیجه می گیریم بین دو متغیر رابطه همستگی وجود دارد. ولی اگر مقدار آن از ۰۵/۰ بیشتر بود ، فرض صفر را رد نمی کنیم و با ۹۵ درصد اطمینان عدم وجود رابطه بین دو متغیر را نتیجه می گیریم.(همان : ۲۸۲)

۱۴٫آزمون تاو سی کندال :

با توجه به نتیجه بدست آمده از قسمت Symmetirc Measures، به بخش approx.Sig نگاه کرده، اگر مقدار آن از ۰۵/۰ کمتر بود، فرض صفر را رد می کنیم و با ۹۵ درصد اطمینان نتیجه می گیریم بین دو متغیر رابطه همبستگی وجود دارد. ولی اگر مقدار آن از ۰۵/۰ بیشتر بود، فرض صفر را رد نمی کنیم و با ۹۵ درصد اطمینان عدم وجود رابطه بین متغیرهای مورد برسی را نتیجه می گیریم.(همان : ۲۸۴)

۱۵٫آزمون اسپیرمن:

به قسمت approx.Sig نگاه می کنیم. اگر مقدار آن از ۰۵/۰ کمتر بود، فرض صفر را رد می کنیم و نتیجه می گیریم با ۹۵ درصد اطمینان بین دو متغیر رابطه وجود دارد ولی اگر مقدار آن از ۰۵/۰ بیشتر بود ، نمی توانیم فرض صفر را رد کنیم بنابراین با ۹۵ درصد اطمینان عدم وجود رابطه بین دومتغیر را نتیجه می گیریم.(همان:۲۸۸)

۱۶٫آزمون روش همبستگی سامرز

به جدول Directional Measures  نگاه می کینم در این جدول یکبار  یکی از متغیر را به عنوان متغیر وابسته فرض شده و مقدار و سطح معناداری آن آورده شده است و بار دیگر متغیر  بعدی به عنوان متغیر وابسته فرض شده و مقدار و سطح معناداری آن آورده شده است همچنین در قسمت symmetric نیزd  میانگین ارایه شده است برای تفسیر به قسمت approx.Sig نگاه می کنیم. اگر مقدار آن از ۰۵/۰ کمتر بود، فرض صفر را رد می کنیم و نتیجه می گیریم با ۹۵ درصد اطمینان بین دو متغیر رابطه وجود دارد ولی اگر مقدار آن از ۰۵/۰ بیشتر بود ، نمی توانیم فرض صفر را رد کنیم بنابراین با ۹۵ درصد اطمینان عدم وجود رابطه بین دومتغیر را نتیجه می گیریم( همان: ۲۹۵)

۱۷٫آزمون همبستگی پیرسون:

در جدول correlations نگاه کرده اگر مقدار آن از ۰۵/۰ کمتر بود، فرض صفر را رد می کنیم و نتیجه می گیریم با ۹۵ درصد اطمینان بین متغیرها رابطه وجود دارد ولی اگر مقدار آن از ۰۵/۰ بیشتر بود ، نمی توانیم فرض صفر را رد کنیم بنابراین با ۹۵ درصد اطمینان عدم وجود رابطه بین متغیرها را نتیجه می گیریم.

ضریب تعیین: مقدار آن بین صفر تا یک متغیر است. هرچه این مقدار بزرگتر باشد نشانگر این است که رابطه بین دو متغیر بشتر و واریانس بیشتری تبیین می کند و هرچه مقدار آن کوچکتر باشد نشان دهنده این است که رابطه بین متغیرها کمتر است و واریانس کمتری تبیین می شود( همان:۳۱۶).

منابع:

·    ازکیا، مصطفی و همکاران- روش های کاربردی تحقیق – تهران: انتشارات کیهان- چاپ دوم، ۱۳۸۹

·      کرلینجر.فرد. ان – مبانی پژوهش در علوم رفتاری- ترجمه دکتر حسن پاشایی و همکاران- تهران: انتشارات آوای نور: ۱۳۸۸

·      گودرزی، سعید- همراه با دستورات spss و نحوه تفسیر خروجی- تهران: انتشارات جامعه شناسان- چاپ اول، ۱۳۸۸

حداقل حجم نمونه لازم برای تحلیل عاملی و مدل معادلات ساختاری

منبع: آرش حبیبی، آموزش کاربردی لیزرل، ویرایش دوم: پائیز ۱۳۹۱

یک سوال بسیار بااهمیت در تحلیل عاملی تعیین حداقل حجم نمونه است. (کلاین، ۱۹۹۰) تعیین حداقل حجم نمونه لازم برای گردآوری داده‌های مربوط به مدل‌‌یابی معادلات ساختاری بسیار با اهمیت است. (مک‌کیتی، ۲۰۰۴) با وجود آنکه در مورد حجم نمونه لازم برای تحلیل عاملی و مدل‌های ساختاری توافق کلی وجود ندارد (شریبر، ۲۰۰۶)، اما به زعم بسیاری از پژوهشگران حداقل حجم نمونه لازم ۲۰۰ می‌باشد. (هولتر، ۱۹۸۳؛ گارور و منتزر، ۱۹۹۹؛ سیوو و همکاران، ۲۰۰۶؛ هو، ۲۰۰۸) کلاین نیز معتقد در تحلیل عاملی اکتشافی برای هر متغیر ۱۰ یا ۲۰ نمونه لازم است اما حداقل حجم نمونه ۲۰۰ قابل دفاع است. (کلاین، ۲۰۱۰)
اما در تحلیل عاملی تائیدی حداقل حجم نمونه براساس عامل‌ها تعیین می‌شود نه متغیرها. اگر از مدل‌یابی معادلات ساختاری استفاده شود حدود ۲۰ نمونه برای هر عامل (متغیر پنهان) لازم است. (جکسون، ۲۰۰۳) حجم نمونه توصیه شده برای تحلیل عامل تائیدی حدود ۲۰۰ نمونه برای ده عامل توصیه شده است. (شه و گلداشتاین، ۲۰۰۶، کلاین، ۲۰۱۰)

ساختار کلی تحلیل عاملی تائیدی؛ منبع: حبیبی، ۱۳۹۱ ص ۱۳

مثال کاربردی
فرض کنید یک پرسشنامه شامل ۷ گویه برای سنجش سازه A طراحی کرده‌اید. چنانچه هیچ پیش فرضی درباره ابعاد (متغیرهای پنهان) سازه A نداشته باشید با استفاده از تحلیل عاملی اکتشافی می توانید ابعاد سازه A را شناسائی کنید. برای منظور چون ۷ گویه موجود است بنابراین به حداقل ۷۰ و حداکثر ۱۴۰ نمونه نیاز دارید تا ساختار علی متغیرهای مدل شناسائی شود. اما اگر براساس ادبیات پژوهش یا مصاحبه با خبرگان و … ابعاد سازه مورد بررسی تعیین شده باشد و برای مثال مانند شکل بالا دو متغیر پنهان B و C برای این سازه در نظر گرفته شده باشد در این صورت از تحلیل عاملی تائیدی استفاده خواهد شد. در این حالت چون ۲ متغیر پنهان وجود دارد به حداکثر ۴۰ نمونه نیاز دارید تا ساختار علی متغیرهای مدل تائید شود.

 

نحوه محاسبه و تفسیر اندازه اثر:

رایج ترین شاخص های مورد استفاده در اندازه اثر d و r است که غالباً d برای تفاوتهای گروهی و r را برای مطالعات همبستگی به کار می برند . برای مثال در بعضی پژوهش ها از شاخص r استفاده شده و آماره های x2F,T, با استفاده از فرمولهای ولف۱۱(۱۹۸۲) به r تبدیل شده اند .فیلد۱۲،۲۰۰۲). همچنین برای تفسیر اندازه های اثر از جدول کوهن۱۳ (۱۹۷۷) استفاده می شود.

جدول تفسیر اندازه اثر کوهن

اندازه اثر

d

r

اندازه اثر کم

۰٫۲

۰٫۱

اندازه اثر متوسط

۰٫۵

۰٫۳

اندازه اثر زیاد

۰٫۸

۰٫۵

برای مثال فرمول محاسبه d:

Es = ¯XE – ¯XC /Sp

سایت های محاسبه اندازه اثر:

http://www.campbellcollaboration.org/escalc/html/EffectSizeCalculator-SMD30.php

http://www.polyu.edu.hk/mm/effectsizefaqs/calculator/calculator.html

http://ncalculators.com/statistics/effect-of-size-calculator.htm

http://gunston.gmu.edu/cebcp/EffectSizeCalculator/d/d.html

http://www.campbellcollaboration.org/resources/effect_size_input.php

http://www.uccs.edu/~lbecker/

http://www.statisticslectures.com/topics/effectsizeonewayanova/

آموزش محاسبه سطح معنی داری بر حسبR : 

p-Value Calculator for Correlation Coefficients

http://www.danielsoper.com/statcalc3/calc.aspx?id=44

آموزش محاسبه سطح معنی داری بر حسب T :

Probability (P) Value T test Calculator

http://easycalculation.com/statistics/p-value-t-test.php

 

 دانلود نرم افزار اس پی اس اس SPSS نسخه ۱۸ و ۱۹

اس.پی.اس.اس SPSS مخفف Sciences Statistical Package for the Social به معنی بسته امارى براى علوم اجتماعى است. نرم افزار تحلیل آماری SPSS جهت آزمون فرضیه‌های آماری و تحلیل رگرسیون و کوارایانس بسیار توانمند است. نظر به حجم بالای این نرم افزار مجبور شدیم از لینک دانلود سایت vatandownload استفاده کنیم.

پسورد: www.vatandownload.com

دانلود با لینک مستقیم:

IBM SPSS Statistics 19(www.vatandownload.com).part1.rar

IBM SPSS Statistics 19(www.vatandownload.com).part2.rar

آموزش کامل SPSS

دانلود SPSS 18

در صورتیکه لینک دانلود نرم افزار اس.پی.اس.اس SPSS 19 ایراد داشت ورژن SPSS 18 را از لینک‌های زیر دانلود کنید. در مورد جدید بودن نسخه نرم افزارها خیلی حساس نباشید.

پسورد: www.p30day.com

دانلود SPSS 18 – قسمت اول (لینک مستقیم)

دانلود SPSS 18 -قسمت اول (غیر مستقیم)

دانلود SPSS 18 – قسمت دوم (لینک مستقیم)

دانلود SPSS 18 – قسمت دوم (غیر مستقیم)

 

 

آموزش SPSS:

Page with Comments

  1. با سلام
    می خواستم بدانم
    رابطه یک متغیر مستقل یا پیش بین با دو یا چند متغیر وابسته یا ملاک چگونه در spssمحاسبه می شود و آیا در جزوات شما بدان اشاره شده یا خیر
    در هیچ یک از کتاب ها بدان اشاره نشده است .

  2. با سلام. برای مقایسه نسبت ها در بیش از دو نمونه از چه آزمونی می توان استفاده کرد. ایا نرم افزار اس پی اس اس می تواند ان را انجام دهد. سپاس

  3. با سلام ضمن تقدیر و تشکر از مطالب آموزنده بنده برروی مقاله ای کارمیکنم که دوره سه ساله از بورس با ۵۷۳ مشاهده و یک متغیر وابسته و چهار مستقل و هدف تعین روابط هرکدام از چهار متغیر با وابسته است به صورت پنلی وارد ایویوز کردم و سیس آزمون آمار تصیف از متغیر ها و حتی پسماند گرفتم مقدار جاک برا در همه بالا و احتمال صفر بود!و تست نرمالی ته هم احتمال صفر بود داده ها را مجدد بررسی و با داشتن اطلاعات دوره را به چهار سال و به ۶۵۶ مشاهده افزایش دادم ولی هنوز احتمال صفر است و جاک برا بسیار بالاست؟حال به نظر شما علت و بهترین راه حل چیه

    1. سلام. دادها را پس از مرتب سازی کرانه های بالا و پایین آن را که موجب کشیدگی است حذف کنید

  4. با سلام و سپاس .بنده روی پایان نامه ای با عنوان “بررسی نقش میانجی مزیت هزینه پایین و مزیت برند در ارتباط میان قابلیت های بازاریابی و عملکرد صادراتی” کار میکنمدر برآورد آماره معناداری ضرایب مدل ساختاری تحقیق آماره آزمونt را بین متغیرهای مستقل با متغیر های میانجی و نیز بین متغیرهای میانجی با متغیر وابسته توسط نرم افزار محاسبه کرده ایم حال سوال اینجاست برای اثبات فرضیه اثر متغیر مستقل بر متغیر وابسته چگونه باید عمل نمود؟به نظر حضرتعالی راه حل چیست.

    1. سلام.در آلفای ۵ درصد برای معنی داری باید مقدار تی در روابط مثبت بزرگتر از مثبت ۱٫۹۸ و در روابط منفی کوچکتر از منفی ۱٫۹۸ باشد. و در آلفای ۱ درصد برای معنی داری باید مقدار تی در روابط مثبت بزرگتر از مثبت ۱٫۶۴و در روابط منفی کوچکتر از منفی ۱٫۶۴باشد

  5. سلام
    پرسشنامه من بصورتی است که برای هرسوال میتوان چند مورد را انتخاب کرد

    مثلا مواردی که با نظر شما نزدیک تر است را انتخاب کنید

    چطور باید داده ها را کمی و وارد نرم افزار کنم؟

    ممنونم

  6. سلام.
    من برای پایان نامم نیاز به آزمون شکست ساختاری بای پرون دارم. انجام میدم اما خطا میده.لطفا راهنماییم کنید

    1. آزمون بای-پرون(bai-perron)

      آزمون شکست ساختاری داده ها(Bai-perron) توسط ایویوز ۸ به راحتی قابل محاسبه می باشد.

      مراحل انجام به شرح ذیل می باشد:

      Object/New Object…/Equation or Quick/Estimate Equation

      در کادر باز شده معادله را بصورت زیر وارد می کنیم:

      y c

      سپس از قسمت Estimation settings گزینه breeakls را انتخاب کرده و مدل را تخمین میزنیم که نتایج شکست ساختاری را به ما می دهد. در قسمت options می توان متدهای مختلف را انتخاب کرد.
      منبع: مجتبی کریمی – ۱۳٩۳/۴/۴

  7. با سلام، من در پرسشناممم دو گروه سوال دارم، در گروه اول سوالات افراد میتوانند چند گزینه را انتخاب کنن(به عنوان مثال از رسانه های اجتماعی برای ارتباط با چه گروهی استفاده میکنید؟مشتریان، شرکا، تامین کنندگان) که امکان انتخاب هر سه گزینه هم هست.
    گروه دوم سوالات طیف لیکرت هستند… ایا روشی هست که سوالات گروه اول را هم به طیف لیکرت تبدیل کرد؟
    اگر پاسخ منفیست چگونه در تحلیل این سوالات را بررسی کنم؟
    با تشکر از شما

  8. با سلام موضوع من در باره استقبال از بیمه هستش که متغیر مستقل آن استقبال از بیمه می باشد،سوال من این است که چگونه باید برای ستون استقبال مقدار دهی کنم؟ممنون می شم راهنمایی کنید

  9. با سلام و تشکر از مطالب مفید تان
    بنده در دوره ارشد درس تحلیل آماری دارم بصورت مجازی که هیچ آموزشی داده نمیشود و رشته م مرتبط با کارشناسی ام نیست و برای جواب تمرینهای هفتگی مشکل دارم در صورت امکان جهت تمرین این هفته ام کمک می خواست.
    موارد استفاده از آمار توصیفی در کار پژوهشی را ذکر کنید و تحلیل کنید چگونه ازآمار توصیفی برای شناسایی احتما وجود متغیر تعدیل گر استفاده می کنید.

    ممنون میشم به قید فورت جوابم را بدهید. با سپاس فراوان

    1. باسلام.بالا بودن میزان شاخص های پراکندگی دلیل بر وجود تعدیل گر است
      در مواردی که نمونه گیری نکنیم همان آمار توصیفی کفایت می کند
      و نقطه ثقل داده ها در مرکز و میزان پراکندگی آنها را نشان می دهد.
      در مقایسه گروه ها کاربرد دارد

  10. با سلام.من در پایان نامم از دو پرسشنامه مدیریت استعداد و رضایت شغلی استفاده کردهام.حال در امارتوصیفی باید میانگینهای متغیر ها ما بین چه رنجی باشه؟میانگینهای که من حساب کردم ۲۵، ۱۴، ۲۳ هست ایا درستن یا نه؟

    1. سلام. یا باید با نمره وسط پرسشنامه قیاس شود و یا با میانگین جامعه و یا میانگین نمونه آماری ای که شباهت زیادی دارد و یا نظر متخصصان

  11. سلام
    یه سوال دارم، ضریب دشواری یک آزمون ۱۰ سوالی رو چطور اندازه میگیریم؟

    1. توجه: برای آزمون های پیشرفت تحصیلی استفاده می شود و نه پرسشنامه های نگرش سنج.
      برای بــررسی و محــاسبه ضریب دشــواری سؤالات چند گزینه‌ای از فرمول زیر استفاده می‌شود:

      انتخاب‌های درست گروه پایین + ا نتخاب‌های درست گروه بالا

      P = x100

      تعداد افراد گروه بالا + تعداد افراد گروه پایین

  12. سلام وقت بخیر بنده یه پرسشنامه دارم ولی بلد نیستم چطوری نمره گذاری کنم و میانگین بگیرم از طرفی استادمون برای این فرضیه آزمون z هم خواسته خواهش میکنم بنده رو راهنمایی کنید باید کار عملی تحویل بدم ممنون

  13. به منظور تحلیل رگرسیون بر اساس تغییرات F (F CHANGE)و تغییرات R2 چگونه باید عمل کرد؟

  14. با عرض سلام و سپاس از مطالب مفیدی که به اشتراک گذاشته اید.من پرسشنامه ای دو قسمتی تهیه کرده ام.در قسمت اول سوال هایی برای جمع آوری اطلاعات آماری برای رسم نمودار ارایه شده که پاسخ آنها با مقیاس لیکرت جمع آوری میشه،در قسمت دوم پرسشنامه، سوالهای قسمت اول به خاطر استفاده از روش ahp با مقیاس لیکرت مورد اولویت بندی قرار میگیرد.به نظر شما پایایی با روش آلفای کرونباخ بهتره یا چون سوالهای قسمت اول و دوم پرسشنامه یکسان هستند میتونم استناد کنم به روش استفاده از سوالهای کنترل؟
    ممنون میشم اگه حقیر را راهنمایی بفرمایید.

  15. سلام وقتتون بخیر . ببخشید تحقیق من از نوع همبستگی دو متغیره هستش. سه تا پرسشنامه و یک تست عملی (تست رشد حرکتی درشت یا اولریخ TGMD2) و می خواهم همبستگی هریک از متغیرهای پرسشنامه ام را با نتایج تست اولریخ بررسی کنم. الان سوال من این است که
    ۱- برای هر یک از متغیر هایم ابتدا باید ازمون کولموگروف اسمیرنوف انجام دهم و سپس با توجه به نتایج ازمون از تست های بعدی مثل ضریب پیرسون یا اسپیرمن استفاده کنم؟
    ۲-برای تست اولریخ هم ازمون کولموگروف اسمیرنوف انجام دهم؟
    ۳-برخی سوالات پرسشنامه به صورت معکوس نمره دهی شده اند این سوالات را چطور باید وارد کنم؟
    ۴- و اینکه اگر توزیع یکی از متغیرها نرمال بود و توزیع دیگری نرمال نبود انگاه از چه ازمونی برای ادامه ی کاراستفاده کنم؟
    استاد واقعا ممنون میشوم پاسخ دهید واقعا کسی نیست که مرا راهنمایی کند.

    1. سلام.تعداد آزمودنی های شما حداقل باید ۳۰ باشد و اگر نمونه گیری درست انجام شود و قاعده حد مرکزی رعایت شود نیاز به بررسی نرمالیت نیست. سوالات معکوس دقیقا برعکس بقیه نمره گذاری میشود یعنی به جای کاملا موافقم دیگر ۵ نمی گذارید و ۱میگذارید و الی آخر. در صورت نرمال نبودن از آزمون های ناپارامتریک استفاده کنید.

  16. سلام
    طبق قضیه حد مرکزی اگر اندازه نمونه بزرگ باشه بطور پیش فرض نرمال فرض میشه و میتوان از ازمون های پارامتریک استفاده کرد.این اندازه بزرگ چقدره؟ینی بالای چند؟ممنون

  17. من میخام ازمون tزوجی انجام بدم اندازه نمونه هم ۳۸۰تا هس اما توزیع k_sمیگه داده هام نرمال نیستن.باید ازمون ویلکاکسون اجرا کنم یا اینک میش فرض کرد داده ها نرمالن؟پرسشنامه ۲۲ سوال داره ک طیف لیکرت هم هس.

    1. سلام. چنانچه تعداد آزمودنی های هر گروه کمتر از ۳۰ نفر باشد ضروریست تا نرمال بودن چک شود وگرنه نرمال فرض کنید

  18. سلام لطفا روش گرفتن ازمون تی هتلینگ را در نرم افزارspssتوضیح دهید.سپاسگزارم

  19. سلام
    طبق قضیه حد مرکزی اگر اندازه نمونه بزرگ باشه بطور پیش فرض نرمال فرض میشه و میتوان از ازمون های پارامتریک استفاده کرد.این اندازه بزرگ چقدره؟ینی بالای چند؟ممنونمن میخام ازمون tزوجی انجام بدم اندازه نمونه هم ۳۸۰تا هس اما توزیع k_sمیگه داده هام نرمال نیستن.باید ازمون ویلکاکسون اجرا کنم یا اینک میش فرض کرد داده ها نرمالن؟پرسشنامه ۲۲ سوال داره ک طیف لیکرت هم هس.

    1. سلام در مقایسه گروه ها زمانی که تعداد اعضای هر گروه کمتر از ۳۰ نفر باشد باید نرمال بودن بررسی شود و گرنه فرض بر نرمال میگیریم

  20. سلام برای اندازه گیری روایی پرسشنامه که با طیف لیکرت اندازه گیری میشوند همبتگی خرده مقیاس با کل مقیاس رو چطور اندازه میگیرند؟

  21. سلام
    چطوری میتونم بین نتایج دو پرسش نامه ضریب هم بستگی رو پیدا کنم و ببینم بینشون رابطه ی معناداری هست یا ن؟

  22. با سلام لطفا کاربرد آزمون باکس جانگیز را توضیح دهید.

  23. سلام ، تفاوت T-score و Z-score در چیست ؟ و چرا در نتایج آزمونها علی الخصوص کامپیوتری ، هر دو را می آورند.ممنون

  24. سلام خسته نباشید
    من میخوام میزان تاثیر گذاری سوالات پرسشنامه ام رو بسنجم و دو متغیر ترتیبی دارم میخوام ثابت کنم که متغیر مستقلم_مدیریت دانش_ روی متغیر وابسته ام_خلاقیت_تاثیر داره چطور اینکارو توی SPSS انجام بدم اگه میشه راهنماییم کنید خیلی ضروری نیاز دارم.

  25. سلام و خسته نباشید
    معادل ناپارامتریک ازمونMANOVA چه ازمونی است؟
    باتشکر

  26. اگردر یک سوالی میانگین را نداشتهباشیم باید در نرم افزار spssچه کار کنیم؟

  27. سلام ، من عنوان یک شخصی که کتاب اثر مرکب رو خونده پیشنهاد میکنم حتما به سایت کتاب ها مراجعه کنید و
    به رایگان کتاب اثر مرکب دارن هاردی را دانلود کنید

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد.