Regresyon Analizi

Regresyon Analizi

Regresyon analizi, iki ya da daha çok değişken arasındaki ilişkiyi ölçmek için kullanılan analiz metodudur. Eğer tek bir değişken kullanılarak analiz yapılıyorsa buna tek değişkenli regresyon, birden çok değişken kullanılıyorsa çok değişkenli regresyon analizi olarak isimlendirilir.

Regresyon analizi; bağımsız değişkenler (X1,X2…..Xn ) ile bağımlı değişken (Y)’deki değişimi açıklamayı hedefler. Örneğin; bir öğrencinin başarısı ve çalışma saati arasındaki ilişki araştırıldığında; bağımlı değişken Y olarak tanımlanır ve çalışma saati bağımsız değişkeni X olarak tanımlanır.

Regresyon modeli iki ya da daha fazla değişken arasındaki ilişkinin fonksiyonel şeklini göstermekle kalmaz, değişkenlerden birinin değeri bilindiğinde diğeri hakkında tahmin yapılmasını da sağlar.

İki ya da daha çok değişken arasındaki ilişkinin matematiksel bağıntısı “Regresyon Analizi” ile ilişkinin yönü ve derecesi ise “Korelasyon Analizi” ile incelenir.

Regresyon analizi bir tahmin (öngörüsel) analizi olup, bağımlı değişkenin bağımsız değişkenler yardımıyla tahmin edilmesini sağlar. Ayrıca bağımlı değişkeni etkileyen en önemli bağımsız değişken/değişkenlerin hangisini olduğunu ortaya çıkarır.

Regresyon analizi;

  • Basit doğrusal regresyon,
  • Çoklu değişkenli regresyon analizi,
  • Doğrusal olmayan regresyon analizi olarak sınıflandırılabilir.

Regresyon analizinin varsayımları şunlardır:

  • Bağımlı ve bağımsız değişkenler arasındaki ilişkinin doğrusal olması (DoğrusallıkLinearity)
  • Bağımsız değişkenlerin birbirleriyle ilişkili olmaması (Çoklu bağıntıMulticollinearity)
  • Hata terimlerinin normal dağılması (Normallik-normality)
  • Hata terimlerinin varyansının sabit olması (Eşvaryanslılık-Homoscedascity)

Hata terimleri arasında ilişki olmaması (Otokorelasyon-Autocorrelation)
Basit regresyon modeli Y=a+bX+e şeklinde bir bağımlı ve bir de bağımsız değişken içeren bir modeldir. Burada Y; bağımlı (sonuç) değişken olup belli bir hataya sahip olduğu varsayılır. X; bağımsız (sebep) değişkeni olup hatasız ölçüldüğü varsayılır. a sabit olup X=0 olduğunda Y’nin aldığı değerdir. b ise regresyon katsayısı olup, X’in kendi birimi cinsinden 1 birim değişmesine karşılık Y’de kendi birimi cinsinden meydana gelecek değişme miktarını ifade eder. e tesadüfi hata terimi olup ortalaması sıfır varyansı
olan normal dağılış gösterdiği varsayılır. Bu varsayım parametre tahminleri için değil katsayıların önem kontrolleri için gereklidir.