Hypothesetesten – Schrijven, voorbeelden en stappen
3 april 2025
Hypothesetesten – Schrijven, voorbeelden en stappen
Een empirisch onderzoek begint met het opstellen van een hypothese. Zonder hypothese kunnen we geen causaal verband testen. Daarom is het belangrijk om een hypothese te schrijven die toetsbaar is en waardevolle inzichten in een situatie kan bieden. We hebben het woord 'hypothese' in eerdere...
Toegepaste econometrie – Stappen voor het uitvoeren van een empirisch onderzoek
Het runnen van een bedrijf is veel uitdagender geworden dan ooit. Toenemende concurrentie, een dreigende economische crisis, stijgende bedrijfskosten en dalende winstmarges hebben de problemen van ondernemers en managers nog verder vergroot. Ze moeten vaak voorspellingen doen op basis van verschillende soorten data om bedrijfsstrategieën te ondersteunen en de concurrentie te bestrijden. In dergelijke...
Econometrie – Betekenis, elementen, technieken en toepassing
Cijfers vertellen verhalen, onthullen feiten en onderliggende patronen. Als ze correct worden samengevoegd en geanalyseerd, bieden ze inzichten en een sterke basis voor het nemen van belangrijke beslissingen. Data (cijfers) vertellen je wat het effect van iets is en dienen dus slechts als indicator, hoewel cruciaal. Vanuit een analytisch perspectief is het echter mogelijk niet voldoende. Ze vertegenwoordigen de...
Stel dat u een HR-professional bent en wilt bepalen:
Dit zijn allemaal routinematige scenario's binnen een organisatie. Maar de impact ervan is enorm. Hoe bepaal je als HR-professional welke variabelen welke impact hebben op de productiviteit van medewerkers?
Regressieanalyse biedt je het antwoord. Het helpt je de relatie tussen twee of meer variabelen te verklaren.
Met uitleg komt overweging!
Voordat we echter in detail treden en begrijpen hoe regressiemodellen kunnen worden gebruikt om een oorzaak-gevolgrelatie af te leiden, zijn er een aantal belangrijke overwegingen waarmee rekening moet worden gehouden:
Regressieanalyse vereenvoudigt sommige zeer complexe situaties, bijna op magische wijze. Het helpt onderzoekers en professionals om verweven variabelen met elkaar te correleren. Lineaire regressie is een van de eenvoudigste en meest gebruikte regressiemodellen. Het voorspelt de oorzaak-gevolgrelatie tussen twee variabelen.
Het model gebruikt Gewone kleinste vierkanten (OLS) Methode die de waarde van onbekende parameters in een lineaire regressievergelijking bepaalt. Het doel is om het verschil tussen de waargenomen responsen en de voorspelde responsen met een lineair regressiemodel te minimaliseren. Er zijn bepaalde vereisten waaraan u moet voldoen om dit model te kunnen gebruiken. Anders kunnen de resultaten verwarrend en dubbelzinnig zijn.
Laten we het aan de hand van een voorbeeld verduidelijken:
Het fenomeen is: Werkervaring en beloning zijn gerelateerde variabelen. Het lineaire regressiemodel kan helpen bij het voorspellen van de beloningsschaal van een werknemer, gegeven zijn/haar werkervaring.
Nu rijst de vraag hoe we dit statistisch kunnen weergeven.
Er zijn twee regressielijnen: Y op X en X op Y.
Y op X is wanneer de waarde van Y onbekend is. X op Y is wanneer de waarde van X onbekend is.
Hier zijn hun statistische weergaven:
Stel dat de waarde van de beloning = Y is en de waarde van de ervaring = X.
|
Selectie van regressielijn
De bovenstaande statistische weergave is een voorbeeld van hoe econometrische modellen kunnen worden ontwikkeld wanneer de waarde van een van de variabelen bekend is en de waarde van een andere onbekend. dit betekent niet dat beide voorstellingen correct zijn.
Dit komt doordat beloning afhankelijk kan zijn van de werkervaring van een individu, maar andersom niet. Ervaring is niet afhankelijk van beloning. Daarom moet je de afhankelijke variabele en vervolgens de regressielijn zorgvuldig kiezen.
Een lineaire regressievergelijking toont de procentuele toename of afname van de waarde van de afhankelijke variabele (Y) met de procentuele toename of afname van de waarde van de onafhankelijke variabele (X).
Laten we aannemen dat de waarden van X en Y bekend zijn.
Tabel 1
| X | Y |
| 1 | 1 |
| 2 | 1.5 |
| 3 | 2.5 |
| 4 | 2.8 |
| 5 | 4 |
Grafisch wordt dit als volgt weergegeven:

De witte lijn die alle punten in de bovenstaande grafiek verbindt, geeft de fout of voorspelling weer. Maar nu wilt u de best passende regressielijn vinden om de voorspellingsfout te minimaliseren. Het doel is om de best passende regressielijn te vinden.
Hoe vind je de best passende regressielijn?
Door gebruik te maken van de gewone kleinste kwadraten methode!
Laten we verdergaan met het bovenstaande voorbeeld:
Tabel 2
| X | Y | XY | X-X' | J-J' | (X-X')(Y-Y') | (X-X')2 | (J-J')2 | |
| 1 | 1 | 1 | -2 | -1.16 | 2.32 | 4 | 1.346 | |
| 2 | 1.5 | 3 | -1 | -0.66 | 0.66 | 1 | 0.436 | |
| 3 | 2.5 | 7.5 | 0 | 0.34 | 0.34 | 0 | 0.116 | |
| 4 | 2.8 | 11.2 | 1 | 0.64 | 0.64 | 1 | 0.410 | |
| 5 | 4 | 20 | 2 | 1.84 | 3.68 | 4 | 3.386 | |
| Som | 15 | 10.8 | 42.7 | 7.64 | 10 | 5.69 | ||
| Gemiddelde | X' = 3 (15/5) | Y' = 2.16 (10.8/5) |

De primaire vergelijking is:
Y = a + b(X) +e (foutterm)
In dit geval is e gelijk aan nul, omdat wordt aangenomen dat de onafhankelijke variabele (X) verwaarloosbare fouten heeft.
Het blijft dus Y = a + b(X).
Laten we nu de waarde van b bepalen.
b = [ ∑ XY – (∑Y)(∑X)/n ] / ∑(X-X')2
Vervang de waarden in de bovenstaande formule:
b = [ 42.7 – (15*10.8)/5 ]/10 = [ 42.7 – 162/5 ]/10 = [ 42.7 – 32.5 ]/10 = 10.2/10 = 1.02
b = 1.02
Daarom,
a = Y – b(X)
a = Y – 1.02(X) of a = ∑Y/n – 1.02 (∑X/n)
a = 2.16 – 1.02*3 = 2.16 – 3.06
een = -1.06
Door de waarden van a, b en X te vervangen, kunnen we de overeenkomstige waarde van Y vinden.
Y = a + b(X) = -1.06 + 1.02X
Wanneer X = 1
Y = -1.06 + 1.02*1 = -0.04
Wanneer X = 2
Y = - 1.06 + 1.02*2 = 0.98
Als X = 3, zal Y 2 zijn
Als X = 4, zal Y 3.02 zijn
Als X = 5, zal Y 4.04 zijn
Tabel 3
| X | Y |
| 1 | -0.04 |
| 2 | 0.98 |
| 3 | 2 |
| 4 | 3.02 |
| 5 | 4.04 |
De best passende regressielijn is:

Eigenschappen van de best passende regressielijn/schatters
Wanneer u een regressiemodel gebruikt, moet u als eerste nagaan hoe goed een econometrisch model bij de gegevens past of hoe goed een regressievergelijking bij de gegevens past.
Dit is waar het concept van determinatiecoëfficiënt komt binnen. De regressiemodellen worden over het algemeen met behulp van deze benadering aangepast.
Het bepaalt in hoeverre de afhankelijke variabele kan worden voorspeld op basis van de onafhankelijke variabele. Het beoordeelt de goodness-of-fit van het gewone kleinste-kwadraten regressiemodel.
Aangeduid met R2, de waarde ligt tussen 0 en 1. Wanneer:
Hoe hoger de waarde van R2hoe beter het model bij de data past.
Laten we nu begrijpen hoe we R berekenen2De formule om R te vinden2 is:
R2 = { (1 / n) * ∑ (X-X') * (Y-Y') } / (σx * σy)2
Waarbij n = aantal observaties = 5
∑ (X-X') * (Y-Y') = 7.64 (zie tabel 2)
σx is de standaarddeviatie van X en σy is de standaarddeviatie van Y
σx = vierkantswortel van ∑ (X-X')2/n = √10/5 = √2 = 1.414
σy = vierkantswortel van ∑ (Y-Y')2/n = √5.69/5 = √1.138 = 1.067
Laten we nu de waarde van R bepalen2
R2 = { 1/5 (7.64) } / (1.414 * 1.067)2 = 1.528 / (1.509)2 = 1.528/2.277 = 0.67
Vandaar R2 = 0.67
Hoe hoger de waarde van de determinatiecoëfficiënt, hoe lager de standaardfout. Het resultaat geeft aan dat ongeveer 67% van de variatie in beloning verklaard kan worden door werkervaring. Dit toont aan dat werkervaring een belangrijke rol speelt bij het bepalen van de beloning.
Eigenschappen van schatters
Het lineaire regressiemodel wordt gebruikt wanneer er een lineair verband bestaat tussen afhankelijke en onafhankelijke variabelen. Wanneer de waarde van een afhankelijke variabele gebaseerd is op meerdere variabelen (meer dan één), gebruiken we meervoudige regressieanalyse. We zullen dit in de volgende paragraaf bestuderen. volgend artikel. Blijf op de hoogte!
Uw e-mailadres wordt niet gepubliceerd. Verplichte velden zijn gemarkeerd *