Grunntækniaðferð við greiningu á magngögnum
Línuleg endurtekningarmyndir eru notuð til að sýna eða spá fyrir um sambandið milli tveggja breytu eða þátta . Þátturinn sem spáð er (þátturinn sem jöfnin leysir fyrir ) kallast háð breytu. Þættirnir sem notaðar eru til að spá fyrir um gildi háð breytu eru kallaðir sjálfstæðar breytur.
Góð gögn segja ekki alltaf alla söguna. Endurgreiningargreining er almennt notuð í rannsóknum þar sem það kemur í ljós að fylgni er á milli breytinga.
En fylgni er ekki það sama og orsök . Jafnvel lína í einföldum línulegri endurhvarf sem passar gagnapunkta vel má ekki segja neitt endanlegt um orsakatengsl samband.
Í einföldum línulegri endurhvarf samanstendur hver athugun af tveimur gildum. Eitt gildi er fyrir háð breytu og eitt gildi er fyrir sjálfstæða breytu.
- Einföld línaaðstoðargreining Einfaldasta myndin um endurtekningargreiningu notar á háð breytu og einum sjálfstæðum breytu. Í þessari einföldu fyrirmynd er bein lína nálgun tengsl milli háðs breytu og óháðu breytu.
- Margfeldi truflunargreining Þegar tveir eða fleiri óháðir breytur eru notaðir við endurþrýstingsgreiningu er líkanið ekki lengur einfalt línulegt.
Einföld línuleg eftirlitsmynd
Einföld línuleg endurtekið líkan er táknað með þessu: y = ( β 0 + β 1 + Ε
Með stærðfræðilegum samningi eru tveir þættir sem taka þátt í einföldum línulegri endurskoðunargreiningu tilnefndar x og y .
Jöfnin sem lýsir því hvernig y er tengd við x er þekkt sem regression líkanið . Línuleg endurtekið líkan inniheldur einnig villuskilmála sem táknar Ε eða gríska stafrófið epsilon. Villutíminn er notaður til að taka mið af breytileika í y sem ekki er hægt að útskýra af línulegu sambandinu milli x og y .
Þar eru einnig breytur sem tákna íbúa sem eru að læra. Þessar færibreytur fyrirmyndarinnar sem eru táknuð með ( β 0 + β 1 x ).
Einföld línuleg eftirlitsmynd
Einföld, línuleg afturábak jöfnu er táknuð með þessu: Ε ( y ) = ( β 0 + β 1 x ).
Einföld línuleg endurteknar jöfnu er grafuð sem bein lína.
( β 0 er y stöðvun afturköllunar línu.
β 1 er brekkan.
Ε ( y ) er meðalgildi eða áætlað gildi y fyrir tiltekið gildi x .
A afturköllunarlína getur sýnt jákvætt línulegt samband, neikvætt línulegt samband eða ekkert samband. Ef grafið lína í einföldum línulegri endurhvarf er flatt (ekki sloped), er engin tengsl milli tveggja breytanna. Ef afturlagningarlínan hallar upp með neðri enda línunnar við y- bilið (ás) grafans og efri enda línunnar sem nær upp í línuritið, í burtu frá x- bilinu (ás) er jákvætt línulegt samband . Ef truflunarlínan hallar niður með efri enda línunnar við y- bilið (ás) grafsins og neðri endalínan sem nær niður í línuritið, í átt að x- bilinu (ás) er neikvætt línulegt samband.
Áætluð línuleg jöfnun jöfnu
Ef þættir þjóðarinnar voru þekktar, þá var hægt að nota einfalda línulega endurtekna jöfnuna (sýnd hér að neðan) til að reikna meðalgildi y fyrir þekkt gildi x .
Ε ( y ) = ( β 0 + β 1 x ).
Hins vegar eru reyndar gildi breytu ekki þekkt þannig að þeir verða að meta með því að nota gögn úr sýni íbúanna. Breytingar á íbúafjölda eru metnar með því að nota sýnishornastaðla Sýnishornastigið er táknað með b 0 + b 1. Þegar sýnishornsstaðlinum er skipt út fyrir íbúafjöldann er áætlað afturábak jöfnun myndast.
Áætlað afturábak jöfnu er sýnd hér að neðan.
( ŷ ) = ( β 0 + β 1 x
( ŷ ) er áberandi og húfur .
Myndin af áætluðu einföldu endurteknu jöfnu er kallað áætlað afturlínuröð.
B 0 er y bilið.
B 1 er halla.
The ŷ ) er áætlað gildi y fyrir tiltekið gildi x .
Mikilvæg athugasemd: Endurbættargreining er ekki notuð til að túlka orsakatengsl og tengsl milli breytinga. Endurgreiningargreining getur hins vegar gefið til kynna hvernig breytur tengjast eða að hve miklu leyti breytur tengjast hvert öðru.
Í því sambandi hefur tilhneigingu til að endurheimta tilhneigingu til að búa til mikilvægar sambönd sem vekja athygli á fræðilegum rannsóknum að skoða .
Einnig þekktur sem: bivariate regression, regression analysis
Dæmi: Aðferðin með minnstu ferninga er tölfræðileg aðferð til að nota sýnishornsgögn til að finna gildi áætlaðrar endurteknar jöfnu. Aðalsteinaraðferðin var fyrirhuguð af Carl Friedrich Gauss, sem fæddist árið 1777 og lést árið 1855. Aðferðin að minnsta kosti er enn mikið notaður.
Heimildir:
Anderson, DR, Sweeney, DJ og Williams, TA (2003). Nauðsynleg tölfræði fyrir viðskipta og hagfræði (3. útgáfa.) Mason, Ohio: Southwestern, Thompson Learning.
______. (2010). Útskýrðir: Regression Greining. MIT News.
McIntyre, L. (1994). Notkun Sígaretta Gögn fyrir Inngangur að mörgum truflun. Journal of Statistics Education, 2 (1).
Mendenhall, W. og Sincich, T. (1992). Tölfræði fyrir verkfræði og vísindi (3. útgáfa), New York, NY: Dellen Publishing Co.
Panchenko, D. 18.443 Tölfræði fyrir umsóknir, haustið 2006, 14. þáttur, einfalt línandi endurtekningur. (Massachusetts Institute of Technology: MIT OpenCourseWare)