Hoe kan ik deze statistieken berekenen?

stemmen
12

Ik ben het schrijven van een app om te helpen wat onderzoek te vergemakkelijken, en een deel van dit gaat doen van een aantal statistische berekeningen. Op dit moment zijn de onderzoekers met behulp van een programma genaamd SPSS . Een deel van de output die ze zorg over ziet er als volgt:

[Een

Ze zijn eigenlijk alleen bezorgd over de Fen Sig.waarden. Mijn probleem is dat ik geen achtergrond in de statistiek, en ik kan niet achterhalen wat de tests worden genoemd, of hoe ze te berekenen.

Ik dacht dat de Fwaarde kan het gevolg zijn van de te F-toets , maar na het volgen van de stappen gegeven op Wikipedia, kreeg ik een resultaat dat afwijkt van wat was SPSSgeeft.

De vraag is gesteld op 04/08/2008 om 23:56
bron van user
In andere talen...                            


6 antwoorden

stemmen
4

Op deze website kan u helpen een beetje meer. Ook deze ene .

Ik ben bezig aan een vrij roestige herinnering aan een cursus statistiek, maar hier gaat niets:

Bij analyse van de variantie (ANOVA) aan het doen bent, je eigenlijk het berekenen van de F-statistiek als de verhouding van de gemiddelde vierkante verschillen "tussen de groepen" en de gemiddelde vierkante afwijkingen "in de groep". De tweede link hierboven lijkt vrij goed voor deze berekening.

Dit maakt de F-statistiek maatregel precies hoe krachtig je model is, omdat de "tussen de groepen" variantie verklarende kracht, en "binnen de groepen" variantie toevallige fout. Hoge F impliceert een zeer belangrijk model.

Zoals in veel statistische bewerkingen, je back-bepalen Sig. met de grootheid F. Hier is waar je Wikipedia informatie komt in een iets handig. Wat u wilt doen, is - met behulp van de vrijheidsgraden gegeven aan u door SPSS - vindt de juiste P waarde waarvoor een F tabel u de F-statistiek hebt berekend zal geven. De P-waarde wanneer dat gebeurt [F (tabel) = F (berekend)] de betekenis.

Conceptueel, een minder belangrijke rol spelen waarde toont een zeer sterk vermogen om de nulhypothese (die voor deze doeleinden betekent om te bepalen uw model verklarende kracht) af te wijzen.

Sorry dat ik het even welke math mensen als een van dit verkeerd is. Ik kom regelmatig terug om wijzigingen aan te brengen !!!

Veel succes. Stats is leuk, maar misschien niet dit deel. =)

antwoordde op 05/08/2008 om 00:32
bron van user

stemmen
3

Ik neem aan dat van uw vraag die je onderzoek collega's willen het proces waarbij bepaalde statistische analyses worden uitgevoerd (dat wil zeggen, ze willen batch proces data sets) te automatiseren. Je hebt twee opties:

1) SPSS is nu scriptable door middel van python (vanaf versie 15) - ga naar spss.com en zoek naar python. U kunt python scripts schrijven naar data-analyses te automatiseren en hoofdpunten waarden uit draaitabellen, en dan verwerken de antwoorden zoals u dat wilt. Dit heeft de deugd van het toestaan ​​van een exacte vergelijking tussen de resultaten van uw python script en de met de hand berekende inspanningen in SPSS van uw medewerkers. Dus je hoeft niet om echt te weten geen statistieken om dit werk te doen (dat is een belangrijk voordeel)

2) U kan dit doen in R, een gratis statistieken omgeving, die waarschijnlijk zou kunnen worden gescript. Dit heeft als nadeel dat je zal moeten statistieken leren om ervoor te zorgen dat je het goed doet.

antwoordde op 22/09/2008 om 04:29
bron van user

stemmen
2

Kortom: doe dit niet met de hand, link / gebruik van bestaande software. En antwoord sain_grocen is onjuist. :(

Dit zijn alle tests voor het belang van parameter schattingen die doorgaans worden gebruikt in Multivariate respons Multiple Regressies. Deze zouden niet eenvoudige dingen te doen buiten een statistische programmeeromgeving. Ik stel voor ofwel het verkrijgen van de uitgang van een reeds bestaande statistisch programma, of met behulp van een die u kunt koppelen aan en het gebruik van die code.

Ik ben bang dat het eerste antwoord (sain_grocen's) zal leiden u op het verkeerde pad. Zijn verklaring is waarschijnlijk van een speciaal geval van wat je eigenlijk mee bezig zijn. De anova uitgelegd in zijn banden is voor een enkele variate respons, in een uitgebalanceerd ontwerp. Dit zijn niet de F statistieken die u ziet. De namen in uw output (Pillai Trace, Hotellings Trace, ...) zijn enkele van de beschikbare multivariate versies. Ze hebben F distributies onder bepaalde aannames. Ik kan hier niet uitleggen een tekst boeken ter waarde van materiaal, zou ik u adviseren om te beginnen door te kijken naar "Applied Multivariate Statistical Analysis" door Johnson en Wichern

antwoordde op 17/09/2008 om 00:17
bron van user

stemmen
2

Statistiek is moeilijk :-). Na een jaar van het lezen en opnieuw lezen van boeken en papieren en kan alleen met vertrouwen zeggen dat ik begrijp de basis ervan.

Je zou willen kant en klare bibliotheken voor welke programmeertaal die u gebruikt te onderzoeken, omdat er vele zijn gotcha in wiskunde in het algemeen en de statistieken in het bijzonder (afrondingsfouten zijn een duidelijk voorbeeld).

Als voorbeeld kun je een kijkje nemen op de R-project , dat zowel een interactieve omgeving en een bibliotheek die u kunt gebruiken bij uw C ++ code, gedistribueerd onder de GPL (dat wil zeggen als je het gebruikt alleen intern en publiceren alleen de resultaten, je hoeft niet om de code te openen).

antwoordde op 18/08/2008 om 07:01
bron van user

stemmen
0

Hier volgt een uitleg van MANOVA ouptput, van een zeer goede site over statistieken en SPSS:

Output met uitleg: http://faculty.chass.ncsu.edu/garson/PA765/manospss.htm

Hoe en waarom te doen MANOVA of multivariate GLM: (dezelfde weg als hierboven, maar eindigt in '/manova.htm')

Schrijven van software volledig opnieuw moeten berekenen van deze uitgangen zouden zowel tijdrovend en moeilijk zijn; er is veel numerieke problemen en matrix inversies te doen.

Zoals Henry zei, gebruiken Python-scripts, of R. zou ik voorstellen dat het werken met iemand die SPSS weet of scripting. Bovendien, SPSS zelf in staat is om de uitvoer van het outputtabellen naar bestanden met behulp van een zogenaamde OMS. Een script binnen SPSS kan dit doen.

Zoek uit wie in uw onderzoeksgroep kent SPSS en met hen samenwerken.

antwoordde op 22/12/2009 om 02:56
bron van user

stemmen
0

Kunt u meer uitleggen waarom SPSS zelf is niet een prima oplossing voor het probleem? Is het zo dat het genereert draaitabellen als uitvoer die moeilijk te manipuleren zijn? Is het de kosten van het programma?

F-statistieken kunnen het gevolg zijn van een aantal specifieke testen. De F is slechts een verdeling (losjes: een beschrijving van de "frequenties" van groepen van waarden), als een normale (Gauss) of Uniform. In het algemeen ontstaan ze uit verhoudingen van afwijkingen. Advies: veel statistici (waaronder ikzelf), vind F-gebaseerde tests instabiel (jargon: niet- zijn robuust ).

De bijzondere outputstatistieken (Pillai's trace, etc.) suggereren dat de oorspronkelijke analyse is een MANOVA voorbeeld, dat als andere posters te beschrijven is een ingewikkeld en moeilijk om juiste procedure te krijgen.

Ik denk ook dat, op basis van de MANOVA, en het gebruik van SPSS, is dit een of sociologie project ... zo niet dan verlichten. Het kan zijn dat andere, eenvoudigere modellen eigenlijk gemakkelijker te begrijpen en meer herhaalbaar zou kunnen zijn. Raadpleeg uw plaatselijke universiteit statistische consulting groep, als je die hebt.

Succes!

antwoordde op 17/09/2008 om 14:48
bron van user

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more