Hur beräknar jag summan av kvadrater för fel (SSE)?

För att beräkna summan av kvadrater för fel, börja med att hitta medelvärdet för datamängden genom att lägga till alla värdena och dela med det totala antalet värden. Dra sedan medelvärdet från varje värde för att hitta avvikelsen för varje värde. Därefter kvadrerar du avvikelsen för varje värde. Slutligen lägg till alla kvadratavvikelserna för att få summan av kvadraterna för fel. Bläddra ner för att lära dig hur man beräknar summan av fel för fel med Microsoft Excel!

Innan du kan beräkna felet för varje mätning måste du beräkna medelvärdet för hela datamängden
Innan du kan beräkna felet för varje mätning måste du beräkna medelvärdet för hela datamängden.

Summan av kvadratfel, eller SSE, är en preliminär statistisk beräkning som leder till andra datavärden. När du har en uppsättning datavärden är det användbart att kunna hitta hur nära relaterade dessa värden är. Du måste ordna dina data i en tabell och sedan göra några ganska enkla beräkningar. När du väl har hittat SSE för en datamängd kan du sedan fortsätta för att hitta varians och standardavvikelse.

Metod 1 av 3: Beräkning av SSE för hand

  1. 1
    Skapa en tre kolumntabell. Det tydligaste sättet att beräkna summan av kvadratfel är att börja med en tabell med tre kolumner. Märk de tre kolumnerna som värde {\ displaystyle {\ text {värde}}} , avvikelse {\ displaystyle {\ text {avvikelse}}} och avvikelse2 {\ displaystyle {\ text {avvikelse}} ^ {2}} .
  2. 2
    Fyll i uppgifterna. Den första kolumnen innehåller värdena för dina mätningar. Fyll i kolumnen Värde {\ displaystyle {\ text {Värde}}} med värdena för dina mätningar. Dessa kan vara resultatet av ett visst experiment, en statistisk studie eller bara data som lämnats för ett matematikproblem.
    • Antag i det här fallet att du arbetar med vissa medicinska data och att du har en lista över kroppstemperaturer hos tio patienter. Den förväntade kroppstemperaturen är 98,6 grader. Temperaturerna hos tio patienter mäts och ger värdena 99,0, 98,6, 98,5, 101,1, 98,3, 98,6, 97,9, 98,4, 99,2 och 99, 1. Skriv dessa värden i den första kolumnen.
  3. 3
    Beräkna medelvärdet. Innan du kan beräkna felet för varje mätning måste du beräkna medelvärdet för hela datamängden.
    • Kom ihåg att medelvärdet för alla datamängder är summan av värdena dividerat med antalet värden i uppsättningen. Detta kan representeras symboliskt, med variabeln μ {\ displaystyle \ mu} som representerar medelvärdet, som:
      • μ = Σxn {\ displaystyle \ mu = {\ frac {\ Sigma x} {n}}}
    • För dessa data beräknas medelvärdet som:
      • μ = 99,0 + 98,6 + 98,5 + 101,1 + 98,3 + 98,6 + 97,9 + 98,4 + 99,2 + 99,110 {\ displaystyle \ mu = {\ frac {99, 0 + 98,6 + 98,5 + 101,1 + 98,3 + 98,6 + 97,9 + 98,4 + 99,2 + 99,1} {10}}}
      • μ = 988,710 {\ displaystyle \ mu = {\ frac {988,7} {10}}}
      • μ = 98,87 {\ displaystyle \ mu = 98,87}
    Bläddra ner för att lära dig hur man beräknar summan av fel för fel med Microsoft Excel
    Bläddra ner för att lära dig hur man beräknar summan av fel för fel med Microsoft Excel!
  4. 4
    Beräkna de enskilda felmätningarna. I den andra kolumnen i din tabell måste du fylla i felmätningarna för varje datavärde. Felet är skillnaden mellan mätningen och medelvärdet.
    • För den angivna datamängden, subtrahera medelvärdet, 98,87, från varje uppmätt värde och fyll i den andra kolumnen med resultaten. Dessa tio beräkningar är som följer:
      • 99,0−98,87 = 0,13 {\ displaystyle 99,0-98,87 = 0,13}
      • 98,6−98,87 = −0,27 {\ displaystyle 98,6-98,87 = -0,27}
      • 98,5−98,87 = −0,37 {\ displaystyle 98,5-98,87 = -0,37}
      • 101,1−98,87 = 2,23 {\ displaystyle 101,1-98,87 = 2,23}
      • 98,3−98,87 = −0,57 {\ displaystyle 98,3-98,87 = -0,57}
      • 98,6−98,87 = −0,27 {\ displaystyle 98,6-98,87 = -0,27}
      • 97,9−98,87 = −0,97 {\ displaystyle 97,9-98,87 = -0,97}
      • 98,4−98,87 = −0,47 {\ displaystyle 98,4-98,87 = -0,47}
      • 99,2−98,87 = 0,33 {\ displaystyle 99,2-98,87 = 0,33}
      • 99,1−98,87 = 0,23 {\ displaystyle 99,1-98,87 = 0,23}
  5. 5
    Beräkna kvadraten för felen. I den tredje kolumnen i tabellen, hitta kvadraten för vart och ett av de resulterande värdena i mittkolumnen. Dessa representerar kvadraterna för avvikelsen från medelvärdet för varje uppmätt datavärde.
    • Använd varje miniräknare för varje värde i mittkolumnen och hitta kvadraten. Spela in resultaten i tredje kolumnen enligt följande:
      • 0,132 = 0,0169 {\ displaystyle 0,13 ^ {2} = 0,0169}
      • (−0,27) 2 = 0,0729 {\ displaystyle (-0,27) ^ {2} = 0,0729}
      • (−0,37) 2 = 0,1369 {\ displaystyle (-0,37) ^ {2} = 0,1369}
      • 2,232 = 4,9729 {\ displaystyle 2,23 ^ {2} = 4,9729}
      • (−0,57) 2 = 0,3249 {\ displaystyle (-0,57) ^ {2} = 0,3249}
      • (−0,27) 2 = 0,0729 {\ displaystyle (-0,27) ^ {2} = 0,0729}
      • (−0,97) 2 = 0,9409 {\ displaystyle (-0,97) ^ {2} = 0,9409}
      • (−0,47) 2 = 0,2209 {\ displaystyle (-0,47) ^ {2} = 0,2209}
      • 0,332 = 0,1089 {\ displaystyle 0,33 ^ {2} = 0,1089}
      • 0,232 = 0,0529 {\ displaystyle 0,23 ^ {2} = 0,0529}
  6. 6
    Lägg till kvadraterna av fel tillsammans. Det sista steget är att hitta summan av värdena i den tredje kolumnen. Det önskade resultatet är SSE eller summan av kvadratfel.
    • För denna datamängd beräknas SSE genom att lägga till de tio värdena i den tredje kolumnen:
    • SSE = 6921 {\ displaystyle SSE = 6 921}

Metod 2 av 3: skapa ett Excel-kalkylblad för att beräkna sse

  1. 1
    Märk kolumnerna i kalkylbladet. Du skapar en tabell med tre kolumner i Excel, med samma tre rubriker som ovan.
    • Skriv in rubriken "Värde" i cell A1.
    • Ange rubriken "Avvikelse" i cell B1.
    • Ange rubriken "Avvikelse i kvadrat" i cell C1.
  2. 2
    Skriv in din data. I den första kolumnen måste du skriva in värdena för dina mätningar. Om satsen är liten kan du helt enkelt skriva in dem för hand. Om du har en stor datamängd kan du behöva kopiera och klistra in data i kolumnen.
    Summan av kvadratfel
    Summan av kvadratfel, eller SSE, är en preliminär statistisk beräkning som leder till andra datavärden.
  3. 3
    Hitta medelvärdet för datapunkterna. Excel har en funktion som beräknar medelvärdet för dig. I någon ledig cell under din datatabell (det spelar ingen roll vilken cell du väljer) anger du följande:
    • = Genomsnitt (A2: __)
    • Skriv inte ett tomt utrymme. Fyll i det tomma med cellnamnet på din senaste datapunkt. Om du till exempel har 100 datapunkter, använder du funktionen:
      • = Genomsnitt (A2: A101)
      • Denna funktion inkluderar data från A2 till A101 eftersom den översta raden innehåller rubrikerna på kolumnerna.
    • När du trycker på Enter eller när du klickar bort till någon annan cell i tabellen fyller medelvärdet av dina datavärden automatiskt den cell som du just programmerat.
  4. 4
    Ange funktionen för felmätningarna. I den första tomma cellen i kolumnen "Avvikelse" måste du ange en funktion för att beräkna skillnaden mellan varje datapunkt och medelvärdet. För att göra detta måste du använda cellnamnet där medelvärdet finns. Låt oss för närvarande anta att du använde cell A104.
    • Funktionen för felberäkningen, som du anger i cell B2, kommer att vara:
      • = A2- $ A78€ Dollartecknen är nödvändiga för att se till att du låser in cell A104 för varje beräkning.
  5. 5
    Ange funktionen för felkvadraterna. I den tredje kolumnen kan du rikta Excel för att beräkna det kvadrat du behöver.
    • Ange funktionen i cell C2
      • = B2 ^ 2
  6. 6
    Kopiera funktionerna för att fylla hela tabellen. När du har angett funktionerna i den översta cellen i varje kolumn, B2 respektive C2, måste du fylla i hela tabellen. Du kan skriva in funktionen på varje rad i tabellen, men det skulle ta alldeles för lång tid. Använd musen, markera cellerna B2 och C2 tillsammans, och utan att släppa musknappen, dra ner till den nedre cellen i varje kolumn.
    • Om vi antar att du har 100 datapunkter i din tabell drar du ner musen till cellerna B101 och C101.
    • När du sedan släpper musknappen kommer formlerna att kopieras till alla celler i tabellen. Tabellen ska fyllas i automatiskt med de beräknade värdena.
  7. 7
    Hitta SSE. Kolumn C i din tabell innehåller alla kvadratfelvärden. Det sista steget är att Excel beräknar summan av dessa värden.
    • Ange funktionen i en cell under tabellen, förmodligen C102 för detta exempel:
      • = Summa (C2: C101)
    • När du klickar på Enter eller klickar bort i någon annan cell i tabellen bör du ha SSE-värdet för dina data.
Att hitta SSE för en datamängd är i allmänhet en byggsten för att hitta andra
Beräkna varians från SSE. Att hitta SSE för en datamängd är i allmänhet en byggsten för att hitta andra, mer användbara värden.

Metod 3 av 3: relaterar SSE till andra statistiska data

  1. 1
    Beräkna varians från SSE. Att hitta SSE för en datamängd är i allmänhet en byggsten för att hitta andra, mer användbara värden. Den första av dessa är varians. Variansen är en mätning som indikerar hur mycket den uppmätta informationen varierar från medelvärdet. Det är faktiskt genomsnittet av kvadratiska skillnader från medelvärdet.
    • Eftersom SSE är summan av de kvadrerade felen kan du hitta medelvärdet (vilket är variansen), bara genom att dela med antalet värden. Men om du beräknar variansen för en samlingsuppsättning, snarare än en full population, kommer du att dela med (n-1) istället för n. Således:
      • Varians = SSE / n, om du beräknar variansen för en full population.
      • Varians = SSE / (n-1), om du beräknar variansen för en provuppsättning med data.
    • För provproblemet med patienternas temperaturer kan vi anta att 10 patienter endast representerar en uppsättning prov. Därför skulle variansen beräknas som:
      • Varians = SSE (n − 1) {\ displaystyle {\ text {Varians}} = {\ frac {\ text {SSE}} {(n-1)}}}
      • Varians = 6 9219 {\ displaystyle {\ text {Variance}} = {\ frac {6 921} {9}}}
      • Varians = 0,769 {\ displaystyle {\ text {Varians}} = 0,769}
  2. 2
    Beräkna standardavvikelse från SSE. Standardavvikelsen är ett vanligt värde som anger hur mycket värdena för en datamängd avviker från medelvärdet. Den standardavvikelsen är kvadratroten av variansen. Kom ihåg att variansen är genomsnittet av kvadratfelmätningarna.
    • När du har beräknat SSE kan du därför hitta standardavvikelsen enligt följande:
      • Standardavvikelse = SSEn − 1 {\ displaystyle {\ text { Standardavvikelse }} = {\ sqrt {\ frac {\ text {SSE}} {n-1}}}}
    • För dataprov av temperaturmätningarna kan du hitta standardavvikelsen enligt följande:
      • Standardavvikelse = SSEn − 1 {\ displaystyle {\ text { Standardavvikelse }} = {\ sqrt {\ frac {\ text {SSE}} {n-1}}}}
      • Standardavvikelse = 6 9219 {\ displaystyle {\ text {Standardavvikelse}} = {\ sqrt {\ frac {\ text {6 921}} {9}}}}
      • Standardavvikelse = 0,769 {\ displaystyle {\ text { Standardavvikelse }} = {\ sqrt {0,769}}}
      • Standardavvikelse = 0,877 {\ displaystyle {\ text {Standardavvikelse}} = 0,877}
  3. 3
    Använd SSE för att mäta kovarians. Den här artikeln har fokuserat på datamängder som bara mäter ett enda värde åt gången. I många studier kan du dock jämföra två separata värden. Du skulle vilja veta hur dessa två värden relaterar till varandra, inte bara till medelvärdet för datamängden. Detta värde är kovariansen.
    • Beräkningarna för kovarians är alltför involverade för att beskrivas här, förutom att notera att du kommer att använda SSE för varje datatyp och sedan jämföra dem. För en mer detaljerad beskrivning av kovarians och berörda beräkningar, se Beräkna kovarians.
    • Som ett exempel på användningen av kovarians kanske du vill jämföra åldrarna hos patienterna i en medicinsk studie med läkemedlets effektivitet vid sänkning av feber. Då skulle du ha en datauppsättning med åldrar och en andra datamängd med temperaturer. Du hittar SSE för varje datamängd och sedan därifrån hittar du varians, standardavvikelser och kovarians.
FacebookTwitterInstagramPinterestLinkedInGoogle+YoutubeRedditDribbbleBehanceGithubCodePenWhatsappEmail