Friday 21 July 2017

Bewegungsdurchschnitt Ohne Überlauf


Ich habe im Wesentlichen eine Tabelle von Zahlen - eine Zeitreihe von Messungen. Jede Zeile in der Tabelle hat 5 Werte für die 5 verschiedenen Kategorien und eine Summenzeile für die Summe aller Kategorien. Wenn ich den Durchschnitt jeder Spalte nehme und die Mittelwerte zusammenfasse, sollte es gleich dem Durchschnitt der Zeilen summieren (natürlich ignorierender Rundungsfehler) (Ive bekam einen Fall, bei dem die beiden Werte immer um etwa 30 herumkommen und ich mich wundern Wie verrückt ich bin.) Update: Siehe unten - ich war (leicht) verrückt und hatte einen Fehler in meinem Code. Seufzer fand mein Problem - es war ein dummer Dupe-Fehler in meinem Code. Ich suchte nach einem Fehler im Durchschnitt der Summenlogik, aber es war in der Summe der Mittelwerte Logik - Bezug auf die falsche Variable. Nun, jedenfalls haben wir etwa 5 Wege von Sonntag gezeigt, dass die Summe der Durchschnittswerte wirklich gleich dem Durchschnitt der Summen ist, falls dies für jedermann in der Zukunft wichtig ist. Antwortete am 6. Februar 12 um 17:19 Vielleicht sollte das als Update auf die Frage gehen. Achten Sie auch darauf, eine Antwort jetzt zu akzeptieren, dass Ihr Problem behoben ist. Ndash Zev Chonoles Feb 7 12 at 2:15 Im Allgemeinen ist nein richtig, es ist nur das gleiche in bestimmten Fällen. Summe (x) Summe (y) ungleich Summe (xy) n wobei n die Gesamteinträge x Zeileneinträge und y Spalteneinträge sind. Nur wahr, wenn alle ys gleich sind zB: (12 35) 2 1120 (13) (25) 47 Wo ist y gleich (17 47) 2 514 (14) (77) 514 PS Sorry über die Entsendung von totem Thread Ich wünschte nur, dass es für alle anderen richtig ist. Eigentlich könnte Steve richtig sein Ich gebe Ihnen ein einfaches Beispiel und dann erklären Sie, warum intelligente Leute mit verschiedenen Antworten kommen können, weil in einer Weise, theyre beide Recht. Erste Reihe: 5 6 Zweite Reihe: 1 2 Dritte Reihe: 3 4 Wenn du entweder die Summe der Mittelwerte oder den Durchschnitt der Summen machst, wie Daniel fragte, dann bekommst du 7 als Antwort. Wenn du aber das 1 löschst, das ein Loch in deiner Tabelle verlässt, dann sinkt dein Durchschnitt der Summen auf 6 23 und deine Summe der Mittelwerte steigt auf 8. Wenn deine Datenkarte Blätter oder fehlende Datenpunkte hat, dann sind die beiden Fast nie dasselbe. Wenn die Tabelle der Daten gleichmäßig verteilt ist, ohne fehlende Punkte oder Löcher in der Tabelle, dann sollten sie immer gleich sein. Jeder kann dies mit MS Excel und der RAND () Funktion ausprobieren. Generieren Sie eine Tabelle mit einer beliebigen Anzahl von Zeilenspalten und füllen Sie die Zeilen und Spalten mit Zufallszahlen aus oder lassen Sie sie zufällige Zahlen für Sie generieren. Verwenden Sie dann AVERAGE (), um die Spalten und SUM () zu berechnen, um die Mittelwerte hinzuzufügen. Dann umkehren Sie den Prozess und verwenden Sie SUM (), um die Zeilen und AVERAGE () hinzuzufügen, um die Summen zu bewerten. Wenn die Tabelle fertig ist, dann sind die beiden Zahlen genau das gleiche. Wenn jedoch Ihre Daten aus irgendeinem Grund fehlende Einträge, dann kann es um einen großen Prozentsatz variieren. Starten Sie einfach das Löschen von Datenpunkten in der Mitte des Tisches und beobachten Sie die beiden Ergebnisse stark schwanken. Auch von Notizen ist, wenn Sie die Zeilen und Spalten drehen, dann erhalten Sie völlig unterschiedliche Ergebnisse, so stellen Sie sicher, dass Sie konsistent sind. Wenn du die Zeilen im obigen Beispiel durchschnittst und die Mittelwerte summierst oder die Spalten summierst und die Summen durchschnittst, dann bekommst du 10.5 mit einer vollständigen Tabelle und 11 und 10, jeweils mit dem 1 fehlenden. Antwortete am 6. August 12 um 21:40 Beachten Sie, dass OP in einem der Kommentare geschrieben hat, dass es keine Leerzeichen in der Tabelle gibt. Beachten Sie auch, dass, wenn Steve39s Antwort gelöscht wird, dann wird niemand wissen, was Ihr erster Satz bedeutet. Ndash Gerry Myerson Aug 7 12 bei 1:04 gemischte Mathematik ist richtig. Nehmen 3 Spalten 10 10s, 5 1s und 2,3,5,6,6,7,9,10 (8 Werte aus rand), nicht durchschnittliche Leerzeichen. Avg von avgs ist 5.67 avg aller Werte ist 6.65. Gemischte Mathematik ist es ok, einen alten Thread zu beantworten. Dieses Zeug, Wahrheit oder Wahrheit, lebt für immer auf dem InternetIs gibt es eine Möglichkeit, Datum Durchschnitt zu berechnen, aber nur ignorieren das Jahr Lassen Sie mich erklären. Ich habe diese Daten: Wenn ich AVERAGE (F2: F39) verwende. Das Ergebnis wird 12152008 sein. Das ist nicht was ich brauche. Was ich wirklich möchte, ist, den durchschnittlichen Tag und den Monat zu bestimmen. Es gibt ein paar Dezember Termine dort, dass ich wahrscheinlich beseitigen könnte, weil sie weg sind, aber mit dem Rest der Daten, ich denke, dass der Durchschnitt irgendwo um, sagen wir, 12. Juli (unabhängig vom Jahr) zum Beispiel . Ich hoffe das macht Sinn. Wenn mehr Details benötigt werden, lass es mich wissen. Ich habe DATE (2001, MONTH (A1), DAY (A1)), so dass es erstellt eine Liste der Daten im Jahr 2001. Sie können, wie es ist, aber es war ähnlich wie Jan Doggen39s Antwort Brauche o die Zellen zu formatieren, um sie als Datumsangaben anzuzeigen - einschließlich des AVERAGE (oder GEOMEAN) Ergebnisses, das du berechnet hast. Ndash Lefty Mai 6 15 bei 15: 21Tawani - sie sind nicht alle fehlt der Punkt. Was Sie sagen, muss mit generischen Begriffen definiert werden. Sie können nicht mit einem einzigen Beispiel gehen. Ohne allgemeine Definitionen, wenn 400 ist 30 ist es immer noch ein Ausreißer Und wenn es ist 14 Und 9 Wo stoppen Sie Sie brauchen stddev39s, Bereiche, Quartile, um das zu tun. Ndash Daniel Daranas Feb 2 09 um 17:05 Im Trimmen Sie don39t entfernen Ausreißer Sie nur don39t gehören sie in die Berechnung. QuotRemovequot könnte darauf hindeuten, dass Punkte nicht mehr im Dataset sind. Und du wirst sie nicht entfernen oder ignorieren, weil sie Ausreißer sind, das Kriterium ist (normalerweise) nur, dass sie in einem extremen Bruchteil der Daten sind. Ein Wert, der nicht in einem getrimmten Mittel enthalten ist, ist oft nur etwas mehr (oder weniger) als der höchste (niedrigste) Wert eingeschlossen. Ndash Nick Cox Dec 3 14 at 16:48 Ich weiß nicht, ob es einen Namen hat, aber man könnte ganz einfach mit einer Reihe von Algorithmen, um Ausreißer zu verwerfen: Finden Sie alle Zahlen zwischen dem 10. und 90. Perzentile (dies durch Sortierung dann Ablehnung Die ersten N10 und die letzten N10 Zahlen) und nehmen Sie den Mittelwert der verbleibenden Werte an. Werte sortieren, hohe und niedrige Werte zurückweisen, solange dadurch die mittlere Standardabweichung sich mehr als X ändert. Werte sortieren, hohe und niedrige Werte zurückweisen, solange dies geschieht, sind die betreffenden Werte mehr als K Standardabweichungen von der bedeuten. Die häufigste Art, ein robustes (das übliche Wort, das für schlechte Daten resistent ist), ist es, den Median zu benutzen. Dies ist nur der Mittelwert in der sortierten Liste (von halbem Weg zwischen den mittleren zwei Werten), also für dein Beispiel wäre es 90,5 auf halbem Weg zwischen 90 und 91. Wenn du wirklich in robuste Statistiken (wie robuste Schätzungen) bekommen willst Von Standardabweichung usw.) würde ich einen verlorenen Code bei der AGORAS-Gruppe empfehlen, aber das kann für Ihre Zwecke zu weit fortgeschritten sein. Antwort # 13 09 at 9:22 Wenn alles, was Sie haben, ist eine Variable (wie Sie implizieren) Ich denke, einige der Befragten oben sind überkritisch von Ihrem Ansatz. Sicherlich andere Methoden, die Dinge wie Hebelwirkung betrachten, sind eher statistisch gesund, aber das bedeutet, dass du eine Modellierung irgendwie tust. Wenn Sie nur zum Beispiel Punkte auf einem Test oder Alter von älteren Bürgern haben (plausible Fälle von Ihrem Beispiel), denke ich, dass es praktisch und vernünftig ist, verdächtig zu sein, dass der Ausreißer Sie heraufbringen. Du könntest den Gesamtmittel und den getrimmten Mittel betrachten und sehen, wie viel es sich ändert, aber das wird eine Funktion deiner Stichprobengröße und die Abweichung vom Mittelwert für deine Ausreißer sein. Mit aussagekräftigen Ausreißern wie dem, würdest du sicherlich in den Datenerzeugungsprozess schauen wollen, um herauszufinden, warum das der Fall ist. Ist es eine Dateneingabe oder administrative Flanke Wenn ja und es ist wahrscheinlich unabhängig von der tatsächlichen wahren Wert (das ist unbeobachtet) es scheint mir ganz gut zu trimmen. Wenn es ein wahrer Wert ist, so weit wie Sie sagen können, können Sie nicht in der Lage zu entfernen, wenn Sie explizit in Ihrer Analyse darüber sind. Beantwortet Dec 3 14 at 13:58 Mein Statistik-Lehrbuch bezieht sich auf diese als Sample Mean im Gegensatz zu einer Population Mean. Beispiel impliziert, dass eine Beschränkung auf den vollständigen Datensatz angewendet wurde, obwohl keine Änderung (Entfernung) zum Dataset gemacht wurde. Antwortete Mar 26 16 um 3:13 0. Willkommen auf der Seite. 1. Welches Buch Bitte geben Sie einen Hinweis. 2.Sample meanquot bezieht sich typischerweise nicht auf ein Mittel, das nach dem Entfernen von Ausreißern erhalten wird. Ndash Juho Kokkala Mar 26 16 at 8:06 Es kann der Median sein. Nicht immer, aber manchmal. Ich habe keine Ahnung, was es bei anderen Gelegenheiten genannt wird. Hoffe das hat geholfen (Zumindest ein Bisschen.)

No comments:

Post a Comment