Friday 17 February 2017

Stata Generating Moving Average Variable

Diese Datenstruktur ist unzweckmäßig. Angenommen, eine ID-ID müssen Sie umformen. z. B. Dann ist ein gleitender Durchschnitt einfach. Verwenden Sie tssmooth oder einfach nur generieren. z. B. Mehr darüber, warum Ihre Datenstruktur ist ziemlich unfit: Nicht nur würde die Berechnung eines gleitenden Durchschnitt benötigen eine Schleife (nicht unbedingt mit egen), aber Sie würden mehrere neue zusätzliche Variablen erstellen. Mit denen in einer späteren Analyse wäre irgendwo zwischen ungeschickt und unmöglich. EDIT Ill geben eine Probe-Schleife, während sich nicht aus meiner Haltung, dass es schlechte Technik. Ich sehe nicht einen Grund für Ihre Namenskonvention, wobei P1947 ist ein Mittel für 1943-1945 Ich nehme an, das ist nur ein Tippfehler. Nehmen wir an, dass wir Daten für 1913-2012 haben. Für Mittel von 3 Jahren verlieren wir ein Jahr an jedem Ende. Das könnte prägnanter geschrieben werden, auf Kosten einer Flut von Makros innerhalb von Makros. Mit ungleichen Gewichten ist einfach, wie oben. Der einzige Grund, egen verwenden ist, dass es nicht aufgeben, wenn es Versäumnisse, die die oben genannten tun wird. Der Vollständigkeit halber sei bemerkt, dass es leicht ist, Fehler zu behandeln, ohne auf egen zurückzugreifen. Und dem Nenner Wenn alle Werte fehlen, reduziert sich dies auf 00 oder fehlt. Andernfalls, wenn ein Wert fehlt, fügen wir 0 auf den Zähler und 0 auf den Nenner, die die gleiche wie Ignorieren ist. Natürlich ist der Code erträglich wie oben für Mittelwerte von 3 Jahren, aber entweder für diesen Fall oder für die Mittelung über mehr Jahre, würden wir ersetzen die Zeilen oben durch eine Schleife, was egen tut. Oft Zeiten können wir daran interessiert, Räumlich gleitenden Durchschnitt eines Merkmals X. Wir können diesen gleitenden Durchschnitt verwenden, um die Kontrolle der Heterogenität in der Population zu unterstützen, die mit der räumlichen Verteilung der Beobachtungen zusammenhängen kann. Um dies zu tun, müssen wir eine Methode zur Erzeugung eines räumlichen Mittels haben. Ich Code diese manuell, weil ich keine Erfahrung mit räumlichen Daten in Stata und weiß nicht, was der eingebaute Befehl ist (vorausgesetzt, es ist ein). Wenn Sie nur auf der Suche nach dem räumlichen Mittel sind, dann können Sie den eingebauten Befehl bevorzugen. Allerdings ist diese Methode flexibel und leicht modifizierbar, wenn man zB über die Euklidische 2D-Distanzformel hinausgehen möchte und stattdessen lieber die 3D-Formel oder die nD-Formel vorziehen würde. Ebenso könnte die gleitende Durchschnittsstatistik leicht durch eine verschiebende Varianz oder jede andere Statistik ersetzt werden, die über den egen-Befehl erzeugt werden könnte. So könnte diese Übung nützlich sein, um zu untersuchen, auch wenn redundant. Global Nobs 1000 clear set obs Nobs 2D-Koordinaten generieren gen latt runiform () 100 gen longg runiform () 100 Erzeugen Sie die Variable von Interesse. Die Variable hat eine Zufallskomponente und eine räumlich abhängige Komponente. Gen X (lattlongg) 100rnormal () zwei (scatter latt X) (scatter longg X) Wir können sehen, dass es zwar einen allgemeinen Trend zu größeren Werten als Längen - oder Breitengrad gibt, aber kaum ein starkes Muster zu identifizieren ist. Nun können wir für jede Beobachtung den gleitenden Durchschnitt von X berechnen. (Es gibt wohl einen Befehl dafür, den ich nicht kenne). Gen Xave. Gen dist. Forv i1Nobs Berechnen Sie den Abstand aller Punkte von obs i ersetzen Sie dist ((latt-latti) 2 (longg-longgi) 2) .5 Berechnen Sie den Mittelwert von X, wenn der Abstand innerhalb des Bereichs von Interesse ist egen tempx mean (X) if distltmeanrange Ersetzen Sie Xave tempx, wenn ni drop tempx zwei (scatter latt Xave) (scatter longg Xave) Nun können wir mit Blick auf den gleitenden Durchschnitt die Positionseffekte auf den erwarteten Wert von X. NOTICE leicht erkennen: Die IDRE Statistical consulting group wird sein Migration der Website auf die WordPress CMS im Februar, um die Wartung und die Schaffung neuer Inhalte zu erleichtern. Einige unserer älteren Seiten werden entfernt oder archiviert, so dass sie nicht länger erhalten bleiben. Wir werden versuchen, Redirects beizubehalten, damit die alten URLs weiterhin so gut funktionieren, wie wir können. Willkommen beim Institut für Digitale Forschung und Bildung Helfen Sie der Stat Consulting Group mit einem Geschenk Stata Learning Modul Erstellen und Umkodieren von Variablen Dieses Modul zeigt, wie Sie Variablen erstellen und rekodieren. In Stata können Sie neue Variablen mit generieren und Sie können die Werte einer vorhandenen Variablen mit Ersetzen und mit Recode ändern. Berechnen neuer Variablen mit generieren und ersetzen Lets verwenden die Auto-Daten für unsere Beispiele. In diesem Abschnitt sehen wir, wie man Variablen mit Generieren und Ersetzen berechnen kann. Die variable Länge enthält die Länge des Autos in Zoll. Unten sehen wir Zusammenfassungsstatistiken für Länge. Mithilfe des Befehls generate können Sie eine neue Variable erstellen, die die Länge in Fuß anstelle von Zoll hat, lenft genannt. Wir sollten betonen, dass generieren ist für die Schaffung einer neuen Variable. Für eine vorhandene Variable müssen Sie den Befehl replace (nicht generieren) verwenden. Wie unten gezeigt, verwenden wir replace, um die Zuweisung an lenft zu wiederholen. Die Syntax von generate und replace ist identisch, außer: - generiert, wenn die Variable noch nicht existiert und gibt einen Fehler, wenn die Variable bereits existiert. - ersetzen Werke, wenn die Variable bereits vorhanden ist, und geben einen Fehler, wenn die Variable noch nicht vorhanden ist. Angenommen, wir wollten eine Variable namens length2 erstellen, die die Länge quadriert hat. Oder vielleicht möchten wir loglen, die das natürliche Protokoll der Länge ist. Lets get die mittlere und Standardabweichung der Länge und wir können Z-Scores der Länge machen. Der Mittelwert beträgt 187,93 und die Standardabweichung ist 22,27, so dass die Zlenge berechnet werden kann, wie unten gezeigt. Mit generieren und ersetzen können Sie - für Addition und Subtraktion für Multiplikation und Division, die Sie für Exponenten (z. B. length2) verwenden können, verwenden () für die Steuerung der Reihenfolge der Operationen. Recoding neue Variablen mit generieren und ersetzen Angenommen, wir wollten mpg in drei Kategorien brechen. Lassen Sie uns eine Tabelle von mpg betrachten, um zu sehen, wo wir die Linien für solche Kategorien zeichnen konnten. Lets konvertieren mpg in drei Kategorien zu helfen, diese besser lesbar. Hier konvertieren wir mpg in drei Kategorien mit generieren und ersetzen. Mit tabulate können Sie überprüfen, ob das korrekt funktioniert hat. In der Tat können Sie sehen, dass ein Wert von 1 für mpg3 geht von 12-18, ein Wert von 2 geht von 19-23, und ein Wert von 3 geht von 24-41. Jetzt könnten wir mpg3 verwenden, um eine Kreuztabelle von mpg3 von fremden zu zeigen, um die Meilenzahl der fremden und heimischen Autos zu kontrastieren. Die oben gezeigte Kreuztabelle zeigt, dass 21 der heimischen Autos in die Kategorie der hohen Kilometer fallen, während 55 der ausländischen Autos in diese Kategorie passen. Recoding-Variablen mit recode Es gibt einen einfacheren Weg, um mpg zu drei Kategorien mithilfe von generieren und recode recode. Zuerst machen wir eine Kopie von mpg. Nennen es mpg3a. Dann verwenden wir recode, um mpg3a in drei Kategorien umzuwandeln: min-18 in 1, 19-23 in 2 und 24-max in 3. Lets doppelte Überprüfung, um zu sehen, dass dies korrekt funktionierte. Wir sehen, dass es einwandfrei funktionierte. Recodes mit if Lets erstellen eine Variable namens mpgfd, dass die Kilometerleistung der Autos in Bezug auf ihre Herkunft bewertet. Lassen Sie dies eine 01-Variable namens mpgfd, die: 0, wenn unter dem Median mpg für ihre Gruppe (foreigndomestic) 1, wenn über dem Median mpg für seine Gruppe (foreigndomestic). Wir sehen, dass der Median 19 für die inländischen (foreign0) Autos und 24.5 für die fremden (foreign1) Autos ist. Die generierten und recode Befehle unten recode mpg in mpgfd auf der Grundlage der inländischen Auto-Median für die heimischen Autos, und auf der Grundlage der ausländischen Auto-Median für die ausländischen Autos. Wir können mit diesem unten zu überprüfen, und der umcodierte Wert mpgfd sieht richtig. Erstellen Sie eine neue Variable lenft, die Länge dividiert durch 12 ist. Ändern Sie die Werte einer vorhandenen Variablen namens lenft. Recode mpg in mpg3. Mit drei Kategorien mit generieren und ersetzen, wenn. Recode mpg in mpg3a. Mit drei Kategorien, 1 2 3, mit generieren und recode. Recode mpg in mpgfd. Mit zwei Kategorien, aber mit verschiedenen Cutoffs für ausländische und inländische Autos. Der Inhalt dieser Website sollte nicht als eine Bestätigung für eine bestimmte Website, ein Buch oder ein Softwareprodukt der Universität von Kalifornien verstanden werden.


No comments:

Post a Comment