Dear Statalist Community,
i am currently trying to import a totally unstructured txt.*- file into Stata and then want to transform it into a usable dataset.
Because of the fact that this is an assignment for university i have to use "infile" and a dictionary to import the file.
Here is a small example of the Textfile (it is written in German):
My aim is to reach a dataset, which looks like that:
Observation | Date | City | Event
1 | 6. August | Dresden | nach einer Bittandacht mit 1500 Teilnehmern Demonstration gegen den Bau des Reinstsiliziumwerkes; Polizei schreitet mit Gewalt dagegen ein und nimmt zahlreiche Teilnehmer fest
This would be the case for the first line shown in the Quote of the txt*-file.
I marked the Dates bold and underlined the cities in the txt*- file. Everything after the city name is the event, until there is a new city name, after a " - ".
Could anyone please help me how to structure the txt*-file in the dictionary?
Best regards,
Eugen
i am currently trying to import a totally unstructured txt.*- file into Stata and then want to transform it into a usable dataset.
Because of the fact that this is an assignment for university i have to use "infile" and a dictionary to import the file.
Here is a small example of the Textfile (it is written in German):
6. August
Dresden nach einer Bittandacht mit 1500 Teilnehmern Demonstration gegen den Bau des Reinstsiliziumwerkes; Polizei schreitet mit Gewalt dagegen ein und nimmt zahlreiche Teilnehmer fest
1. September
Arnsdorf/Dresden Schweigemarsch von der Dorfkirche zur Andachtskirche mit 23 Teilnehmern — Forst eine Gruppe junger Leute demonstriert an der Oder-Neiße-Friedensgrenze während einer offiziellen Gedenkveranstaltung mit eigenen Transparenten, z.B. »Friedensbrücken statt Friedensgrenzen«
- Neuruppin »Weg des Friedens« zum Gedenken an den 50.Jahrestag des Überfalls auf Polen vom Gemeindehaus der Evangelisch-Freikirchlichen Gemeinde zum Platz der Opfer des Faschismus;
dort findet eine Andacht unter freiem Himmel mit 120 Teilnehmern statt
- Stralsund Schweigemarsch mit Kerzen zur Jakobikirche nach einem Friedensgebet in der Niko-laikirche mit 200 Teilnehmern; in der Jakobikirche findet anschließend ein Gesprächsforum statt
4. September
Leipzig erstes Friedensgebet nach der Sommerpause in der Nikolaikirche; nach dem
Friedensgebet versammeln sich 800 Teilnehmer auf dem Nikolaikirchhof, von Bürger-
rechtlern werden Transparente entfaltet, auf denen sie Menschenrechte, Reisefreiheit
und Toleranz einfordern; eine versuchte Demonstration wird von Polizeiketten auf-
gehalten; 500 (BDVP, MS: 250) ausreisewillige Teilnehmer demonstrieren später bis
zum Hauptbahnhof und fordern freie Fahrt nach Gießen
Dresden nach einer Bittandacht mit 1500 Teilnehmern Demonstration gegen den Bau des Reinstsiliziumwerkes; Polizei schreitet mit Gewalt dagegen ein und nimmt zahlreiche Teilnehmer fest
1. September
Arnsdorf/Dresden Schweigemarsch von der Dorfkirche zur Andachtskirche mit 23 Teilnehmern — Forst eine Gruppe junger Leute demonstriert an der Oder-Neiße-Friedensgrenze während einer offiziellen Gedenkveranstaltung mit eigenen Transparenten, z.B. »Friedensbrücken statt Friedensgrenzen«
- Neuruppin »Weg des Friedens« zum Gedenken an den 50.Jahrestag des Überfalls auf Polen vom Gemeindehaus der Evangelisch-Freikirchlichen Gemeinde zum Platz der Opfer des Faschismus;
dort findet eine Andacht unter freiem Himmel mit 120 Teilnehmern statt
- Stralsund Schweigemarsch mit Kerzen zur Jakobikirche nach einem Friedensgebet in der Niko-laikirche mit 200 Teilnehmern; in der Jakobikirche findet anschließend ein Gesprächsforum statt
4. September
Leipzig erstes Friedensgebet nach der Sommerpause in der Nikolaikirche; nach dem
Friedensgebet versammeln sich 800 Teilnehmer auf dem Nikolaikirchhof, von Bürger-
rechtlern werden Transparente entfaltet, auf denen sie Menschenrechte, Reisefreiheit
und Toleranz einfordern; eine versuchte Demonstration wird von Polizeiketten auf-
gehalten; 500 (BDVP, MS: 250) ausreisewillige Teilnehmer demonstrieren später bis
zum Hauptbahnhof und fordern freie Fahrt nach Gießen
My aim is to reach a dataset, which looks like that:
Observation | Date | City | Event
1 | 6. August | Dresden | nach einer Bittandacht mit 1500 Teilnehmern Demonstration gegen den Bau des Reinstsiliziumwerkes; Polizei schreitet mit Gewalt dagegen ein und nimmt zahlreiche Teilnehmer fest
This would be the case for the first line shown in the Quote of the txt*-file.
I marked the Dates bold and underlined the cities in the txt*- file. Everything after the city name is the event, until there is a new city name, after a " - ".
Could anyone please help me how to structure the txt*-file in the dictionary?
Best regards,
Eugen