Kommentarlinks sind dofollow!

Häufigkeiten in großen Listen zählen mit TextWrangler

von Florian Elbers am 28. März 2013

Ich werde ja hin und wieder gefragt, warum diese Seite macseoblog.de heißt (zuletzt von Patrick auf der SEO Campixx 2013). Hintergrund ist, dass ich hier neben SEO-Themen auch die Tools mit denen ich auf dem Mac arbeite und praktische Tipps dazu vorstellen möchte. Und heute ist es wieder mal soweit:

TextWrangler als Text-Editor für den Mac

Ich glaube zu TextWrangler brauche ich nicht mehr viel sagen. Jeder SEO braucht zu Zeiten einen guten Text-Editor, mit dem er Regulärte Ausdrücke (Regex) über große Liste laufen lassen kann. Auf dem Mac gibt es für mich nur 2 richtig gute Anwendungen, TextWrangler und Sublime Text. Welches man verwendet muss jeder für sich selbst entscheiden, ich bin TextWrangler gewohnt und bleibe vorerst dabei. Jedes der beiden Programme hat seine Stärken und Schwächen, auf die ich heute aber nicht näher eingehen möchte.

Häufigkeiten in großen Listen zählen mit TextWrangler

Heute stelle ich eine Möglichkeit vor mit TextWrangler anzuzeigen, wie häufig eine Zeile in einer Liste vorkommt. Wer schon einmal mit einer großen Liste gearbeitet hat und vor allem herausfinden wollte, welche Zeile am häufigsten vorkommt weiß, dass Excel hier schnell Probleme bekommt. Beispielhaft zeige ich den Vorgang an einer Liste mit sämtlichen Begegnungen der Fußball Bundesliga:

  1. Folgenden Code kopieren, in TextWrangler einfügen und als „Count Occurrences.pl“ speichern:
    #!/usr/bin/perl -w
    use strict;
     
    my @text = <>;
    my %occurrences = ();
    foreach (@text)
            {$occurrences{$_} ++;}
     
    foreach (@text){
            print "$occurrences{$_}: $_";
     
    }
    
  2. text-wrangler-haeufigkeit-zaehlen1

  3. In den Ordner „Library“ > „Application Support“ > „TextWrangler“ > „Text Filters“ gehen und die Datei „Count Occurrences.pl“ hineinkopieren (Bild 1)
  4. text-wrangler-haeufigkeit-zaehlen2

  5. Die zu bearbeitende Liste in TextWrangler öffen und per Menüleiste über „Text“ > „Apply Text Filter“ > „Count Occurrences“ die Häufigkeiten zählen lassen (Bild 2)
  6. text-wrangler-haeufigkeit-zaehlen3

  7. Nun löschen wir die Duplikate per Menüleiste über „Text“ > „Process Duplicate Lines…“, wobei der Haken bei „Delete Matched Lines“ nicht vergessen werden sollte
  8. Mit einem Klick in der Menüleiste auf „Text“ > „Sort Lines…“ lassen wir die Einträge absteigend sortieren. Hierbei sollten die Haken bei „Numbers Match by Value“ und „Reverse Sort“ nicht vergessen werden – fertig! (Bild 3)
  9. Danke an KisMAC für den Tipp!

In → Mac

2 Kommentare
  1. Was gehäuft auftritt, ist oftmals natürlich besonders wichtig. Wer hier ein Muster erkennt, kann einiges ablesen, was dem einfachen Auge womöglich entgeht.

  2. Sehr gutes Programm, kann ich jeden Mac User empfehlen.

Antworten

Beachte: XHTML ist erlaubt. Deine e-Mail-Adresse wird nicht veröffentlicht.

Neue Kommentare per RSS-Feed verfolgen

Highslide for Wordpress Plugin