Logo faq-o-matic.net
Logo faq-o-matic.net

Zu einem Vornamen das Geschlecht finden

von veröffentlicht am1. Juni 2011, 06:42 Uhr Kurzlink und Zitatlink einblenden
Kategorie Kategorie: Office, Scripting, Tools   Translate with Microsoft Translator Translate EN   Die angezeigte Seite drucken
Zuletzt aktualisiert: 25. März 2013
imageJedes Unternehmen nutzt Adressdaten in irgendeiner Form. Für viele Zwecke braucht man zu einer Person die Angabe des Geschlechts – spätestens dann, wenn man automatisiert Anschreiben erzeugen und die Person korrekt ansprechen will. Doch was tut man, wenn die Angabe “Frau” oder “Herr” nicht in der Datenbank hinterlegt ist?
Eine manuelle Zuordnung erzeugt nicht nur viel Aufwand, der bei kleineren Adressbeständen durchaus noch tolerierbar wäre. Es gibt häufig Fälle, in denen die korrekte Anrede nicht ohne Weiteres aus dem Namen abzulesen ist. Typischer Fall sind hier fremdsprachliche Namen.
Vor einigen Jahren gab es dazu in der c’t (Heft 17/2007) einen interessanten Artikel, der eine automatisierte Zuordnung des Geschlechts anhand des Vornamens beschreibt. Die Software dazu stützt sich auf eine umfangreiche Datenbank von über 40.000 Vornamen aus zahlreichen Sprachen. Dabei ist der Autor Jörg Michael nach wissenschaftlichen Kriterien vorgegangen und hat nicht nur eine flexible Notation für seine Datenbank erarbeitet, sondern auch einen Algorithmus, der die Recherche ermöglicht. Seine Software ist auf dem FTP-Server der c’t immer noch kostenlos verfügbar.

Der Download-Link zu Programm und Quellcode, die einschließlich der Datenbank unter der GPL stehen, lautet:
In der beiliegenden Readme-Datei beschreibt der Autor die Datenbank und die Funktionsweise des Programms. Die Software benötigt keine Installation, sondern kann als Kommandozeilenprogramm direkt gestartet werden. Die Grundsyntax ist:
gender -get_gender <Vorname>
Die Funktionsnamen kann man dabei mit oder ohne Bindestrich angeben. Der folgende Aufruf belegt, dass mein Vorname für männliche Personen genutzt wird:
C:\Users\KAC\0717-182>gender -get_gender Nils
final result for 'Nils':  'is male'

C:\Users\KAC\0717-182> 
Neben dieser Standardfunktion kennt das Programm auch weitere Aufrufe, die als Parameter zu übergeben sind:
  • check_nickname <Name1> <Name2>: Prüft, ob zwei Namen gleichwertig sind, etwa “Hajo” und “Hansjoachim” oder “Bill” und “William”. Von dieser Funktion darf man keine Wunder erwarten, denn die Datenbank enthält nur eine Auswahl solcher Zuordnungen.
  • find_similar_name <Name>: Versucht, ähnliche Namen zu finden. Das ist z.B. nützlich bei Tippfehlern, aber auch bei Sprachen, die mehr als eine Schreibweise zulassen (z.B. bei der Umwandlung von arabischen oder russischen Namen in die lateinische Schrift).
    C:\Users\KAC\0717-182>gender find_similar_name Alexj
    Result: 4 name(s) found:  'Aleksy; Aleksi; Alexi; Alexy'
  • print_names_of_country <Land> <Dateiname>: Gibt alle Namen aus einem bestimmten Land in die angegebene Datei aus.
  • statistics: Gibt eine Statistik zur Datenbank aus
Die Funktion, die das Geschlecht für alle Namen aus einer einfachen Textdatei bestimmt, habe ich im Test nicht erfolgreich aufrufen können. Man kann sich aber so behelfen:
C:\Users\KAC\0717-182>for /f "usebackq" %i in (`type mynames.txt`) do @gender -get_gender %i
final result for 'Nils':  'is male'
final result for 'Stephanie':  'is female'
final result for 'Julika':  'is female'
final result for 'Feline':  'is female'
Die Ausgabe dieser Kommandoschleife kann man z.B. in Excel weiterverabeiten, um daraus eine Eingabe für die Korrektur eines vorhandenen Datenbestandes zu erzeugen.
Schließlich gibt es auch noch ein grafisches Frontend für gender.exe, das die Nutzung bei manueller Suche deutlich erleichtert. Eike Schmidt (alias “Zed Gecko”) hat es mit AutoHotkey geschrieben und stellt es kostenlos zur Verfügung. Der Screenshot oben zeigt dieses kleine Programm.

[WinGender.zip]

http://www.autohotkey.net/~Zed_Gecko/gender/WinGender.zip

Update 25. 3. 2013: Der obige Link zu dem GUI-Werkzeug funktioniert leider nicht mehr. Wer Bedarf hat, kann sich aber mit AutoHotKey aus dem Quelltext selbst das Programm erzeugen. Der Quelltext findet sich hier:

[Search Results – AutoHotkey Community]
http://www.autohotkey.com/board/index.php?app=core&module=search&do=search&fromMainBar=1

(der Quelltext scheint nur über diese Suchseite nutzbar angezeigt zu werden.)

 

© 2005-2014 bei faq-o-matic.net. Alle Rechte an den Texten liegen bei deren Autorinnen und Autoren.

Jede Wiederveröffentlichung der Texte oder von Auszügen daraus - egal ob kommerziell oder nicht - bedarf der ausdrücklichen Genehmigung durch die jeweiligen Urheberinnen oder Urheber.

Das Impressum findet sich unter: http://www.faq-o-matic.net/impressum/

Danke, dass du faq-o-matic.net nutzt. Du hast ein einfaches Blog sehr glücklich gemacht!