Internetlinguistik. Konstanze MarxЧитать онлайн книгу.
href="#fb3_img_img_e16ca973-4b1a-5875-9b62-02fdf59c73c3.jpg" alt=""/>KWiC: Key word in context (Schlüssel-Lexem in einem spezifischen Kontext)
Es gibt eine Reihe derartiger Programme/Werkzeuge, die auch im WWW zur Verfügung stehen, als Beispiele seien hier antconc, Glossanet, NotaBene, Conc 1.8 für Macintosh oder KWiCFinder genannt. Eine ausführliche Beschreibung zur Anwendung von antconc gibt Bubenhofer unter:
Das Abspeichern kompletter Webseiten (mit dem Browser Firefox z. B. spielend leicht zu bewerkstelligen, indem beispielsweise einfach über die geläufige Tasten-Kombination Strg + S unter Dateityp „Webseite, komplett“ gewählt wird) ist eine sinnvolle Ergänzung, wenn die Architektur der Seite für Text-Bildrelationsanalysen nachvollziehbar bleiben soll.
Je nach angestrebter Korpus-Größe und Fragestellung ist für die Datensammlung ein längerer Zeitraum zu veranschlagen. Es ist deshalb wichtig, den Aufbau systematisch anzugehen. Das heißt, dass Worddokumente oder auch Bilddateien mit einem nachvollziehbaren Dateinamen versehen und in einer rekonstruierbaren Ordnerstruktur abgespeichert werden sollten. Auch die Ordner sollten Namen erhalten, deren Sinn sich auch nach Monaten noch erschließt. Als Bestandteile für Dokumentnamen eignen sich ein Kürzel für die Quelle des Belegs, das Erscheinungsdatum, ein Verweis auf die Textsorte und/oder ein inhaltlicher Hinweis.
Angewendet auf die obige Aufgabe wäre es z. B. möglich, das Online-Medien-Spektrum darüber abzudecken, dass Beiträge aus Boulevardzeitungen (bild.de) mit Beiträgen aus Tages- (sueddeutsche.de, faz.net) oder Wochenzeitungen (spiegel.de, zeit.de) verglichen werden. Ebenso können politisch eher links gerichtete (z. B. taz.de), eher konsverative (welt.de) und in etwa neutrale Online-Publikationen (berliner-zeitung.de) ausgewählt werden.
Es liegt nahe, unter den Stichwörtern „Karl Theodor zu Guttenberg“, „Silvana Koch-Mehrin“, „Annette Schavan“ oder „Plagiat“, „Plagiatsaffaire“ usw. nach Artikeln zu suchen, die im Zeitraum Februar 2011 bis März 2013 erschienen sind, diese sind entsprechend abzuspeichern.
Dazu könnten Ordner angelegt werden, die nach den Online-Medien benannt sind. Je nachdem, wieviele Texte gefunden werden, können Unterordner angelegt werden, für die verschiedene Ordnungen vorstellbar sind, z. B. Textsorten (Reportage, Nachricht, Kommentar, Leitartikel, Glosse) oder auch Erscheinungsmonate. Im vorliegenden Fall wäre es auch denkbar, Ordner anzulegen, die entsprechend der Phasen der Aberkennung des Doktortitels bezeichnet sind, beispielsweise: Beginn der öffentlichen Debatte, Prüfverfahren, Aberkennung, Rücktritt. Abhängig von der Länge der Texte ist zu entscheiden, ob ein Textdokument pro Beitrag angelegt werden kann. Es ist nicht sonderlich zweckmäßig, eine Reihe von längeren Artikeln in einem Word-Dokument abzuspeichern. Kommentare von Nutzer*innen sind nicht nur viel kürzer, oftmals referieren Nutzer*innen innerhalb der Kommentarbereiche aufeinander, so dass es hier günstig erscheint, mehrere Kommentare in einem Textdokument zusammenzufassen. Es hat sich bewährt, bereits in die Dokumentennamen auch Nummerierungen aufzunehmen. Der achte Leitartikel (art) in der Sammlung, der beispielsweise in der Berliner Zeitung (bz) am 11.2.2013 erschienen ist und die Nachfolge des Bildungsministerposten zum Thema hat, könnte den Dokumentennamen 8_bz_11.2.13_art_wanka erhalten und würde im Ordner ‚Rücktritt‘ abgelegt.
Möglicherweise eleganter, aber gleichzeitig auch aufwendiger und an mehr informationstechnologisches Vorwissen geknüpft, ist die Eingabe und Verwaltung der Korpusdaten über eine Datenbank. Die einfachste Möglichkeit einen Import in eine Datenbank vorzubereiten ist die systematische Eingabe der Texte in Felder einer (Excel-)Tabelle. Das soll an einem Beispiel veranschaulicht werden (siehe Tabelle 1-1, angelehnt an das Muster auf www.bubenhofer.com).
Text 1 | Text 2 | Text 3 | |
Quelle | www.sueddeutsche.de | ||
Datum | 16. Februar 2011 | ||
Autor/en | Roland Preuß, Tanjev Schultz | ||
Überschrift | Plagiatsvorwurf gegen Verteidigungsminister/Guttenberg soll bei Doktorarbeit abgeschrieben haben | ||
Untertitel 1 | Verteidigungsminister Guttenberg muss sich gegen Vorwürfe wehren, er habe bei seiner Doktorarbeit getäuscht. Nach SZ-Informationen gibt es in seiner Dissertation einige Passagen, die er ohne Angabe von Quellen wörtlich zitiert. Nach den jüngsten Bundeswehrskandalen wird Dr. Karl-Theodor Freiherr zu Guttenberg nun neue Kämpfe ausfechten müssen. | ||
Untertitel 2 | Die Doktorarbeit sei an mehreren Stellen "ein dreistes Plagiat" und "eine Täuschung", sagte der Bremer Juraprofessor Andreas Fischer-Lescano, der die Parallelen mit anderen Texten bei einer Routineprüfung entdeckt hat. Fischer-Lescano lehrt an der Universität Bremen Öffentliches Recht, Europa- und Völkerrecht. […] | ||
Zwischentitel | „Ungewöhnliche Verkettung von Glücksfällen“ | ||
Text | Es war offenbar nicht einfach für Karl-Theodor zu Guttenberg, seine Doktorarbeit zu vollenden, das macht er im Vorwort klar. Günstige Momente zur Fertigstellung habe er "durch freiberufliche wie später parlamentarische 'Ablenkung' versäumt". Der CSU-Politiker verweist auf eine Mischung aus "eherner professoraler Geduld" und "sanftem, aber unerbittlichem familiären Druck", der das Projekt doch noch zum Abschluss führte. "Diese Arbeit entspringt einer ungewöhnlichen Verkettung von Glücksfällen." […] | ||
Rubrik | Politik | ||
Quelle | www.sueddeutsche.de/politik/plagiatsvorwurf-gegen-verteidigungsminister-guttenberg-soll-bei-doktorarbeit-abgeschrieben-haben-1.1060774 |
Tab. 1-1:
Vorschlag