c3d2-web/content/static/datenspuren/2015/fahrplan/events/7066.html

106 lines
5.2 KiB
HTML
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

<!DOCTYPE html>
<html>
<head>
<meta content="text/html; charset=utf-8" http-equiv="content-type">
<title>Programm Datenspuren 2015</title>
<link rel="stylesheet" media="screen" href="/2015/fahrplan/assets/public_schedule-fd8f1c28083623471c99e7cb12d58be5ccc1bf1d357b0689295d59f7505982ff.css">
<link rel="stylesheet" media="all" href="/2015/fahrplan/style.css">
<link rel="stylesheet" media="print" href="/2015/fahrplan/assets/public_schedule_print-99d3251f43ed74e6a77a8013f74ce1ee07c4de819a619a15d8b8bb5dc9d4dad1.css">
<script src="/2015/fahrplan/assets/application-6f59b4d23031eb97ba0657e3fd5e2ea281d619b1474a36c93b748b9c83c36bdc.js"></script>
</head>
<body>
<div id="wrapper">
<div id="banner"></div>
<div id="header">
<h1>Programm Datenspuren 2015</h1>
</div>
<div id="horizontal-navigation">
<ul>
<li>
<a href="/2015/fahrplan/schedule.html">Übersicht</a>
</li>
<li>
<a href="/2015/fahrplan/schedule/0.html">
Tag 1
<br>
<span class="small-font">24.10.2015</span>
</a>
</li>
<li>
<a href="/2015/fahrplan/schedule/1.html">
Tag 2
<br>
<span class="small-font">25.10.2015</span>
</a>
</li>
<li>
<a href="/2015/fahrplan/speakers.html">Referenten</a>
</li>
<li class="selected">
<a href="/2015/fahrplan/events.html">Veranstaltungen</a>
</li>
</ul>
</div>
<div id="main-content">
<p class="release">
Version v1.0
</p>
<h2>Vortrag: Buchstaben-n-Gramme in der Autorenattribution</h2>
<h3 class="title">Quantitative und Qualitative Analysen</h3>
<div class="column left" id="basic">
<div class="image large"><img src="/2015/fahrplan/assets/event_large-4b8aa978adbb7c8e80151f5a83c6782a12e763374ae3a042a55e7e626a64d93b.png" alt="Event large 4b8aa978adbb7c8e80151f5a83c6782a12e763374ae3a042a55e7e626a64d93b"></div>
<p class="abstract">Ich setze mich genauer mit einer Methode der maschinellen Autorschaftsattribution auseinander, welche auf den Häufigkeiten von Buchstaben-n-Grammen basiert. Dabei wird aus linguistischer Sichtweise die Validität dieses Verfahrens untersucht.</p>
<p class="description">Im Rahmen meiner Masterarbeit im Bereich Angewandte Linguistik beschäftige ich mich mit maschinellen Methoden der Autorenattribution. Genauer gesagt untersuche ich die Klassifizierung der Autoren anhand von Buchstaben-n-Grammen (das erste Wort dieses Satzes kann beispielsweise in folgende Bigramme unterteilt werden: Ge, en, na, au, etc.). Diese Methode baut auf einer einfachen Erfassung der Häufigkeiten der n-Gramme auf, welche als Grundlage für die Klassifikation mittels maschineller Lernmethoden dient. In vielen Studien wird in diesem Kontext von einer äußerst effektiven wenn nicht gar der effektivsten Vorgehensweise zur Bestimmung des Autors eines anonymen Textes gesprochen. Unklar bleibt jedoch, welche Textmerkmale durch die Buchstaben-n-Gramme überhaupt gemessen werden. An dieser Stelle setzt meine Untersuchung an, welche auf einem Perl-Skript beruht. Ausgehend von einem Korpus aus natürlichsprachlichen Texten von verschiedenen Autoren erfolgt die Bestimmung jener Buchstaben-n-Gramme, die für die Klassifikation am entscheidendsten sind. Im nächsten Schritt werden alle Wörter ausgegeben, welche diese Buchstabenkombination enthalten. Diese werden in der sich anschließenden qualitativen Analyse gemeinsam mit den dazugehörigen Wortarten genauer untersucht. Den Hintergrund bildet die Annahme, dass nicht die Inhaltsmerkmale, sondern bestimmte Stilmerkmale eines anonymen Textes die Kriterien zur Bestimmung der Autorschaft bilden. Aus diesem Grund muss überprüft werden, ob sich die Wörter eher inhaltlichen oder stilistischen Gesichtspunkten zuordnen lassen. Somit hoffe ich, die zentrale Fragestellung beantworten zu können: Welche Textmerkmale werden durch Buchstaben-n-Gramme gemessen?
<br>In meinem Vortrag im Rahmen der Datenspuren 2015 werde ich diese Problematik sowie meine methodische Vorgehensweise kurz vorstellen und anschließend ausführlich auf meine Ergebnisse eingehen. Der Vortrag stellt insgesamt ein Plädoyer für die unterstützende qualitative Analyse im Rahmen computergestützter Verfahren zur Autorschaftsattribution dar.</p>
</div>
<div class="column left" id="details">
<h3>Info</h3>
<p>
<b>Tag:</b>
<a href="/2015/fahrplan/schedule/1.html">25.10.2015</a>
<br>
<b>Anfang:</b>
16:00 Uhr
<br>
<b>Dauer:</b>
01:00
<br>
<b>Raum:</b>
Erlebniswerkstatt
<br>
<br>
<b>Sprache:</b>
de
</p>
<h3>Links:</h3>
<ul>
<li><a href="/2015/fahrplan/events/7066.ics">iCalendar</a></li>
</ul>
<div class="column left" id="concurrent_events">
<h3><span class="translation_missing" title="translation missing: de.public.schedule.event.concurrent_events">Concurrent Events</span></h3>
<dl class="dl-horizontal">
<dt>Kino</dt>
<dd><a href="/2015/fahrplan/events/7082.html">Sicherer Kontaktdatenaustausch mit Sm@rtRNS</a></dd>
</dl>
</div>
</div>
<div class="column right" id="sidebar">
<h3>Referenten</h3>
<table class="list">
<tbody>
<tr>
<td><div class="image small"><img src="/2015/fahrplan/assets/person_small-6becbdd9bedc5ac3962dfb66f90e5ebb8fdbb97c287002e97bba3762a122a2bf.png" alt="Person small 6becbdd9bedc5ac3962dfb66f90e5ebb8fdbb97c287002e97bba3762a122a2bf"></div></td>
<td><a href="/2015/fahrplan/speakers/5783.html">Christopher Georgi</a></td>
</tr>
</tbody>
</table>
</div>
<div class="span16">
</div>
<br class="clear">
</div>
</div>
</body>
</html>