c3d2-web/content/news/pentacast-33-text-informati...

66 lines
4.2 KiB
XML

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE item SYSTEM "http://www.c3d2.de/dtd/c3d2web.dtd">
<item title="pentacast 33: Text information retrieval" date="2011-07-19T10:10:06" author="klObs">
<image title="(((pentacast))">../pentacast.png</image>
<p>
Wie schön wäre es, wenn man sich nicht mehr selbst durch die unzähligen,
länglichen Harry Potter Bücher quälen müsste, nur um zu wissen, warum auf
4-chan immer diese Witze über die Nase von Lord Voldemort gemacht werden.
</p>
<p>
Diesem Problem könnten in Zukunft die Jungs und Mädels aus der
Wissenschaft der Text Information Retrieval abhilfe bringen. Sie probieren
dem Computer Prosa-Texte zum Frass vorzuwerfen und aus diesen die
Informationen für Computer verwertbar zu extrahieren.
</p>
<addendum>
<p>
Studiogast Hendrik Freund hat sich während eines Praktikums und seiner
Diplomarbeit eingehend mit diesem Thema beschäftigt und gibt eine leicht
verständliche Einführung in das Themengebiet.
</p>
<p>Inhalte:</p>
<ul>
<li><link href="http://de.wikipedia.org/wiki/Computerlinguistik">WP: Natural Language Processing (NLP)</link></li>
<li><link href="http://de.wikipedia.org/wiki/Information_Retrieval">WP: Information Retrieval</link></li>
<li><link href="http://de.wikipedia.org/wiki/Stochastik">WP: Stochastik</link></li>
<li><link href="http://events.ccc.de/congress/2007/Fahrplan/events/2284.en.html">
24C3: Linguistic Hacking: How to know what a text in an unknown language is about?</link></li>
<li><link href="http://de.wikipedia.org/wiki/Mehrwortterminus">WP: Mehrwortterm</link></li>
<li><link href="http://de.wikipedia.org/wiki/Part-of-speech_Tagging">WP: Tagger</link></li>
<li><link href="http://de.wikipedia.org/wiki/Grammatik">WP: Grammatik</link></li>
<li><link href="http://en.wikipedia.org/wiki/Brill_tagger">WP(EN): Brill Tagger</link></li>
<li><link href="http://www.ims.uni-stuttgart.de/projekte/corplex/TreeTagger/">Tree Tagger</link></li>
<li><link href="http://en.wikipedia.org/wiki/Chunking_(computational_linguistics)">WP(EN): Chunking</link></li>
<li><link href="http://de.wikipedia.org/wiki/Phrase_(Linguistik)">WP: Phrase</link></li>
<li><link href="http://de.wikipedia.org/wiki/Eigenname">WP: Named entity</link></li>
<li><link href="http://wordnet.princeton.edu/">Word net</link></li>
<li><link href="http://de.wikipedia.org/wiki/RDF-Schema">WP: RDF</link></li>
<li><link href="http://de.wikipedia.org/wiki/Web_Ontology_Language">WP: OWL</link></li>
<li><link href="http://de.wikipedia.org/wiki/Michael_Ballack">WP: Michael Ballack</link></li>
<li><link href="http://de.wikipedia.org/wiki/DBpedia">WP: DBpedia</link></li>
<li><link href="http://de.wikipedia.org/wiki/SPARQL">WP: SPARQL</link></li>
<li><link href="http://de.wikipedia.org/wiki/Taxonomie">WP: Taxonomie</link></li>
<li><link href="http://de.wikipedia.org/wiki/Stemming">WP: Stemming</link></li>
<li><link href="http://de.wikipedia.org/wiki/Lemmatisierung">WP: Lemmatizing</link></li>
<li><link href="http://www.nltk.org/">Natural Language Toolkit für Python</link></li>
<li><link href="http://incubator.apache.org/opennlp/">Apache OpenNLP</link></li>
<li><link href="http://uima.apache.org/">Apache UIMA</link></li>
<li><link href="http://de.wikipedia.org/wiki/Hidden-Markov-Modell">WP: Hidden Markov Modell</link></li>
<li><link href="http://de.wikipedia.org/wiki/Likelihood-Funktion#Log-Likelihood-Funktion">WP: Log Likelihood</link></li>
<li><link href="http://de.wikipedia.org/wiki/Morphem">WP: Morphem</link></li>
<li><link href="http://tartarus.org/~martin/PorterStemmer/">Porter stemmer</link></li>
<li><link href="https://files.ifi.uzh.ch/cl/tagger/">Tagger for German Language</link></li>
<li><link href="http://www.durchdenken.de/lewandowski/web-ir/">Dirk Lewandowski: Web Information Retrieval</link></li>
</ul>
</addendum>
<resource title="pentacast 33: Text information retrieval" size="54647014"
type="application/ogg"
url="http://ftp.c3d2.de/pentacast/pentacast-33-text-information-retreival.ogg">
<alternative size="78547774" type="audio/mpeg"
url="http://ftp.c3d2.de/pentacast/pentacast-33-text-information-retreival.mp3"/>
</resource>
</item>