Listing 1 - 4 of 4 |
Sort by
|
Choose an application
Detecting corefering events and entities in texts is an important task in NLP, where it plays a role in many other tasks and applications. In this work, we build on a joint approach of entity and event coreference resolution, pioneered by H. Lee, Recasens, et al. 2012 and matured by Barhom et al. 2019 using a neural architecture. In particular we look at coreference resolution across documents, more complicated and less researched than coreference resolution within documents. Using the Barhom et al. 2019’s model, we propose a series of extensions to improve its results. This is done by increasing the amount of information provided to the model, in particular the joint nature of the modelling and by improving entity and event representation with the use of document embedding. As a secondary problem, we investigate ways to improve the model’s time performance through compressing the mention representations. Our results are compared with other works tackling the problem of cross document coreference resolution on the ECB+ dataset, the standard dataset for cross document entity and event coreference resolution.
Choose an application
Syntaxe. --- Grammaire générative. --- Français (langue) --- Français (langue) --- Français (langue) --- Grammaire --- Sémantique. --- Linguistique structurale. --- Syntaxe. --- Grammaire. --- Sémantique. --- Coréférence.
Choose an application
Doelstelling: Het doel van deze masterproef is verder onderzoek te verrichten omtrent de Web People Search taak, meerbepaald naar de resultaten op een Nederlandstalig corpus. De Web People Search taak (WePS) wil het zoeken naar personen via een online zoekmachine vereenvoudigen. De vraag hiernaar is groot omdat heel veel personen dezelfde naam kunnen delen.Het effect van WePS op een online zoekmachine is het volgende: in plaats van een ongesorteerde mix van webpagina's over verschillende mensen die dezelfde naam delen - waarbij de gebruiker dan één voor één de zoekresultaten moet analyseren - is de output van WePS dan een verzameling van clusters, waarbij elke cluster de webpagina's bevat die gaan over één van de verschillende personen (die aan de zoekterm voldoen). De gebruiker kan dan de cluster van de gezochte persoon aanklikken waarna hij meteen alle relevante pagina's over die persoon ziet. Op deze manier kan de zoektocht naar informatie over een bepaalde persoon op het internet sterk vereenvoudigd worden. Middelen of methode: Voor dit onderzoek stelden we een Nederlandstalig corpus op. Dit corpus bestaat uit de eerste 50 zoekresultaten van de bekende online zoekmachine Google voor twee verschillende query's: "Jan De Cock" en "Jan Peeters". Het corpus bestaat dus in totaal uit 100 webpagina's. Deze werden gefilterd van alle "noise": html tags, java,...Daarna werden via TF-IDF frequency de belangrijkste kernwoorden van elke geëxtraheerd, aan de hand daarvan bouwden we een matrix op dat we konden gebruiken voor de automatische clustering. We evalueren per persoon 6 verschillende clusteringmethodes en bespreken daarvan de resultaten, vergeleken met een manueel geclusterde 'gold standard'. Resultaten: De beste resultaten werden voor beide personen behaald met de 'cosine distance'-metriek. Wat betreft het beste clusteringalgoritme, werden de beste resultaten behaald met 'group average' algoritme. We kunnen besluiten dat de resultaten op een Nederlandstalig corpus matig zijn indien we enkel gebruik maken van kernwoorden. Naar de toekomst toe moet men proberen andere middelen hieraan vast te koppelen die deze resultaten verbeteren, zoals bijvoorbeeld bepaling van locatie via het IP-adres of door meer belang te koppelen aan kernwoorden uit de 'snippets' van de zoekresultaten. Ook combinaties met (verwante) onderzoeksgebieden of taken zoals Named Entity Recognition en Coreference Resolution hebben het potentieel om de resultaten te verbeteren.
Clustering. --- Coreference Resolution. --- Information Retrieval. --- Named Entity Recognition. --- Natural Language Processing. --- TF-IDF frequency. --- Taaltechnologische studie. --- Web People Search. --- Word Sense Disambiguation.
Choose an application
The contributions to this volume investigate relations of cohesion and coherence as well as instantiations of discourse phenomena and their interaction with information structure in multilingual contexts. Some contributions concentrate on procedures to analyze cohesion and coherence from a corpus-linguistic perspective. Others have a particular focus on textual cohesion in parallel corpora that include both originals and translated texts. Additionally, the papers in the volume discuss the nature of cohesion and coherence with implications for human and machine translation. The contributors are experts on discourse phenomena and textuality who address these issues from an empirical perspective. The chapters in this volume are grounded in the latest research making this book useful to both experts of discourse studies and computational linguistics, as well as advanced students with an interest in these disciplines. We hope that this volume will serve as a catalyst to other researchers and will facilitate further advances in the development of cost-effective annotation procedures, the application of statistical techniques for the analysis of linguistic phenomena and the elaboration of new methods for data interpretation in multilingual corpus linguistics and machine translation
E-books --- Cohesie ( tekstlinguïstiek). --- Cohesion (Linguistics). --- Corpus linguistics. --- Machine translating. --- Translating and interpreting. --- Vertaalkunde. --- Vertaalwetenschap. --- Vertalen en corpuslinguïstiek. --- Vertalen en tekstcoherentie. --- Vertalen en tekstlinguïstiek. --- Linguistics --- Philology. --- Computational linguistics. --- Translating and interpreting --- Translating. --- Interpretation and translation --- Interpreting and translating --- Language and languages --- Literature --- Translation and interpretation --- Translators --- Automatic language processing --- Language data processing --- Natural language processing (Linguistics) --- Applied linguistics --- Cross-language information retrieval --- Mathematical linguistics --- Multilingual computing --- Linguistic science --- Science of language --- Translating --- Data processing --- German language. --- German literature --- Yiddish language --- Yiddish language in literature. --- Fiction. --- Usage. --- German Hebrew --- Hebreo-German language --- Jewish language --- Jiddisch language --- Judaeo-German language (Yiddish) --- Judeo-German language (Yiddish) --- Jews --- Ashkenazic German language --- Hochdeutsch --- Judaeo-German language (German) --- Judendeutsch language --- Judeo-German language (German) --- Jüdisch-Deutsch language --- Jüdischdeutsch language --- Germanic languages --- Languages --- human and machine translation --- coherence --- corpus-linguistics --- parallel corpora --- information structure --- discource phenomena --- cohesion --- Coreference --- Grammaticalization --- Invasive species --- Multilingualism --- Part of speech --- Syntax --- Target text
Listing 1 - 4 of 4 |
Sort by
|