Narrow your search
Listing 1 - 4 of 4
Sort by

Dissertation
Master thesis : Extending Joint Entity and Event Coreference Resolution across Documents
Authors: --- --- ---
Year: 2022 Publisher: Liège Université de Liège (ULiège)

Loading...
Export citation

Choose an application

Bookmark

Abstract

Detecting corefering events and entities in texts is an important task in NLP, where it plays a role in many other tasks and applications. In this work, we build on a joint approach of entity and event coreference resolution, pioneered by H. Lee, Recasens, et al. 2012 and matured by Barhom et al. 2019 using a neural architecture. In particular we look at coreference resolution across documents, more complicated and less researched than coreference resolution within documents. Using the Barhom et al. 2019’s model, we propose a series of extensions to improve its results. This is done by increasing the amount of information provided to the model, in particular the joint nature of the modelling and by improving entity and event representation with the use of document embedding. As a secondary problem, we investigate ways to improve the model’s time performance through compressing the mention representations. Our results are compared with other works tackling the problem of cross document coreference resolution on the ECB+ dataset, the standard dataset for cross document entity and event coreference resolution.


Book
La coréférence : syntaxe ou sémantique ?
Author:
Year: 1974 Publisher: Paris : Editions du Seuil,

Loading...
Export citation

Choose an application

Bookmark

Abstract


Dissertation
WePS: research on a Dutch corpus using weighted keywords and different clustering methods
Authors: ---
Year: 2008 Publisher: Gent : s.n.,

Loading...
Export citation

Choose an application

Bookmark

Abstract

Doelstelling: Het doel van deze masterproef is verder onderzoek te verrichten omtrent de Web People Search taak, meerbepaald naar de resultaten op een Nederlandstalig corpus. De Web People Search taak (WePS) wil het zoeken naar personen via een online zoekmachine vereenvoudigen. De vraag hiernaar is groot omdat heel veel personen dezelfde naam kunnen delen.Het effect van WePS op een online zoekmachine is het volgende: in plaats van een ongesorteerde mix van webpagina's over verschillende mensen die dezelfde naam delen - waarbij de gebruiker dan één voor één de zoekresultaten moet analyseren - is de output van WePS dan een verzameling van clusters, waarbij elke cluster de webpagina's bevat die gaan over één van de verschillende personen (die aan de zoekterm voldoen). De gebruiker kan dan de cluster van de gezochte persoon aanklikken waarna hij meteen alle relevante pagina's over die persoon ziet. Op deze manier kan de zoektocht naar informatie over een bepaalde persoon op het internet sterk vereenvoudigd worden. Middelen of methode: Voor dit onderzoek stelden we een Nederlandstalig corpus op. Dit corpus bestaat uit de eerste 50 zoekresultaten van de bekende online zoekmachine Google voor twee verschillende query's: "Jan De Cock" en "Jan Peeters". Het corpus bestaat dus in totaal uit 100 webpagina's. Deze werden gefilterd van alle "noise": html tags, java,...Daarna werden via TF-IDF frequency de belangrijkste kernwoorden van elke geëxtraheerd, aan de hand daarvan bouwden we een matrix op dat we konden gebruiken voor de automatische clustering. We evalueren per persoon 6 verschillende clusteringmethodes en bespreken daarvan de resultaten, vergeleken met een manueel geclusterde 'gold standard'. Resultaten: De beste resultaten werden voor beide personen behaald met de 'cosine distance'-metriek. Wat betreft het beste clusteringalgoritme, werden de beste resultaten behaald met 'group average' algoritme. We kunnen besluiten dat de resultaten op een Nederlandstalig corpus matig zijn indien we enkel gebruik maken van kernwoorden. Naar de toekomst toe moet men proberen andere middelen hieraan vast te koppelen die deze resultaten verbeteren, zoals bijvoorbeeld bepaling van locatie via het IP-adres of door meer belang te koppelen aan kernwoorden uit de 'snippets' van de zoekresultaten. Ook combinaties met (verwante) onderzoeksgebieden of taken zoals Named Entity Recognition en Coreference Resolution hebben het potentieel om de resultaten te verbeteren.


Book
New perspectives on cohesion and coherence : Implications for translation
Authors: --- ---
ISBN: 3946234844 3946234720 9783946234722 9783946234845 9783946234807 394623478X 3946234801 3946234798 9783946234791 9783946234784 Year: 2017 Publisher: Berlin :. : Language Science Press,

Loading...
Export citation

Choose an application

Bookmark

Abstract

The contributions to this volume investigate relations of cohesion and coherence as well as instantiations of discourse phenomena and their interaction with information structure in multilingual contexts. Some contributions concentrate on procedures to analyze cohesion and coherence from a corpus-linguistic perspective. Others have a particular focus on textual cohesion in parallel corpora that include both originals and translated texts. Additionally, the papers in the volume discuss the nature of cohesion and coherence with implications for human and machine translation. The contributors are experts on discourse phenomena and textuality who address these issues from an empirical perspective. The chapters in this volume are grounded in the latest research making this book useful to both experts of discourse studies and computational linguistics, as well as advanced students with an interest in these disciplines. We hope that this volume will serve as a catalyst to other researchers and will facilitate further advances in the development of cost-effective annotation procedures, the application of statistical techniques for the analysis of linguistic phenomena and the elaboration of new methods for data interpretation in multilingual corpus linguistics and machine translation

Keywords

E-books --- Cohesie ( tekstlinguïstiek). --- Cohesion (Linguistics). --- Corpus linguistics. --- Machine translating. --- Translating and interpreting. --- Vertaalkunde. --- Vertaalwetenschap. --- Vertalen en corpuslinguïstiek. --- Vertalen en tekstcoherentie. --- Vertalen en tekstlinguïstiek. --- Linguistics --- Philology. --- Computational linguistics. --- Translating and interpreting --- Translating. --- Interpretation and translation --- Interpreting and translating --- Language and languages --- Literature --- Translation and interpretation --- Translators --- Automatic language processing --- Language data processing --- Natural language processing (Linguistics) --- Applied linguistics --- Cross-language information retrieval --- Mathematical linguistics --- Multilingual computing --- Linguistic science --- Science of language --- Translating --- Data processing --- German language. --- German literature --- Yiddish language --- Yiddish language in literature. --- Fiction. --- Usage. --- German Hebrew --- Hebreo-German language --- Jewish language --- Jiddisch language --- Judaeo-German language (Yiddish) --- Judeo-German language (Yiddish) --- Jews --- Ashkenazic German language --- Hochdeutsch --- Judaeo-German language (German) --- Judendeutsch language --- Judeo-German language (German) --- Jüdisch-Deutsch language --- Jüdischdeutsch language --- Germanic languages --- Languages --- human and machine translation --- coherence --- corpus-linguistics --- parallel corpora --- information structure --- discource phenomena --- cohesion --- Coreference --- Grammaticalization --- Invasive species --- Multilingualism --- Part of speech --- Syntax --- Target text

Listing 1 - 4 of 4
Sort by