Narrow your search

Library

KBC (2)

UGent (1)


Resource type

book (2)

dissertation (1)


Language

German (2)

English (1)


Year
From To Submit

2021 (1)

2017 (1)

2011 (1)

Listing 1 - 3 of 3
Sort by

Dissertation
Classification-based normalization of noisy text and its effect on the automatic filtering of suicidal messages
Authors: --- ---
Year: 2011 Publisher: Gent : s.n.,

Loading...
Export citation

Choose an application

Bookmark

Abstract

Doelstelling: Het doel van deze studie was om een algemene literatuurstudie over sentiment analyse te presenteren en meerbepaald over twee bekende knelpunten: de normalisatie van vervuilde tekst en het aanpassen van subjectiveitslexicons aan een bepaald domein. Middelen of methode: Er werd gebruik gemaakt van drie subjectiviteitslexicons om experimenten mee uit te voeren: (1) een algemeen Nederlandstalig lexicon opgesteld door Jijkoun en Hofmann (2009); (2) een aan het domein aangepast zelfmoordlexicon; (3) het algemeen Nederlandstalig lexicon samengevoegd met het zelfmoordlexicon. Er werd nagegaan hoeveel woorden de verschillende subjectiviteitslexicons konden detecteren in een training set van 300 blogberichten. Daarbij werd gebruik gemaakt van twee versies van de 300 blogberichten: een originele, vervuilde versie en een manueel genormaliseerde versie. Resultaten: Bij het vergelijken van de genormaliseerde en de vervuilde versie, viel er slechts een kleine verbetering waar te nemen door de verschillende lexicons op de genormaliseerde versie van de data. De normalisatie heeft bijgevolg weinig uitgehaald. Een mogelijke verklaring is dat de veranderingen die werden aangebracht geen grote lexicale waarde bevatten en dus weinig baat hebben bij een lexicon-gebaseerde aanpak. Bij het nagaan van hoe goed de verschillende lexicons in staat waren om suïcidale berichten op te sporen, bleek dat het zelfmoordlexicon de beste resultaten behaalde. Op de vervuilde data slaagde het zelfmoordlexicon erin om 91.6% van de berichten correct te bestempelen, terwijl het algemeen Nederlandstalig lexicon en het samengevoegd lexicon een score haalden van respectievelijk 87.6% en 91%. De lexicons haalden bijna volledig dezelfde resultaten op de genormaliseerde data als op de vervuilde data. Deze scores zouden nog verbeterd kunnen worden als het zelfmoordlexicon zou worden uitgebreid.


Book
Data Science mit Python : Das Handbuch für den Einsatz von IPython, Jupyter, NumPy, Pandas, Matplotlib und Scikit-Learn.
Author:
ISBN: 3958456960 Year: 2017 Publisher: Frechen : mitp,

Loading...
Export citation

Choose an application

Bookmark

Abstract

Long description: Die wichtigsten Tools für die Datenanalyse und-bearbeitung im praktischen Einsatz Python effizient für datenintensive Berechnungen einsetzen mit IPython und Jupyter Laden, Speichern und Bearbeiten von Daten und numerischen Arrays mit NumPy und Pandas Visualisierung von Daten mit Matplotlib Python ist für viele die erste Wahl für Data Science, weil eine Vielzahl von Ressourcen und Bibliotheken zum Speichern, Bearbeiten und Auswerten von Daten verfügbar ist. In diesem Buch erläutert der Autor den Einsatz der wichtigsten Tools. Für Datenanalytiker und Wissenschaftler ist dieses umfassende Handbuch von unschätzbarem Wert für jede Art von Berechnung mit Python sowie bei der Erledigung alltäglicher Aufgaben. Dazu gehören das Bearbeiten, Umwandeln und Bereinigen von Daten, die Visualisierung verschiedener Datentypen und die Nutzung von Daten zum Erstellen von Statistiken oder Machine-Learning-Modellen. Dieses Handbuch erläutert die Verwendung der folgenden Tools: IPython und Jupyter für datenintensive Berechnungen NumPy und Pandas zum effizienten Speichern und Bearbeiten von Daten und Datenarrays in Python Matplotlib für vielfältige Möglichkeiten der Visualisierung von Daten Scikit-Learn zur effizienten und sauberen Implementierung der wichtigsten und am meisten verbreiteten Algorithmen des Machine Learnings Der Autor zeigt Ihnen, wie Sie die zum Betreiben von Data Science verfügbaren Pakete nutzen, um Daten effektiv zu speichern, zu handhaben und Einblick in diese Daten zu gewinnen. Grundlegende Kenntnisse in Python werden dabei vorausgesetzt. Leserstimme zum Buch: »Wenn Sie Data Science mit Python betreiben möchten, ist dieses Buch ein hervorragender Ausgangspunkt. Ich habe es sehr erfolgreich beim Unterrichten von Informatik- und Statistikstudenten eingesetzt. Jake geht weit über die Grundlagen der Open-Source-Tools hinaus und erläutert die grundlegenden Konzepte, Vorgehensweisen und Abstraktionen in klarer Sprache und mit verständlichen Erklärungen.« – Brian Granger, Physikprofessor, California Polytechnic State University, Mitbegründer des Jupyter-Projekts Biographical note: Jake VanderPlas ist seit Langem User und Entwickler von SciPy. Derzeit ist er als interdisziplinärer Forschungsdirektor an der Universität Washington tätig, führt eigene astronomische Forschungsarbeiten durch und berät dort ansässige Wissenschaftler, die in vielen verschiedenen Fachgebieten arbeiten.


Book
Machine Learning mit Python und Keras, TensorFlow 2 und Scikit-learn : Das umfassende Praxis-Handbuch für Data Science, Deep Learning und Predictive Analytics.
Authors: ---
ISBN: 3747502148 Year: 2021 Publisher: Frechen : mitp,

Loading...
Export citation

Choose an application

Bookmark

Abstract

Long description: Biographical note:

Listing 1 - 3 of 3
Sort by