In welke mate kan machine learning gebruikt worden om tekst te classificeren?
In welke mate kan machine learning gebruikt worden om tekst te classificeren?
Samenvatting
Tijdens het onderzoek is een oplossing gezocht waarmee tekst geclassificeerd kan worden. Dit met het doel informatie uit teksten te halen. Hiervoor is gezocht naar een machine learning oplossing binnen het vakgebied van Natural Language Processing (NLP).
Deelvraag 1 Voor de eerste deelvraag is deskresearch gedaan naar het onderwerp door te zoeken naar machine-learning algoritmes. De algoritmes die gevonden zijn vormen het antwoord op deze deelvraag. Dit zijn Long Short-Term Memory (LSTM), Convolutional Neural Network (CNN), Memory Augmented Neural Network (MANN), Hierarchical Attention Network (HAN) en Naïve Bayes.
Deelvraag 2 De tweede deelvraag ging over het verkrijgen van requirements. Dit is volgen een natuurlijk proces in twee fasen verlopen. De eerste fase bestond uit het houden van een voorbereid interview. In de tweede fase zijn de requirements nog eens doorgenomen en zijn deze verbeterd en aangepast aan veranderde omstandigheden. De requirements die daar uit volgden zijn een antwoord op de deelvraag. Deze requirements zijn te vinden in bijlage C.
Deelvraag 3 De resultaten van de eerste twee deelvragen kwamen bij elkaar in deelvraag 3. Om een antwoord te geven op deze deelvraag moesten de gevonden algoritmes immers gemeten worden aan de hand van de requirements. Tijdens deze deelvraag is besloten niet één van de gevonden algoritmes te implementeren, maar een nieuw algoritme/systeem te ontwikkelen. Dat was nodig om aan meer requirements te kunnen voldoen.
Deelvraag 4 Het systeem dat in deelvraag 3 is uitgewerkt te implementeren in een prototype. Hiervoor is een technisch ontwerp gemaakt en geïmplementeerd in Python.
Na het trainen met crops en pests uit 297 gebruiksvoorschiften van gewasbestrijdingsmiddelen kon het ontwikkelde systeem 96.3% correct classificeren.
Organisatie | HZ University of Applied Sciences |
Opleiding | HBO-ICT |
Afdeling | Domein Technology, Water & Environment |
Partner | Profects, Kapelle |
Datum | 2017-10-26 |
Type | Bachelor |
Taal | Nederlands |