arrow_drop_up arrow_drop_down
Natural Language Processing (NLP)
4 oktober 2020 

Natural Language Processing (NLP)

Ieder mens spreekt een taal. Ieder mens doet dit op een natuurlijke wijze. Maar wat voor veel mensen heel natuurlijk is, is bijzonder lastig voor computers. Door de hoeveelheid ongestructureerde data, hebben computers gebrek aan formele regels en ontbreekt er context en intentie. Natural Language Processing (NLP, letterlijk natuurlijke taalverwerking) kan hierin een uitkomst bieden.

Wat is NLP?

Natural Language Processing gaat simpel gezegd om het analyseren van natuurlijke taal met behulp van computers. Het is een deelgebied van taalkunde, informatica en kunstmatige intelligentie dat zich bezighoudt met de interacties tussen computers en menselijke taal.

Met deze interacties worden computers geprogrammeerd om grote hoeveelheden natuurlijke taalgegevens te verwerken en te analyseren. Je zou kunnen stellen dat de natuurlijke taalverwerking zich uiteindelijk ten doel stelt de menselijke taalvaardigheid zo goed mogelijk na te bootsen met behulp van een computer.

Wellicht lijkt het nu alsof je in een slecht Sci-Fi film terecht bent gekomen. Echter zijn er al eenvoudige voorbeelden van NLP te vinden in ons dagelijks leven. Een aantal voorbeelden:

1. Ongewenste uitingen

NLP begon met filters voor ongewenste mail door op bepaalde woorden en zinnen te zoeken die duiden op een ongewenst bericht. Gmail herkent tegenwoordig op basis van de inhoud of een e-mail in een van de drie categorieën thuishoort: primair, sociaal en reclame. Hierdoor krijg je als gebruiker een beter overzicht.
Een ander voorbeeld is het gebruik van filters op websites. Scholen gebruiken bijvoorbeeld filters zodat websites met bepaalde zoekwoorden worden geblokkeerd voor kinderen.

2. Chatbots

Dankzij natuurlijke taalverwerking kunnen chatbots ongestructureerde menselijke taal begrijpen. Chatbots houden rekening met de context van een vraag. Hierdoor kunnen ze zelfs verborgen of impliciete boodschappen begrijpen en complexe zinnen met veel informatie verwerken. Exacte trefwoorden zijn dus niet nodig. Bovendien kunnen ze informatie uit voorgaande vragen onthouden om een gesprek natuurlijk te laten verlopen. Chatbots helpen hiermee bedrijven bij het bereiken van het doel van een ultieme klantervaring.

3. Zoekresultaten

We kunnen wel stellen dat je 9 van de 10 keer kan vinden wat je zoekt via Google. Dit komt omdat zoekmachines zoals Google natuurlijke taalverwerking gebruiken om relevante zoekresultaten op te halen. Dit komt omdat die zoekmachines kijken naar een groter geheel. Dit kunnen bijvoorbeeld jouw eerdere zoekopdrachten zijn. Hierdoor proberen die zoekmachines te achterhalen wat jij probeert te zeggen in plaats van de exacte zoektermen te volgen. Ieder persoon zal daarom ook andere zoekresultaten ontvangen.

4. Vertaling

Heb jij ook gemerkt dat Google Vertalen veel beter werkt dan een aantal jaren terug? Dat komt omdat door middel van natuurlijke taalverwerking online vertaalprogramma's accurater vertalen. Dat is uiteraard enorm handig voor internationale rapporten, zakenrelaties, etc.

5. Data-analyse

Tegenwoordig zijn data overal. Dit komt doordat technologische ontwikkelingen hebben geleid tot een toename van de hoeveelheid beschikbare data. Zo zijn bedrijven nu in staat om tekstuele data in hun voordeel te gebruiken. Zonder twijfel is schriftelijke informatie een gegevensbron van onschatbare waarde. Bedrijven gebruiken al jaren recensies, productbeschrijvingen, klachten en meer om de besluitvorming te verbeteren. Een voorbeeld hiervan is slimmere visuele codering. Dat levert meer kansen op voor mensen om hun data met natuurlijke taalgebruik te verkennen en een betekenis aan toe te kennen.

Voorbeeld analyseren van klantrecensies van AirBnB

Als een eigen praktijkvoorbeeld van NLP hebben wij een open data set gebruikt van AirBnB. Bij dit voorbeeld werden actuele klantrecensies gemonitord van bezoekers van Amsterdam. Het doel hiervan is het verbeteren van de service voor een betere klantervaring. Dit hebben wij gedaan door onderwerpen te ontdekken die door bezoekers van AirBnB werden besproken met de bijbehorende emotie. Hierdoor hebben we kunnen onderscheiden welke factoren het belangrijkst zijn om concurrentievoordeel te behalen. Dit is vooral handig voor bedrijven die door de bomen het bos niet meer zien door de hoeveelheid klantrecensies. Hieronder staat beschreven hoe we dit hebben aangepakt:

Allereerst moesten we de recensies classificeren. Dit kan worden gedaan door middel van tekstclassificatietechnieken. Daarnaast hebben wij een nieuw classificatiemodel opgesteld die verschillende kenmerken onderscheid. Hiervoor hebben we eerst een dataset gebouwd met gelabelde reviews in het AirBnB-domein. In deze dataset hebben we recensies gefilterd die aan de volgende criteria voldeden: geschreven in het Engels, 25-500 tekens en negatief (<6) of positief (> 8). Dit resulteerde in 324.574 positieve recensies en 92.507 negatieve recensies. De zinnen in de recensies zijn vervolgens gezuiverd.

Verder hebben we de meest terugkerende onderwerpen moesten bedenken die voorkwamen in negatieve recensies van bezoekers in Amsterdam. Er zijn verschillende technieken om de meest relevante onderwerpen te vinden. De meest populaire zijn:

• Latent Semantic Analysis (LSA)
• Latent Dirichlet Allocation (LDA)
• Biterm Topic Model (BTM)

Ook zijn er matrixen gebruikt voor het loggen van de frequentie van termen in elk document. Als laatst zijn de meest relevante onderwerpen verkregen. Deze resultaten lieten ons zien dat de belangrijkste zaken voor AirBnB-gasten in Amsterdam die negatieve recensies schreven, zijn:

1. Te late annulering door de gastheren.
2. Omgaan met steile en smalle trappen.
3. Vervuiling van het appartement/ huis.
4. Veel lawaai 's nachts (vooral in het stadscentrum).

Toepassing van NLP in jouw bedrijf

Steeds meer bedrijven en branches maken gebruik van Natural Language Processing. Het maakt ons leven een stuk makkelijker. Daarnaast leidt het tot waardevolle inzichten waaraan we uitgebreide actieplannen kunnen koppelen.

Gezien de enorme aantal tools, middelen en variabiliteit in resultaten is het echter soms moeilijk om NLP in te zetten. Hiervoor moet bepaald worden wat de beste manier is om ruwe data om te zetten in een effectieve en inzetbare commerciële strategie. Wil jij hierbij ondersteuning of gewoon eens sparren over de mogelijkheden? Neem dan contact met ons op.

Vul het onderstaande formulier in voor een terugbelverzoek.

Over de schrijver
Tijdens haar opleiding Commerciële Economie aan Avans Hogeschool heeft Adrine gemerkt dat de online wereld snel verandert. Na een eerste ervaring als SEO-specialist bij een online marketingbureau heeft ze haar plek in data driven marketing gevonden. Adrine krijgt er energie van als ze kennis en inzichten kan omzetten in klinkende resultaten. Het mooie van data is dat het je beslissingen onderweg kan helpen en je een kijkje krijgt op de toekomst. Naast werk houdt Adrine van lekkere drankjes en dansjes. En dat het liefst op vakantie.
Reactie plaatsen

Mogen we cookies gebruiken?