Programmeren

Leuk idee! Je zou ook kunnen beginnen met het maken van een wordcloud. Daarvoor moet je dezelfde stappen doen als voor een sentiment analyse. Namelijk de data goed opschonen, verwijderen van stopwoorden, leestekens etc. en zorgen dat het in het goede format staat (elk woord een column met een score). Dat is vaak het meeste werk.

Als het goed is, is er een bestaande Nederlandstalige lijst voor sentiment analyses. Ik kan 'm alleen niet zo snel vinden, misschien dat iemand anders dat weet. Die zou je ook als uitgangspunt kunnen gebruiken, dat scheelt namelijk veel werk. En de veelgebruikte lijsten zijn vaak van goede kwaliteit omdat meerdere mensen ze hebben gecheckt. Wanneer je zelf woorden scoort op ‘positief’ of ‘negatief’ is dat veel subjectiever dan dat veel meer mensen dat zouden doen.

Anders is het ook mogelijk om je eigen woordenlijst te maken en scoren (lexicon heet het, misschien dat je daar wat meer mee kan vinden). Misschien helpt dit je ook: Sentiment Analysis in R with Custom Lexicon Dictionary using tidytext | R-bloggers

Edit:
Ik zag dat datacamp ook een deel heeft over sentiment analyse. Ik heb die zelf niet gedaan, maar misschien is dat ook wat https://www.datacamp.com/courses/sentiment-analysis-in-r

En natuurlijk heel veel succes met het leren van R, uiteindelijk is iedereen een keer begonnen :relaxed:

1 like

Wat een lieve uitgebreide reactie, bedankt! Ik heb je post opgeslagen en ik denk dat ik hier wel wat mee kan. In ieder geval weet ik nu waar ik op kan zoeken dus dat is heel fijn! :blush:

Interessant! Ik heb een aanvullende vraag over het eerste deel if you don’t mind :smiley: Sorry @Sensatie als ik je onderwerp overneem haha. Maar je structureert dan de data per woord als het ware, maar kan je dan ook nog analyseren of bepaalde woorden vaak in combinatie met elkaar worden gebruikt zeg maar? Of als ik wil zeggen ‘in de open vragen hebben mannen het vaak over x en vrouwen over y’, moet je dan gewoon per woord een kolom toevoegen met of dat woord door een man of vrouw getypt was of zo? Mmh ik snap niet zo goed hoe de data eruit moet zien

1 like

Ik weet hier niet heel veel van af hoor, dus misschien is wat ik zeg wel onzin.

Maar wat jij zegt kan wel. Je kan inderdaad selecteren op mannen, dan de analyse doen. Dan selecteren op vrouwen, dan de analyse doen. Of één analyse doen en dan bij de visualiatie een grouping variabele aangeven (dan moet je een variabele sex hebben met vrouw en man). Je kan dan bijv één wordcloud maken waar de meest genoemde woorden worden genoemd voor vrouwen en mannen. Zoiets als dit;


Alleen dan boven vrouwen, onder mannen.

Ik reageer later wat uitgebreider op de andere dingen.

3 likes

Haha geen probleem en goede vraag inderdaad!
Ik dacht dat ik had gezien in een youtubefilmpje dat iemand ging bekijken welke woorden samen werden gebruikt. Ik weet alleen even niet meer of hij dan ook
gesorteerd had op een kolom per woord of dat hij de hele tekst in één kolom had geplaatst. Dus er moet wel een manier zijn om ze in relatie met elkaar te bekijken, maar ik weet nog niet hoe haha dus dat moet ik nog even uitzoeken precies.

1 like

Bijna een jaar later ben ik eindelijk eens begonnen aan C#.
Weet niet of het legaal is dat mensen mij dit laten doen.
Enkel nog een glitterplaatje toevoegen en een warning wanneer de timer klaar is. en dan z’n vies popup ding alsof het psam lijkt uit het limewire tijdperk.
Dan vind ik mijn medicatie countdown wel geslaagd.

7 likes

Iemand ervaring met dataquest?
Ik wil vooral wat leren over SQL.