Programmeren

Het swirl package is een goede, je zou ook een (gratis?) proef abo op datacamp kunnen nemen. Ligt er ook aan wat je precies wil leren, alleen de taal of ook statistiek, visualisatie etc.

1 like

Aangezien ik de vorige keer zo lief geholpen was in dit topic durf ik het hier wel te vragen, ik hoop niet dat jullie mij gaan uitlachen omdat de vraag misschien wat te ambitieus is voor een beginner :joy:
Het leek me leuk om misschien wat met R te doen in mijn scriptie (heeft niks met de opleiding te maken, dus is niet verplicht om hier kennis van te hebben oid). Alleen weet ik nog niet zo goed wat de mogelijkheden zijn aangezien ik pas net een beetje de basis probeer te leren. Heb wel al veel youtubevideos bekeken om een indicatie ervan te krijgen, daarin zag ik bijvoorbeeld dat er een sentimentanalyse gedaan kan worden.

Ik vroeg me af of iemand misschien weet op welke manier je een soortgelijke analyse kan uitvoeren waarbij je zelf de woorden (library) bedenkt die moeten worden geanalyseerd. Dus eigenlijk dat R een dataset gaat beoordelen op de aanwezigheid van bepaalde woorden/woordgroepen en aan de hand daarvan iets zegt over de data. Bijv. Als bepaalde woorden vaak worden gebruikt is dat een indicatie van pesten (totaal random voorbeeld). Ik heb het idee dat dit mogelijk is, maar ik weet niet zo goed in welke hoek ik moet zoeken om hier meer over te lezen en leren hoe het zou moeten. Kan iemand hier mij misschien helpen? Welke zoektermen kan ik hiervoor gebruiken of aanraders voor video’s/boeken/etc. Of misschien zelfs wel het advies dat ik beter dit hele plan overboord kan gooien :joy:
Misschien wordt het ook helemaal niks, maar het leek me een leuke manier om wat meer van R te leren in de praktijk.

Leuk idee! Je zou ook kunnen beginnen met het maken van een wordcloud. Daarvoor moet je dezelfde stappen doen als voor een sentiment analyse. Namelijk de data goed opschonen, verwijderen van stopwoorden, leestekens etc. en zorgen dat het in het goede format staat (elk woord een column met een score). Dat is vaak het meeste werk.

Als het goed is, is er een bestaande Nederlandstalige lijst voor sentiment analyses. Ik kan 'm alleen niet zo snel vinden, misschien dat iemand anders dat weet. Die zou je ook als uitgangspunt kunnen gebruiken, dat scheelt namelijk veel werk. En de veelgebruikte lijsten zijn vaak van goede kwaliteit omdat meerdere mensen ze hebben gecheckt. Wanneer je zelf woorden scoort op ‘positief’ of ‘negatief’ is dat veel subjectiever dan dat veel meer mensen dat zouden doen.

Anders is het ook mogelijk om je eigen woordenlijst te maken en scoren (lexicon heet het, misschien dat je daar wat meer mee kan vinden). Misschien helpt dit je ook: Sentiment Analysis in R with Custom Lexicon Dictionary using tidytext | R-bloggers

Edit:
Ik zag dat datacamp ook een deel heeft over sentiment analyse. Ik heb die zelf niet gedaan, maar misschien is dat ook wat https://www.datacamp.com/courses/sentiment-analysis-in-r

En natuurlijk heel veel succes met het leren van R, uiteindelijk is iedereen een keer begonnen :relaxed:

1 like

Wat een lieve uitgebreide reactie, bedankt! Ik heb je post opgeslagen en ik denk dat ik hier wel wat mee kan. In ieder geval weet ik nu waar ik op kan zoeken dus dat is heel fijn! :blush:

Interessant! Ik heb een aanvullende vraag over het eerste deel if you don’t mind :smiley: Sorry @Sensatie als ik je onderwerp overneem haha. Maar je structureert dan de data per woord als het ware, maar kan je dan ook nog analyseren of bepaalde woorden vaak in combinatie met elkaar worden gebruikt zeg maar? Of als ik wil zeggen ‘in de open vragen hebben mannen het vaak over x en vrouwen over y’, moet je dan gewoon per woord een kolom toevoegen met of dat woord door een man of vrouw getypt was of zo? Mmh ik snap niet zo goed hoe de data eruit moet zien

1 like

Ik weet hier niet heel veel van af hoor, dus misschien is wat ik zeg wel onzin.

Maar wat jij zegt kan wel. Je kan inderdaad selecteren op mannen, dan de analyse doen. Dan selecteren op vrouwen, dan de analyse doen. Of één analyse doen en dan bij de visualiatie een grouping variabele aangeven (dan moet je een variabele sex hebben met vrouw en man). Je kan dan bijv één wordcloud maken waar de meest genoemde woorden worden genoemd voor vrouwen en mannen. Zoiets als dit;


Alleen dan boven vrouwen, onder mannen.

Ik reageer later wat uitgebreider op de andere dingen.

3 likes

Haha geen probleem en goede vraag inderdaad!
Ik dacht dat ik had gezien in een youtubefilmpje dat iemand ging bekijken welke woorden samen werden gebruikt. Ik weet alleen even niet meer of hij dan ook
gesorteerd had op een kolom per woord of dat hij de hele tekst in één kolom had geplaatst. Dus er moet wel een manier zijn om ze in relatie met elkaar te bekijken, maar ik weet nog niet hoe haha dus dat moet ik nog even uitzoeken precies.

1 like

Bijna een jaar later ben ik eindelijk eens begonnen aan C#.
Weet niet of het legaal is dat mensen mij dit laten doen.
Enkel nog een glitterplaatje toevoegen en een warning wanneer de timer klaar is. en dan z’n vies popup ding alsof het psam lijkt uit het limewire tijdperk.
Dan vind ik mijn medicatie countdown wel geslaagd.

7 likes

Iemand ervaring met dataquest?
Ik wil vooral wat leren over SQL.