Sentimentanalyse - Excel-tip

Sentimentanalyse i Excel! Der er en gratis tilføjelse fra Microsoft Labs, der giver dig mulighed for at lave sentimentanalyse i Excel. Hvad hvis du skal vade gennem hundreder af undersøgelseskommentarer for at se, hvad folk synes om din virksomhed? Excel kan tildele en sandsynlighed, der viser, hvor positiv eller negativ hver kommentar er.

Se video

  • Det er let at kvantificere undersøgelsesdata, når det er multiple choice
  • Du kan bruge en pivottabel til at finde ud af, hvor stor en procentdel hvert svar har
  • Men hvad med svarene i fri form? Disse er svære at behandle, hvis du har hundreder eller tusinder af dem.
  • Sentimentanalyse er en maskinbaseret metode til at forudsige, om et svar er positivt eller negativt.
  • Microsoft tilbyder et værktøj, der udfører sentimentanalyse i Excel - Azure Machine Learning.
  • Traditionel sentimentanalyse kræver, at et menneske analyserer og kategoriserer 5% af udsagnene.
  • Traditionel sentimentanalyse er ikke fleksibel - du vil genopbygge ordbogen for hver branche.
  • Excel bruger MPQA subjektivitetsleksikon (læs om det på http: // bit. Ly / 1SRNevt)
  • Denne generiske ordbog indeholder 5.097 negative og 2.533 positive ord
  • Hvert ord tildeles en stærk eller svag polaritet
  • Dette fungerer godt til korte sætninger, såsom tweets eller Facebook-indlæg
  • Det kan blive narret af dobbeltnegativer
  • For at installere skal du gå til Indsæt, Excel Store, søge efter Azure Machine Learning
  • Angiv et inputområde og to tomme kolonner for outputområdet.
  • Overskriften for inputområdet skal matche skemaet: tweet_text
  • Ledsagerartikel på: http://sfmagazine.com/post-entry/may-2016-excel-sentiment-analysis/

Videoudskrift

Lær Excel fra Podcast, afsnit 2062: Sentimentanalyse i Excel

Åh hej, det var en Thanksgiving-aften, og vi sad rundt om græskarstærken, og Jes, vores ven, begyndte at tale om at lave sentimentanalyse på Twitter-data. Og jeg sagde: "Hej, du ved, at Excel har en måde at lave sentimentanalyse på." Og jeg indså, at jeg ikke havde en god video på denne eller nogen video om dette, så denne video handler om at lave sentimentanalyse i Excel.

Nu er det første spørgsmål, hvad der er sentimentanalyse? Og hvis du foretager en undersøgelse af dine kunder, og de har et valg med flere valg, hvor de kan vælge fra 1 til 5, så er det virkelig, virkelig let at analysere. Du kan bare oprette en lille pivottabel: Indsæt pivottabel, Eksisterende regneark lige her, klik på OK. Vi vil vide spørgsmålet der eller svaret på spørgsmålet, og hvor mange svar der var på hver enkelt, og det giver os det absolutte antal. Du kan endda komme ind her og ændre dette fra feltindstillinger til Vis værdier som en% af kolonnens samlede, sådan.

Okay, så du kan se for hvert svar, hvor stor en procentdel af befolkningen der får svar. Okay, men følelsesanalyse er, når du har et rigtig langt svar, hvor du siger: "Hej, okay, ved du det, fortæl os hvorfor du gav os det svar?" Og de, du ved, bruger sætninger eller afsnit. Hvis du har hundreder eller tusinder af disse, er det meget svært for nogen at gennemgå det og læse dem alle og finde ud af, hvad der foregår, okay?

Så der er to forskellige slags sentimentanalyser. Tidligere vil du typisk bruge en menneskelig overvåget læringsalgoritme. Så hvis du havde 5.000 svar, gå igennem, ved du, 200 af dem og vælg de positive og negative ord og sætninger. Du bygger i det væsentlige en ordbog med de positive og negative ord; men du ved, dette var meget begrænsende. Hvis du gjorde dette for et sted, der reparerede bil og derefter havde en anden kunde, ved du, der lavede tæpperensning, de to ordbøger er helt forskellige. Du er nødt til at gøre maskinindlæringen eller den menneskelige overvågede læring igen og igen og igen. Så Excel bruger denne ting kaldet MPQA-subjektivitetsleksikonet, og du kan gå på Google dette. Det har info om det - 5.097 negative ord, 2533 positive ord. Også,det fungerer godt til korte sætninger eller tweets eller Facebook-indlæg. Men en ting, jeg har bemærket, er at hvis nogen skriver i dobbeltnegativer, kan jeg ikke sige, at jeg ikke hader denne funktion, ja, maskinindlæringen vil mislykkes der. Og pokker, jeg fejler. Jeg kan ikke se, om de er glade eller ej.

Okay, så her er hvad vi gør. I Excel 2013 eller Excel 2016 skal du gå til fanen Indsæt, gå til Store, når søgefeltet kommer op, søg efter Azure Machine, og du får Azure Machine Learning lige der. Vi klikker på Tilføj. Okay, og to forskellige værktøjer herude: Titanic Survivor Predictor, hvilket er sjovt; og Excel-tilføjelsesprogrammet Text Sentiment. Lad os bruge den ene. Okay, her er et par ting, der får dig op. Din overskrift: Tag et afsnit for at forklare dit svar. Det skal matche skemaet, og skemaet siger, at overskriften skal sige tweet_text. Så her oppe: tweet_text, selvfølgelig, store og små bogstaver, okay. Og luk derefter skemaet, og forudsig derefter, Input: A1 til 100, Mine data har overskrifter, Output: DataB1, Inkluder overskrifterne. De giver os to kolonner.Sørg for, at du har 2 tomme kolonner der; ellers vil det tilsidesætte dataene. Du har 2 valg: Et par rækker ad gangen eller Som en batch. Dette er bare hundrede, så det betyder virkelig ikke noget. Jeg vælger Forudsig og BAM! Bare så hurtigt.

Okay nu, vi får to kolonner: vi får en stemning og en score, okay. Så lad os repræsentere scoringerne her som procentdele med en række decimaler. Okay, så 47.496, dette går fra 0 til 100%. Tæt på 100 er ekstremt positiv, tæt på 0 er ekstremt negativ, okay? Så her har vi en, hvor der er et mindre problem, gør mig skør. Kan ikke finde løsningen, så du kan se, hvorfor det bliver bedømt som ekstremt negativt. Lad os se på en, der kommer op meget positiv. Okay, så du ved det, så vi har nogle glade ord her: tak og tak, udråbstegn og så videre. Det kan bidrage til den høje score. Okay, så er det perfekt? Nej, men det giver dig en hurtig, hurtig måde at fortælle dig, du ved, hvor mange mennesker der er ekstremt glade eller ekstremt negative over for disse svar.

Og selvfølgelig, her, her kan vi gøre dette med en pivottabel: Indsæt, pivottabel, gå til et eksisterende regneark lige her, klik på OK, og vi er interesserede i følelsen, og måske med den gennemsnitlige score er for hver af dem. Så vi ændrer dette under feltindstillinger for at være et gennemsnit, klik på OK. Og så, eller måske endda en grev. Jeg antager, at vi gerne vil vide greven, hvor mange mennesker. Så vi tager et andet felt, og så ved vi, hvor mange mennesker der var negative. Ooh, hvor mange mennesker var neutrale, hvor mange mennesker var positive, og hvad den gennemsnitlige score for hver af disse var.

Okay, så hvis du har undersøgelsesdata, og det er flere valg, er det let at bruge en drejetabel for at finde ud af, hvor stor en procentdel hvert svar har. Men for svar på fri form tekst er det svært at behandle. Hvis du har hundreder eller tusinder af dem, er sentimentanalyse en maskinbaseret metode til at forudsige, om et svar er positivt eller negativt. Microsoft tilbyder et gratis værktøj til dette. Fungerer i Excel 2013 eller Excel 2016, kaldet Azure Machine Learning. Normalt skal man gennemgå og kategorisere 5% af udsagnene manuelt i hånden. Det er ikke fleksibelt, du skal omkategorisere for hvert nye datasæt, men Excel bruger dette MPQA-subjektivitetsleksikon. Det er en generisk ordbog. Det fungerer for korte sætninger, tweets, Facebook-indlæg. Jeg kan narre af dobbeltnegativer. Så bare gå til Excel Store,søg efter Azure Machine Learning. Angiv et input og to kolonner for et outputområde. Glem ikke at ændre overskriften for at matche skemaet, tweet_text, i dette særlige tilfælde.

Okay, så der går du. Næste gang du har en stor mængde data til at analysere, skal du tjekke ud ved hjælp af Azure Machine Learning, den gratis tilføjelse til Excel 2013. Tak for din tur forbi, vi ses næste gang til en anden netcast fra.

Download fil

Download eksempelfilen her: Podcast2062.xlsm

Interessante artikler...