Analiza osjećaja u Excelu! Postoji besplatni dodatak tvrtke Microsoft Labs koji će vam omogućiti analizu osjećaja u programu Excel. Što ako morate probiti stotine komentara na anketu kako biste vidjeli što ljudi misle o vašoj tvrtki? Excel može dodijeliti vjerojatnost koja pokazuje koliko je svaki komentar pozitivan ili negativan.
Gledaj video
- Lako je kvantificirati podatke ankete kada se radi o višestrukom izboru
- Pomoću zaokretne tablice možete utvrditi koliki postotak ima svaki odgovor
- Ali što je s odgovorima na tekst u slobodnoj formi? Teško ih je obraditi ako ih imate stotine ili tisuće.
- Analiza sentimenta je strojna metoda za predviđanje je li odgovor pozitivan ili negativan.
- Microsoft nudi alat koji vrši analizu raspoloženja u programu Excel - Azure Machine Learning.
- Tradicionalna analiza osjećaja zahtijeva da čovjek analizira i kategorizira 5% izjava.
- Tradicionalna analiza osjećaja nije fleksibilna - obnovit ćete rječnik za svaku industriju.
- Excel koristi MPQA Subjektivnost Leksikon (o tome pročitajte na http: // bit. Ly / 1SRNevt)
- Ovaj generički rječnik uključuje 5.097 negativnih i 2.533 pozitivnih riječi
- Svakoj riječi dodijeljen je jak ili slab polaritet
- Ovo izvrsno funkcionira za kratke rečenice, poput tweetova ili postova na Facebooku
- Mogu se prevariti dvostrukim negativima
- Da biste instalirali, idite na Insert, Excel Store, potražite Azure Machine Learning
- Navedite raspon unosa i dva prazna stupca za raspon izlaza.
- Naslov za raspon unosa mora odgovarati shemi: tweet_text
- Popratni članak na: http://sfmagazine.com/post-entry/may-2016-excel-sentiment-analysis/
Prijepis videozapisa
Naučite Excel iz Podcasta, epizoda 2062: Analiza osjećaja u Excelu
O, hej, bila je noć Dana zahvalnosti, a mi smo sjedili oko pite od buče i Jes, naš prijatelj, počeo je razgovarati o analizi osjećaja na podacima na Twitteru. I rekao sam, "Hej, znaš da Excel ima način za analizu osjećaja." Shvatio sam da nisam imao dobar videozapis o ovome ili bilo koji videozapis o ovome, pa je ovaj video o analizi sentimenta u Excelu.
Sad je prvo pitanje, koji je vrag analiza osjećaja? A ako napravite anketu o svojim kupcima i oni imaju višestruki izbor, gdje mogu birati između 1 i 5, to je jako lako analizirati. Možete samo stvoriti malu zaokretnu tablicu: Umetnite zaokretnu tablicu, Postojeći radni list ovdje, kliknite U redu. Želimo znati tamošnje pitanje ili odgovor na pitanje, a zatim koliko je odgovora bilo za svako, a to nam daje apsolutni broj. Možete čak ući ovdje i promijeniti to iz Postavke polja u Prikazivanje vrijednosti kao% ukupnog stupca, poput toga.
U redu, tako da možete vidjeti za svaki odgovor koliki postotak ljudi dobiva odgovor. U redu, ali analiza osjećaja je za slučaj kada imate jako dug odgovor gdje kažete: "Hej, dobro, dobro, znaš, reci nam zašto si nam dao taj odgovor?" A oni, znate, koriste rečenice ili odlomke. Pa, ako ih imate stotine ili tisuće, vrlo je teško nekome to proći i pročitati ih sve i shvatiti što se događa, u redu?
Dakle, postoje dvije različite vrste analize osjećaja. U prošlosti biste obično koristili algoritam učenja pod nadzorom čovjeka. Dakle, ako ste imali 5000 odgovora, prođite, znate, 200 od njih i odaberite pozitivne i negativne riječi i fraze. U osnovi gradite rječnik pozitivnih i negativnih riječi; ali, znate, ovo je bilo vrlo ograničavajuće. Ako ste to učinili za mjesto koje je obavljalo popravke automobila, a zatim ste imali drugog kupca, znate, tko je radio čišćenje tepiha, ta su se dva rječnika potpuno različita. Strojno učenje ili učenje pod nadzorom čovjeka morate izvoditi iznova i iznova. Dakle, Excel koristi ovu stvar koja se zove MPQA Subjektivni leksikon i to možete potražiti na Googleu. O tome ima informacija - 5.097 negativnih riječi, 2533 pozitivnih riječi. I tako,izvrsno funkcionira za kratke rečenice ili tweetove ili objave na Facebooku. Ali jedno sam primijetio da ako netko piše u dvostrukim negativima, ne mogu reći da ne mrzim ovu značajku, pa, tamo će zakazati strojno učenje. I dovraga, ne uspijevam. Ne mogu znati jesu li sretni ili ne.
U redu, pa evo što radimo. U programu Excel 2013 ili Excel 2016 idite na karticu Umetanje, idite u Trgovinu, kada se okvir za pretraživanje otvori za pretragu Azure Machine i tamo ćete dobiti Azure Machine Learning. Kliknemo Dodaj. U redu, i ovdje postoje dva različita alata: Titanic Survivor Predictor, koji je zabavan; i, dodatak za Excel Text Sentiment za analizu. Iskoristimo onu. U redu, evo nekoliko stvari koje će vas spotaknuti. Vaš naslov: Uzmite odlomak kako biste objasnili svoj odgovor. Treba se podudarati sa shemom, a shema kaže da naslov mora reći tweet_text. Dakle, ovdje gore: tweet_text, naravno, velika i mala slova, u redu. A zatim zatvorite Shemu, a zatim Predvidi, Ulaz: A1 do 100, Moji podaci imaju zaglavlja, Izlaz: DataB1, Uključi zaglavlja. Dat će nam 2 stupca.Obavezno imajte 2 prazna stupca; u suprotnom, poništit će podatke. Imate 2 mogućnosti: nekoliko redova istodobno ili kao paket. Ovo je samo stotinak, tako da stvarno nije važno. Ja ću odabrati Predviđanje i BAM! Baš tako brzo.
U redu, sada dobivamo 2 stupca: dobivamo sentiment i rezultat, u redu. Dakle, predstavimo rezultate ovdje kao postotke s hrpom decimala. U redu, dakle 47.496, to ide od 0 do 100%. Blizu 100 je izuzetno pozitivno, blizu 0 je krajnje negativno, u redu? Pa, evo, imamo jedan kod kojeg postoji manji problem, izluđuje me. Ne možete pronaći rješenje, pa možete vidjeti zašto je to ocijenjeno izuzetno negativnim. Pogledajmo jednu koja se pojavila izuzetno pozitivno. Dobro, tako da znate, zato ovdje imamo nekoliko sretnih riječi: molim vas i hvala vam, uskličnici i tako dalje. To bi moglo pridonijeti visokom rezultatu. Dobro, je li savršeno? Ne, ali dat će vam brz, brz način da vam kažem, znate, koliko je ljudi izuzetno sretnih ili krajnje negativnih u vezi s tim odgovorima.
I naravno, opet, ovdje to možemo učiniti sa zaokretnom tablicom: Umetni, zaokretna tablica, idite na postojeći radni list upravo ovdje, kliknite U redu i zanima nas Sentiment, a onda je možda sa prosječnom ocjenom za svaki od tih. Dakle, promijenit ćemo ovo u Postavkama polja u Prosjek, kliknite U redu. I tako, ili možda čak i grof. Pretpostavljam da bismo željeli znati grofa, koliko ljudi. Pa ćemo uzeti neko drugo polje, i tako, znamo koliko je ljudi bilo negativno. Ooh, koliko je ljudi bilo neutralno, koliko je bilo pozitivnih i koliki je bio prosječni rezultat svakog od njih.
U redu, pa ako imate podatke ankete i ako je riječ o višestrukom izboru, jednostavna je upotreba zaokretne tablice za utvrđivanje postotka svakog odgovora. Ali za tekstualne odgovore u slobodnoj formi teško je obraditi. Ako ih imate stotine ili tisuće, analiza osjećaja strojna je metoda za predviđanje je li odgovor pozitivan ili negativan. Microsoft za to nudi besplatan alat. Radi u programu Excel 2013 ili Excel 2016, nazvano Azure Machine Learning. Obično moraju ručno proći i kategorizirati 5% izjava. Nije fleksibilan, morate prekategorizirati svaki novi skup podataka, ali Excel koristi ovaj Leksikon subjektivnosti MPQA. To je generički rječnik. To će uspjeti za kratke rečenice, tweetove, objave na Facebooku. Mogu se prevariti dvostrukim negativima. Samo idite u Excel Store,potražite Azure strojno učenje. Navedite ulaz i dva stupca za raspon izlaza. Ne zaboravite promijeniti naslov kako bi odgovarao shemi, tweet_text, u ovom konkretnom slučaju.
U redu, pa izvoli. Sljedeći put kad budete imali veliku količinu podataka za analizu, provjerite pomoću Azure Machine Learninga, besplatnog dodatka za Excel 2013. Hvala što ste navratili, vidimo se sljedeći put za još jedno emitiranje od.
Preuzmi datoteku
Preuzmite uzorak datoteke ovdje: Podcast2062.xlsm