Mei tank oan de digitalisearring fan skriuwen en de opkomst fan sykaksjes en ynteraksjes op it ynternet binne wurden tige weardefolle ynput wurden wurden foar statistyske modellen en algoritmen dy’t it mooglik meitsje om heul krekte konklúzjes oer konsumintegrach, ûnder oare gebrûk, te sluten en te berikken.
Tsjintwurdich is taal it ûnderwerp wurden fan big data-analyze. Om’t de troch Google brûkte keppelings binne gearstald út wurden en de sykopdrachten dy’t op dy side útfierd binne ek gearstald út wurden, wurdt de stúdzje fan tekst as gegevens hieltyd wichtiger.
Neffens it boek “Everybody lies:
What the Internet and Big Data Can Tell Us About Ourselves”, kin dit soarte fan analyze fragen beantwurdzje lykas: wat kinne wy sjen yn de frekwinsje wêrmei’t wurden of útdrukkingen yn ferskate jierren yn boeken ferskine?
De skriuwer fan it boek, Seth Tillefoannûmer Bibleteek Stephens-Davidowitz. In ekonoom en gegevenswittenskipper.Ferklearret dat wy bygelyks, mei de analyze fan. Wurden of útdrukkingen dy’t yn ferskate jierren yn boeken ferskine. Leare oer de stadige opkomst yn populariteit fan “woarst” en de frij resinte en rappe opkomst yn populariteit fan “pizza”.
D’r binne oare fjilden fan aksje om numerike analyze fan wurden út te fieren
It papier beoardielet dat “… d’r in krêftich nij ark is foar it. Analysearjen fan teksten neamd ‘sentimintanalyse’. Wittenskippers kinne no skatte hoe bliid of desolate in bepaalde tekst is.”
As minsken yn ‘e digitale omjouwing To combat this, shoppers recommend two wurden. Brûke as “fenomenaal”, “geweldich”, “bûtengewoan”, “ferbjusterjend” of “prachtig”, kin it ferbûn wurde mei minsken dy’t yn in momint fan lok binne.
As jo wurden omsette kinne yn aol email list gegevens. Kinne jo útfine wat foar iis minsken leuk fine en supermerken dêr har planken mei folje kinne. En kranten kinne fêststelle hokker stânpunten minsken wolle en har siden. Dêrmei folje, konkludearret de skriuwer.