10.4.2012

Sanapilvi

Kokeilin sanapilvien tekoa R-ohjelmoinnilla. Sain aikaan alla olevan pilven suosikkilaulajani Jipun laulujen sanoista. [Uusi levy, joka ilmestyi huhtikuun lopussa, on myös mukana.] Sanasto on kerrassaan osuva. Jossain haastattelussa Jipulta kysyttiin, mitä hän haluaa, ja vastaus oli: kaiken.

Näissä blogeissakin näkee usein sanapilviä, mutta ne on tehty bloggaajan itse asettamista tunnisteista. Tavallisesta tekstistä sanapilven teko ei ole aivan simppeliä, sillä sanat taipuvat. Jouduin muuttamaan laulujen sanat perusmuotoon käsin, sillä sopivaa ohjelmaa ei liene ilmaisversiona. R-kielessä on myös suomen kielelle toiminto, jolla saa poistettua sisällön kannalta epäkiinnostavat sanat kuten "ja", "että", "ei", "minä" (ja luultavasti myös persoonapronomien taivutusmuodot). Tämmöisiä sanoja kutsutaan englanniksi nimellä stop words. Sanapilven teko-ohje löytyy täältä: http://addictedtor.free.fr/graphiques/graphcode.php?graph=162
Jos osaisin, tekisin eloisamman version: ensin näkyviin tulisi yksi sana ja hiljalleen lisää.

Ei kommentteja:

Lähetä kommentti