utorak, 11. siječnja 2011.

Kako vam predočiti 100 GB Google tekstualnih podataka?

Zanimljive vijesti prikaza u http://rss.slashdot.org/~r/Slashdot/slashdot/~3/lRQnkESVHZc/story01.htm:
Anonimni čitatelj piše: "Tu je nevjerojatna serija grafikoni koji vizualizira trigrama i bigrams, dijelove rečenica koji su izvađeni iz Google web skupa podataka. Grafova označite riječ udrugama i učestalost kojom se njima koriste na web stranicama. Chrisa Harrisona s Carnegie Mellon University pronašao, na primjer, da je riječ "on" često je vezan za 'tvrdi,' a 'ona' nalazi se često "voli". Tu su i riječ-odnos ljestvice koji ističu riječi koje se koriste u kombinaciji s njihove suprotnosti, kao što su dobre i loše, mir i rat, i PC i Mac. " Ima puno tih stvari, i oni su zaista zanimljivo za pregledavanje putem.

Pročitajte više ove priče na Slashdot.




Nema komentara:

Objavi komentar