Kif tuża l-Għodda 'Ngram Viewer' fil-Google Books

A Ngram, komunement imsejħa N-gramma hija analiżi statistika ta 'kontenut ta' test jew diskors biex issib n (numru) ta 'xi tip ta' oġġett fit-test. Jista 'jkun hemm kull xorta ta' affarijiet, bħal fonemi, prefissi, frażijiet jew ittri. Għalkemm il-gramma N hija kemmxejn skura barra r-riċerkatur, din tintuża f'ħafna oqsma, u għandha ħafna implikazzjonijiet għal nies li jagħmlu programmi tal-kompjuter li jifhmu u jirrispondu b'lingwa naturali mitkellma. Li, fil-qosor, ikun l-interess ta 'Google fl-idea.

Fil-każ tal-Google Books Ngram Viewer, it-test li għandu jiġi analizzat ġej mill-ammont kbir ta 'kotba li Google skanjat minn libreriji pubbliċi biex timla l-magna tat-tiftix tal- Google Books tagħhom. Għal Google Books Ngram Viewer, huma jirreferu għat-test li qed tfittex bħala "corpus." Il-korporali fil-Viewer Ngram huma maqsuma bil-lingwa, għalkemm tista 'tanalizza separatament Ingliż Ingliż jew Ingliż jew tallokahom flimkien. Jispiċċa jkun super interessanti li toggle mill-użu ta 'termini Brittaniċi għall-Amerikani u ara l-mapep jinbidlu.

Kif taħdem Ngram

  1. Mur fil-Google Books Ngram Viewer fuq books.google.com/ngrams.
  2. L-oġġetti huma sensittivi għall-każijiet, b'differenza għat-tfittxijiet tal-Web tal-Google, għalhekk kun żgur li jikkapitalizzaw ismijiet xierqa.
  3. Tip fi kwalunkwe frażi jew frażijiet li tixtieq tanalizza. Kun żgur li tissepara kull frażi b'virgola. Google jissuġġerixxi, "Albert Einstein, Sherlock Holmes, Frankenstein" biex tibda.
  4. Sussegwentement, tip fi skala ta 'data. In-nuqqas huwa 1800 sa 2000, iżda hemm aktar kotba reċenti (l-2011 kienet l-aktar reċenti elenkata fid-dokumentazzjoni ta 'Google, iżda dan seta' nbidel).
  5. Agħżel korp. Tista 'tfittex testi bil-lingwa barranija jew bl-Ingliż, u minbarra l-għażliet standard, tista' tinnota affarijiet bħal "Ingliż (2009) jew American English (2009)" fil-qiegħ. Dawn huma corpus anzjani li Google minn dakinhar ġew aġġornati, imma jista 'jkollok xi raġuni biex tagħmel il-paraguni tiegħek kontra settijiet ta' data qodma. Il-biċċa l-kbira ta 'l-utenti jistgħu jinjorawhom u jiffokaw fuq il-corpora l-aktar riċenti.
  6. Issettja l-livell li jtaffi. L-issikkar jirreferi għal kemm hu tajjeb il-graff fl-aħħar. Ir-rappreżentazzjoni l-aktar preċiża tkun livell ta 'tħaffif ta' 0, iżda dan jista 'jkun diffiċli biex tinqara. In-nuqqas huwa stabbilit għal 3. Fil-biċċa l-kbira tal-każijiet, m'għandekx bżonn taġġusta dan.
  1. Agħfas il- lottijiet tat - Tiftix tal- buttuna ta ' (Tista 'wkoll biss hit tidħol fuq il-pedaġġ ta' tfittxija.)

X'inhu Ngram Showing?

Google Books Ngram Viewer se joħroġ graff li jirrappreżenta l-użu ta 'frażi partikolari fil-kotba matul iż-żmien. Jekk daħħalt aktar minn kelma jew frażi waħda, tara l-linji kkodifikati bil-kulur biex tikkuntrasta t-termini ta 'tiftix differenti. Dan huwa pjuttost simili għal Google Trends , it-tfittxija biss tkopri perjodu itwal ta 'żmien.

Hawn eżempju tal-ħajja vera. Ġejna kurjużi dwar il-ħall tal-ħall reċentement. Huma qed jissemmew fil- Little House ta ' Laura Ingalls Wilder fuq is- serje Prairie , imma aħna qatt ma semgħu xi ħaġa bħal din. L-ewwel użajna t-tfittxija tal-Web ta 'Google biex titgħallem aktar dwar torti tal-ħall. Apparentement, huma meqjusa bħala parti mill-kċina tan-Nofsinhar Amerikana u huma verament magħmula mill-ħall. Huma jisgħtu lura għal żminijiet meta mhux kulħadd kellu aċċess għal prodotti friski f'kull ħin tas-sena. Hija dik l-istorja sħiħa?

Aħna mfittxija Google Ngram Viewer, u hemm xi kitbiet tat-torta kemm fl-1800s bikrija kif ukoll tard, ħafna indikazzjonijiet fl-1940s, u numru dejjem jikber ta 'indikazzjonijiet fi żminijiet riċenti (forsi xi nostalgia pie). Ukoll, hemm ftit Problema bid-dejta f'livell ta 'twittija ta' 3. Hemm plateau fuq is-sejbiet fl-1800s. Ċertament ma kienx hemm numru ugwali ta 'referenza ta' biċċa partikolari kull sena għal ħames snin? X'inhu għaddej hu li minħabba li ma hemmx ħafna kotba ppubblikati matul dak iż-żmien, u minħabba li d-dejta tagħna hija bla xkiel, hija tgħawweġ l-istampa. Probabbilment kien hemm ktieb wieħed li ssemma 'pie tal-ħall, u għadu kif ħa l-medja biex jevita spike. Bit-twaqqif ta 'l-issikkar għal 0, nistgħu naraw li dan huwa eżattament il-każ. Iċ-ċentri spike fuq 1869, u hemm spike ieħor fl-1897 u l-1900.

Ħadd ħadd ma kien jitkellem dwar il-ħall tal-ħall il-bqija tal-ħin? Probabbilment kienu tkellmu dwar dawk it-torti. Kien hemm riċetti probabbli f'wiċċ l-ilma kollha fuq il-post. Huma biss ma ktibux dwarhom fil-kotba, u dik hija limitazzjoni ta 'dawn it-tfittxijiet ta' Ngram.

Advanced Ngram Searches

Ftakar kif għidna li Ngrams jista 'jikkonsisti f'kull tip ta' tiftix tat-test differenti? Google jippermettilek li tħaffer pjuttost ftit mal-Ngram Viewer ukoll. Jekk tixtieq tfittex il-ħut il-verb minflok ħut in-nom, tista 'tagħmel dan billi tuża tikketti. F'dan il-każ, inti tfittex għal "fish_VERB"

Google jipprovdi lista kompleta ta 'kmandi li tista' tuża u dokumentazzjoni oħra avvanzata fuq il-websajt tagħhom.