A Ngram, komunement imsejħa N-gramma hija analiżi statistika ta 'kontenut ta' test jew diskors biex issib n (numru) ta 'xi tip ta' oġġett fit-test. Jista 'jkun hemm kull xorta ta' affarijiet, bħal fonemi, prefissi, frażijiet jew ittri. Għalkemm il-gramma N hija kemmxejn skura barra r-riċerkatur, din tintuża f'ħafna oqsma, u għandha ħafna implikazzjonijiet għal nies li jagħmlu programmi tal-kompjuter li jifhmu u jirrispondu b'lingwa naturali mitkellma. Li, fil-qosor, ikun l-interess ta 'Google fl-idea.
Fil-każ tal-Google Books Ngram Viewer, it-test li għandu jiġi analizzat ġej mill-ammont kbir ta 'kotba li Google skanjat minn libreriji pubbliċi biex timla l-magna tat-tiftix tal- Google Books tagħhom. Għal Google Books Ngram Viewer, huma jirreferu għat-test li qed tfittex bħala "corpus." Il-korporali fil-Viewer Ngram huma maqsuma bil-lingwa, għalkemm tista 'tanalizza separatament Ingliż Ingliż jew Ingliż jew tallokahom flimkien. Jispiċċa jkun super interessanti li toggle mill-użu ta 'termini Brittaniċi għall-Amerikani u ara l-mapep jinbidlu.
Kif taħdem Ngram
- Mur fil-Google Books Ngram Viewer fuq books.google.com/ngrams.
- L-oġġetti huma sensittivi għall-każijiet, b'differenza għat-tfittxijiet tal-Web tal-Google, għalhekk kun żgur li jikkapitalizzaw ismijiet xierqa.
- Tip fi kwalunkwe frażi jew frażijiet li tixtieq tanalizza. Kun żgur li tissepara kull frażi b'virgola. Google jissuġġerixxi, "Albert Einstein, Sherlock Holmes, Frankenstein" biex tibda.
- Sussegwentement, tip fi skala ta 'data. In-nuqqas huwa 1800 sa 2000, iżda hemm aktar kotba reċenti (l-2011 kienet l-aktar reċenti elenkata fid-dokumentazzjoni ta 'Google, iżda dan seta' nbidel).
- Agħżel korp. Tista 'tfittex testi bil-lingwa barranija jew bl-Ingliż, u minbarra l-għażliet standard, tista' tinnota affarijiet bħal "Ingliż (2009) jew American English (2009)" fil-qiegħ. Dawn huma corpus anzjani li Google minn dakinhar ġew aġġornati, imma jista 'jkollok xi raġuni biex tagħmel il-paraguni tiegħek kontra settijiet ta' data qodma. Il-biċċa l-kbira ta 'l-utenti jistgħu jinjorawhom u jiffokaw fuq il-corpora l-aktar riċenti.
- Issettja l-livell li jtaffi. L-issikkar jirreferi għal kemm hu tajjeb il-graff fl-aħħar. Ir-rappreżentazzjoni l-aktar preċiża tkun livell ta 'tħaffif ta' 0, iżda dan jista 'jkun diffiċli biex tinqara. In-nuqqas huwa stabbilit għal 3. Fil-biċċa l-kbira tal-każijiet, m'għandekx bżonn taġġusta dan.
- Agħfas il- lottijiet tat - Tiftix tal- buttuna ta ' (Tista 'wkoll biss hit tidħol fuq il-pedaġġ ta' tfittxija.)
X'inhu Ngram Showing?
Google Books Ngram Viewer se joħroġ graff li jirrappreżenta l-użu ta 'frażi partikolari fil-kotba matul iż-żmien. Jekk daħħalt aktar minn kelma jew frażi waħda, tara l-linji kkodifikati bil-kulur biex tikkuntrasta t-termini ta 'tiftix differenti. Dan huwa pjuttost simili għal Google Trends , it-tfittxija biss tkopri perjodu itwal ta 'żmien.
Hawn eżempju tal-ħajja vera. Ġejna kurjużi dwar il-ħall tal-ħall reċentement. Huma qed jissemmew fil- Little House ta ' Laura Ingalls Wilder fuq is- serje Prairie , imma aħna qatt ma semgħu xi ħaġa bħal din. L-ewwel użajna t-tfittxija tal-Web ta 'Google biex titgħallem aktar dwar torti tal-ħall. Apparentement, huma meqjusa bħala parti mill-kċina tan-Nofsinhar Amerikana u huma verament magħmula mill-ħall. Huma jisgħtu lura għal żminijiet meta mhux kulħadd kellu aċċess għal prodotti friski f'kull ħin tas-sena. Hija dik l-istorja sħiħa?
Aħna mfittxija Google Ngram Viewer, u hemm xi kitbiet tat-torta kemm fl-1800s bikrija kif ukoll tard, ħafna indikazzjonijiet fl-1940s, u numru dejjem jikber ta 'indikazzjonijiet fi żminijiet riċenti (forsi xi nostalgia pie). Ukoll, hemm ftit Problema bid-dejta f'livell ta 'twittija ta' 3. Hemm plateau fuq is-sejbiet fl-1800s. Ċertament ma kienx hemm numru ugwali ta 'referenza ta' biċċa partikolari kull sena għal ħames snin? X'inhu għaddej hu li minħabba li ma hemmx ħafna kotba ppubblikati matul dak iż-żmien, u minħabba li d-dejta tagħna hija bla xkiel, hija tgħawweġ l-istampa. Probabbilment kien hemm ktieb wieħed li ssemma 'pie tal-ħall, u għadu kif ħa l-medja biex jevita spike. Bit-twaqqif ta 'l-issikkar għal 0, nistgħu naraw li dan huwa eżattament il-każ. Iċ-ċentri spike fuq 1869, u hemm spike ieħor fl-1897 u l-1900.
Ħadd ħadd ma kien jitkellem dwar il-ħall tal-ħall il-bqija tal-ħin? Probabbilment kienu tkellmu dwar dawk it-torti. Kien hemm riċetti probabbli f'wiċċ l-ilma kollha fuq il-post. Huma biss ma ktibux dwarhom fil-kotba, u dik hija limitazzjoni ta 'dawn it-tfittxijiet ta' Ngram.
Advanced Ngram Searches
Ftakar kif għidna li Ngrams jista 'jikkonsisti f'kull tip ta' tiftix tat-test differenti? Google jippermettilek li tħaffer pjuttost ftit mal-Ngram Viewer ukoll. Jekk tixtieq tfittex il-ħut il-verb minflok ħut in-nom, tista 'tagħmel dan billi tuża tikketti. F'dan il-każ, inti tfittex għal "fish_VERB"
Google jipprovdi lista kompleta ta 'kmandi li tista' tuża u dokumentazzjoni oħra avvanzata fuq il-websajt tagħhom.