Hoe om 'Ngram Viewer'-hulpmiddel in Google Books te gebruik

'N Ngram, ook algemeen bekend as 'n N-gram, is 'n statistiese analise van teks of spraakinhoud om n ('n nommer) van 'n soort item in die teks te vind. Dit kan allerhande dinge wees, soos foneme, voorvoegsels, frases of letters. Alhoewel die N-gram ietwat duister is buite die navorser, word dit eintlik in verskeie velde gebruik, en dit het baie implikasies vir mense wat rekenaarprogramme maak wat met natuurlike gesproke taal verstaan ​​en reageer. Dit sou in 'n neutedop Google se belangstelling in die idee wees.

In die geval van Google Books Ngram Viewer word die teks wat ontleed word, afkomstig van die groot aantal boeke wat Google van openbare biblioteke ingeskandeer het om hul Google Books- soekenjin te vul. Vir Google Books Ngram Viewer verwys hulle na die teks wat u gaan soek as die "corpus". Die korporaal in die Ngram Viewer word op taal verdeel, alhoewel jy aparte Britse en Amerikaanse engels kan analiseer of hulle saam kan klap. Dit is uiteindelik super interessant om van Britse na Amerikaanse gebruik van terme te wissel en sien die kaarte verander.

Hoe Ngram Werk

  1. Gaan na Google Books Ngram Viewer by books.google.com/ngrams.
  2. Items is hooflettergevoelig, anders as Google Web soektogte, maak seker dat u behoorlike selfstandige naamwoorde kapitaliseer.
  3. Tik enige frase of frases in wat u wil analiseer. Maak seker dat elke frase met 'n komma geskei word. Google stel voor, "Albert Einstein, Sherlock Holmes, Frankenstein" om jou te begin.
  4. Tik dan 'n datumreeks in. Die standaard is 1800 tot 2000, maar daar is meer onlangse boeke (2011 was die jongste wat op Google se dokumentasie gelys is, maar dit mag dalk verander het.)
  5. Kies 'n korpus. U kan vreemde taaltekste of Engels soek, en bykomend tot die standaardkeuses, kan u onderwerpe soos "English (2009)" of "American English" (2009) sien. Hierdie is ouer korporasies wat Google sedertdien opgedateer het, maar jy het dalk rede om jou vergelykings teen ou datastelle te maak. Die meeste gebruikers kan hulle ignoreer en fokus op die mees onlangse korpora.
  6. Stel jou gladde vlak. Gladding verwys na hoe glad die grafiek aan die einde is. Die mees akkurate voorstelling sal 'n gladde vlak van 0 wees, maar dit kan moeilik wees om te lees. Die standaard is ingestel op 3. In die meeste gevalle hoef u dit nie aan te pas nie.
  1. Druk die Soek baie boeke- knoppie. (U kan ook net tik by die soektogprompt.)

Wat is Ngram Wys?

Google Books Ngram Viewer sal 'n grafiek uitstuur wat die gebruik van 'n bepaalde frase in boeke oor tyd voorstel. As jy meer as een woord of frase ingevoer het, sal jy kleurkodes sien om die verskillende soekterme te kontrasteer. Dit is soortgelyk aan Google Neigings , net die soektog dek 'n langer tydperk.

Hier is 'n werklike voorbeeld. Ons was onlangs nuuskierig oor asynpastei. Hulle word genoem in Laura Ingalls Wilder's Little House op die Prairie- reeks, maar ons het nooit van so iets gehoor nie. Ons het Google se websoek eers gebruik om meer oor asynpastei te leer. Klaarblyklik word hulle beskou as deel van die Amerikaanse Suidelike kombuis en word dit regtig van asyn gemaak. Hulle hoor terug na tye wanneer nie almal op alle tye van die jaar toegang tot vars produkte het nie. Is dit die hele storie?

Ons het Google Ngram Viewer deursoek, en daar is in die vroeë en laat 1800's 'n paar vermeldings van die sirkel, baie in die 1940's, en 'n toenemende aantal berigte in die afgelope tyd (miskien 'n bietjie nostalgie.) Wel, daar is 'n paar probleem met die data op 'n gladde vlak van 3. Daar is 'n plato oor die vermeldings in die 1800's. Sekerlik was daar vir vyf jaar nie 'n gelyke aantal noemenswaardighede van een bepaalde tert nie? Wat aan die gang is, is omdat daar nie baie boeke gepubliseer is nie, en omdat ons data glad is, verdraai dit die prentjie. Waarskynlik was daar een boek wat asyntaart genoem het, en dit het net gemiddeld geraak om 'n piek te vermy. Deur die gladde na 0 te stel, kan ons sien dat dit presies die geval is. Die hoogtepunt is 1869, en daar is nog 'n hoogtepunt in 1897 en 1900.

Het niemand oor asynpasteie die res van die tyd gepraat nie? Hulle het waarskynlik oor die pasteie gepraat. Daar was waarskynlik resepte wat oor die hele plek swaai. Hulle het net nie in boeke oor hulle geskryf nie, en dit is 'n beperking van hierdie Ngram-soektogte.

Gevorderde Ngram-soektogte

Onthou hoe ons gesê het dat Ngrams kan bestaan ​​uit allerlei verskillende soektogte? Met Google kan jy ook 'n bietjie boor met die Ngram Viewer. As jy vir vis wil soek, moet die werkwoord in plaas van die naamwoord gevang word, jy kan dit doen deur die gebruik van etikette. In hierdie geval soek jy na "fish_VERB"

Google bied 'n volledige lys van opdragte wat jy kan gebruik en ander gevorderde dokumentasie op hul webwerf.