Čo by ste mali vedieť
- V prehliadači Google Books Ngram Viewer zadajte frázu, vyberte rozsah dátumov a korpus, nastavte úroveň vyhladenia a kliknite na Hľadať veľa kníh.
- Môžete hĺbkovo analyzovať údaje. Ak chcete napríklad vyhľadať slovesný tvar ryba, namiesto podstatného mena ryba použite značku: hľadajte fish_VERB.
- Ngram Viewer zobrazuje graf znázorňujúci používanie frázy v priebehu času. V prípade viacerých fráz je každá reprezentovaná farebne odlíšeným riadkom.
V tomto článku je vysvetlené, ako používať nástroj Ngram Viewer v službe Knihy Google na vykonávanie prieskumu a silného vyhľadávania.
Ako funguje prehliadač Ngram
Ngram, tiež nazývaný N-gram, je štatistická analýza obsahu textu alebo reči s cieľom nájsť n (číslo) nejakého druhu položky v texte.
Položkou vyhľadávania môžu byť rôzne druhy vecí vrátane foném, predpôn, fráz a písmen. Hoci je Ngram mimo výskumnú komunitu neznámy, používa sa v rôznych oblastiach a má veľa dôsledkov pre vývojárov, ktorí kódujú počítačové programy, ktoré rozumejú prirodzenému hovorenému jazyku a reagujú naň.
V prípade prehliadača Google Books Ngram Viewer text, ktorý sa má analyzovať, pochádza z obrovského množstva kníh vo verejnej doméne, ktoré spoločnosť Google naskenovala, aby naplnila svoj vyhľadávací nástroj služby Knihy Google. Pre prehliadač Google Books Ngram Viewer označuje Google telo textu, ktorý budete hľadať, ako korpus. Prehliadač Ngram agreguje podľa jazyka, hoci britskú a americkú angličtinu môžete analyzovať samostatne alebo ich spojiť.
- Prejdite do prehliadača Ngram Kníh Google na stránke books.google.com/ngrams.
-
Napíšte frázu alebo frázy, ktoré chcete analyzovať. Jednotlivé frázy oddeľte čiarkou. Google vám na začiatok navrhuje „Albert Einstein, Sherlock Holmes, Frankenstein“.
Vo vyhľadávaniach NGram Viewer sa pri položkách na rozdiel od vyhľadávania na webe Google rozlišujú malé a veľké písmená.
- Vyberte rozsah dátumov. Predvolená hodnota je 1800 až 2000.
- Vyberte korpus. Môžete vyhľadávať v cudzojazyčných textoch alebo anglických textoch a okrem štandardných možností si v spodnej časti zoznamu môžete všimnúť položky ako „English (2009)“alebo „American English (2009)“. Ide o staršie korpusy, ktoré spoločnosť Google odvtedy aktualizovala, ale možno budete mať dôvod na porovnanie so starými súbormi údajov. Väčšina používateľov ich môže ignorovať a zamerať sa na najnovšie korpusy.
-
Nastavte úroveň vyhladenia. Vyhladzovanie sa vzťahuje na to, ako hladký je graf na konci. Najpresnejšie zobrazenie odráža úroveň vyhladenia 0, ale toto nastavenie môže byť ťažké prečítať. Predvolená hodnota je nastavená na 3. Vo väčšine prípadov ju nemusíte upravovať.
- Stlačte Vyhľadajte veľa kníh.
Pomocou prehliadača Google Ngram Viewer môžete údaje hĺbkovo prehĺbiť. Ak chcete namiesto podstatného mena ryba vyhľadať sloveso ryba, môžete tak urobiť pomocou značiek. V tomto prípade by ste hľadali fish_VERB.
Google na svojej webovej stránke poskytuje kompletný zoznam príkazov a ďalšiu pokročilú dokumentáciu na použitie s Ngram Viewer.
Zrátané podčiarknutie
Google Books Ngram Viewer zobrazuje graf, ktorý predstavuje použitie konkrétnej frázy v knihách v priebehu času. Ak ste zadali viac ako jedno slovo alebo frázu, každé z nich je reprezentované farebne odlíšeným riadkom, ktorý kontrastuje s ostatnými hľadanými výrazmi. Je to podobné ako Google Trends, len vyhľadávanie pokrýva dlhšie obdobie.
Prípadová štúdia
Zvážte prípadovú štúdiu octových koláčov. Spomínajú sa v sérii Little House on the Prairie od Laury Ingalls Wilder. Ak sa chcete dozvedieť viac o octových koláčoch pomocou webového vyhľadávania Google, zistíte, že sa považujú za súčasť americkej južanskej kuchyne a skutočne sa vyrábajú z octu. Spomínajú na časy, keď nie každý mal prístup k čerstvým produktom v každom ročnom období, ale to je celý príbeh?
Vyhľadajte v prehliadači Google Ngram Viewer výraz octový koláč a narazíte na niektoré zmienky o koláči na začiatku aj na konci 19. storočia, veľa zmienok zo 40. rokov 20. storočia a narastajúci počet zmienok v poslednom období. Pri úrovni vyhladenia 3 však uvidíte plošinu nad zmienkami z 19. storočia. Keďže v tom čase nevyšlo veľa kníh a údaje sú nastavené na plynulé, obraz je skreslený. Pravdepodobne iba jedna kniha spomínala octový koláč a bola spriemerovaná, aby sa predišlo bodnutiu. Nastavením vyhladzovania na 0 môžete vidieť, že je to presne tak. Vrchol sa sústreďuje na rok 1869 a ďalší vrchol je v rokoch 1897 a 1900.
Je nepravdepodobné, že zvyšok času nikto nehovoril o octových koláčoch: Pravdepodobne všade plávali recepty, ale ľudia o nich nepísali v knihách, a to je dôležité obmedzenie vyhľadávania Ngram.