Ինչպես օգտվել «Ngram հեռուստադիտողի» գործիք Google Գրքերում

A Ngram- ը, որը սովորաբար կոչվում է N-gram, տեքստի կամ խոսքի բովանդակության վիճակագրական վերլուծություն է, տեքստում ինչ-որ առարկայի n (համարը) գտնելու համար: Դա կարող է լինել բոլոր տեսակի բաներ, ինչպես ֆոնեմներ, նախածանցեր, արտահայտություններ կամ տառեր: Թեեւ N-gram- ը որոշ չափով անհասկանալի է հետազոտողից դուրս, այն իրականում օգտագործվում է մի շարք ոլորտներում, եւ այն ունի բազմաթիվ հետեւանքներ այն մարդկանց համար, ովքեր համակարգչային ծրագրեր են իրականացնում, որոնք հասկանում են եւ պատասխանում բնական խոսակցական լեզվով: Դա, անշուշտ, Google- ի հետաքրքրությունն էր գաղափարի մեջ:

Google Books- ի Ngram հեռուստադիտողի դեպքում, վերլուծության ենթակա տեքստը գալիս է Google- ի կողմից հրապարակված հանրային գրադարաններից մեծ քանակությամբ գրքերի մեծ քանակից, որպեսզի նրանք բնակվեն Google Books Search Engine- ի համար: Google Books Ngram հեռուստադիտողի համար դրանք վերաբերում են տեքստին, որը դուք կփնտրեք որպես «կորպուս»: Ngram հեռուստադիտողի մարմնավորումը բաժանված է լեզվով, թեեւ կարող եք առանձին վերլուծել բրիտանական եւ ամերիկյան անգլերենը կամ դրանք միավորել: Այն ավարտվում է սուպեր հետաքրքիր լինելու համար `բրիտանականից մինչեւ ամերիկյան օգտագործման ժամկետները եւ տեսնում է տրամագրերը:

Ինչպես է Նgramը աշխատում

  1. Գնալ դեպի Google Գրքեր Ngram հեռուստադիտողի books.google.com/ngrams:
  2. Նյութերը զգայուն են, ի տարբերություն Google- ի որոնումների, այնպես որ համոզվեք, որ կապիտալիզացված ատյանները:
  3. Մուտքագրեք ցանկացած արտահայտություն կամ արտահայտություններ, որոնք ցանկանում եք վերլուծել: Համոզվեք, որ յուրաքանչյուր արտահայտություն բաժանեք ստորակետով: Google- ը առաջարկում է, «Ալբերտ Էյնշտեյնը, Շերլոկ Հոլմսը, Ֆրանտենշտեյնը»:
  4. Հաջորդ, մուտքագրեք ամսաթվերի շրջանակը: Սխալը 1800-ից 2000 է, բայց կան ավելի ուշ գրքեր (2011-ը Google- ի փաստաթղթերում վերջին անգամ թվարկված էր, բայց դա կարող էր փոխվել):
  5. Ընտրեք կորպուս: Դուք կարող եք որոնել օտարալեզու տեքստեր կամ անգլերեն, եւ բացի ստանդարտ ընտրությունից, դուք կարող եք նկատել այնպիսի բաներ, ինչպիսիք են «English (2009) կամ American English (2009)» ներքեւում: Սրանք ավելի հին ընկերություններ են, որ Google- ից հետո թարմացվում է, բայց կարող եք ինչ-ինչ հիմքեր ստեղծել ձեր համեմատությունների վերաբերյալ հին տվյալների հավաքածուների դեմ: Շատ օգտատերերը կարող են անտեսել դրանք եւ կենտրոնանալ վերջին կորպորացիայի վրա:
  6. Սահմանեք ձեր հարթեցման մակարդակը: Smoothing- ը վերաբերում է, թե որքան սահուն է գրաֆիկը վերջում: Առավել ճշգրիտ ներկայացումը կլինի 0-ի հարթեցման մակարդակը, բայց դա կարող է դժվար լինել կարդալ: Սխալը սահմանվում է 3: Շատ դեպքերում, դուք պետք չէ դա կարգավորել:
  1. Սեղմեք Որոնել բազմաթիվ գրքերի կոճակը: (Դուք կարող եք նաեւ պարզապես հպել մտնելու որոնման հուշում):

Ինչ է նշանակում Նgramը

Google Books Ngram հեռուստադիտողը հանդես կգա գրաֆիկով, որը ներկայացնում է ժամանակի ընթացքում գրքերի որոշակի արտահայտության օգտագործումը: Եթե ​​դուք մտել եք մեկից ավելի բառ կամ արտահայտություն, կտեսնեք գունավոր կոդավորված գծեր, տարբերելու որոնման տարբեր տերմինները: Սա Google Trends- ին բավականին նման է, միայն որոնումը ներառում է ավելի երկար ժամանակ:

Ահա իրական կյանքի օրինակը: Վերջերս քաղցր քացախով հետաքրքրվում էինք: Նրանք նշված են Laura Ingalls Wilder- ի Little House- ում, Prairie- ի շարքերում, բայց մենք երբեք չենք լսել այդպիսի բան: Մենք նախ օգտագործեցինք Google- ի որոնումը , քացախի կարկանդակների մասին ավելին իմանալու համար: Ըստ երեւույթին, դրանք համարվում են ամերիկյան հարավային խոհանոցի մի մաս եւ իսկապես պատրաստված են քացախով: Նրանք ուշադրություն էին դարձնում այն ​​ժամանակներին, երբ տարվա բոլոր ժամանակներում ոչ բոլորն էին օգտվում թարմ արտադրությունից: Արդյոք դա ամբողջ պատմությունն է:

Մենք փնտրել ենք Google Ngram հեռուստադիտողի, եւ կան մի քանի հիշատակումներ կարկանդակի թե 1800-ականների սկզբին, թե ուշ 1800-ական թվականներին, շատերը նշում են 1940-ական թվականներին եւ վերջին ժամանակներում ավելանում են բազմաթիվ թվեր (թերեւս մի քանի կարկանդակ նոստալգիա): խնդիրը տվյալների հարթության մակարդակի 3-ում: Այնտեղ կա 1800-ական թթ. Անշուշտ, հինգ տարիների ընթացքում ոչ մի թվով հավասար թվեր չեն եղել ամեն տարի: Այն, ինչ տեղի է ունենում, քանի որ այդ ընթացքում չկան բազմաթիվ գրքեր, եւ քանի որ մեր տվյալները սահմանվում են հարթ, դա խաթարում է պատկերը: Հավանաբար կա մեկ գիրք, որը նշում էր քացախի կարկանդակ, եւ պարզապես ստացել է միջինը, որպեսզի խուսափեն ցողից: 0-ի հարթեցմամբ, մենք տեսնում ենք, որ դա հենց այդպես է: 1816 թ. Բացվում է 1898 թ. Եւ 1897 եւ 1900 թթ.

Քաղցր քացախի մասին ոչ ոք չի խոսում մնացած ժամանակի մասին: Նրանք, հավանաբար, խոսեցին այդ կարկանդակների մասին: Ամենայն հավանականությամբ, ամենուրեք լողում էին բաղադրատոմսերը : Նրանք պարզապես չեն գրել իրենց գրքերում, եւ դա այդ Ngram- ի որոնումների սահմանափակումն է:

Ընդլայնված Ngram որոնումներ

Հիշեք, թե ինչպես ենք մենք ասել, որ Ngrams- ը կարող է բաղկացած լինել տարբեր տեսակի որոնումներից: Google- ն թույլ է տալիս նաեւ մի փոքր ցատկել Ngram հեռուստադիտողի հետ: Եթե ​​ցանկանում եք ձուկ փնտրել ձուկի փոխարեն ձուկը, ապա կարող եք դա անել, օգտագործելով պիտակներ: Այս դեպքում դուք կցանկանաք որոնել "fish_VERB"

Google- ը տրամադրում է հրամանների ամբողջական ցանկը, որը դուք կարող եք օգտագործել եւ այլ առաջադեմ փաստաթղթեր իրենց կայքում: