Ako funguje funkcia Hum to Search od Googlu

Obsah:

Ako funguje funkcia Hum to Search od Googlu
Ako funguje funkcia Hum to Search od Googlu
Anonim

Kľúčové poznatky

  • Google spustil nový nástroj, ktorý používateľom umožňuje vyhľadávať skladby hučaním, spievaním alebo pískaním.
  • Nový nástroj využíva strojové učenie na priradenie hučanej skladby k databáze viac ako pol milióna skladieb, ktorá sa neustále aktualizuje.
  • Používatelia Googlu sa každý mesiac pýtajú, ktorá skladba sa prehráva takmer 100-krát.
Image
Image

Google spustil novú funkciu s názvom „Hum to Search“, aby vyriešil frustrujúci problém: skladba vám uviazla v hlave a neviete prísť na to, ako sa volá.

Myšlienka bzučania pri hľadaní skladby sa zdá byť neuveriteľne jednoduchá, tak prečo Google spúšťa túto funkciu až v roku 2020? No, ukázalo sa, že identifikácia skladieb týmto spôsobom je v skutočnosti dosť komplikovaná, čiastočne preto, že naše hučané verzie majú tendenciu byť dosť odlišné od pôvodnej skladby. V nedávnom príspevku na svojom blogu o umelej inteligencii Google vysvetľuje, ako pomocou strojového učenia vyriešil tento problém a v konečnom dôsledku pomohol ľuďom nájsť skladbu hučaním, pískaním alebo spievaním melódie, aj keď je ich interpretácia menej než presná.

„Naším cieľom pre Hum to Search je pomôcť ľuďom identifikovať a nájsť hudbu, ktorá im utkvela v hlave,“povedal hovorca Google Lifewire v e-maile.

Len začnite bzučať

Používatelia Google sa každý mesiac pýtajú, ktorá skladba sa hrá takmer 100 miliónov krát, Aparna Chennapragada, viceprezident a generálny riaditeľ spoločnosti Google pre nákupy spotrebiteľov, uviedol video, ktoré predstavuje niekoľko nových funkcií vyhľadávania. Teraz existuje spôsob, ako to zistiť.

Funkcia „Hum to Search“je integrovaná do mobilnej aplikácie Google, miniaplikácie Vyhľadávanie Google a Asistenta Google. Ak chcete získať prístup cez aplikáciu, klepnite na ikonu mikrofónu a povedzte „What’s this song?“Funguje aj výber tlačidla „Vyhľadať skladbu“.

Ak chcete, aby funkcia fungovala správne, musíte si bzučať aspoň 10-15 sekúnd. Používatelia systému Android môžu bzučaním nájsť skladby vo viac ako 20 jazykoch, zatiaľ čo na telefónoch iPhone fungujú iba anglické skladby. Nástroj nie vždy dokáže identifikovať skladbu okamžite, ale keď sa to podarí, výsledky sú celkom dobré.

"Naše algoritmy rozpoznávajú viac ako polovicu skladieb so širokou množinou premenných (tón, výška, hlasitosť atď.), ale presnosť samozrejme závisí od kvality bzučania, typu pieseň a ďalšie,“povedal hovorca Google Lifewire v e-maile. "Ale keď sa to rozpozná, zhruba štyri z piatich odpovedí sú správne."

Nie je to však prvýkrát, čo bolo bzučanie použité v aplikácii na identifikáciu hudby. SoundHound ponúka podobnú funkciu, ako uvádza CNN Business, a je k dispozícii aj pre Android a iOS. Podľa hovorcu Google nová funkcia nevyvoláva žiadne obavy o súkromie, ani „nezmení spôsob, akým Google spracováva interakcie založené na zvuku“, povedali Lifewire v e-maile.

Strojové učenie

Napriek jednoduchosti konceptu je bzučanie melódie pri hľadaní štúdiovej nahrávky technicky dosť náročné. Existuje na to niekoľko dôvodov, vysvetľuje Christian Frank z Google Research v blogovom príspevku z 12. novembra. Predovšetkým, hučaná verzia piesne sa môže značne líšiť od skutočnej nahrávky, takže je ťažké tieto dve zladiť. Takže zatiaľ čo Shazam a množstvo ďalších aplikácií už existujú na identifikáciu skladby, ktorú počujete v reštaurácii alebo na inom verejnom mieste, použitie bzučajúcej melódie ako základu pre toto vyhľadávanie môže byť zložitejšie.

"S textom, sprievodným vokálom a nástrojmi môže byť zvuk hudobnej alebo štúdiovej nahrávky úplne odlišný od hučanej melódie," píše Frank."Omylom alebo zámerom, keď si niekto pohmkáva svoju interpretáciu piesne, často sa výška, tónina, tempo alebo rytmus môžu mierne alebo dokonca výrazne líšiť."

Image
Image

Vzhľadom na to, že verzie piesní s hučaním sa môžu veľmi líšiť od originálov, Frank poznamenáva, že mnohé minulé metódy vyžadovali zosúladenie bzučania osoby s verziou piesne, ktorá má iba melódiu, alebo so skladbou, ktorá obsahuje bzučanie. Vďaka tomu boli prípady použitia v reálnom svete náročné, pretože databázy s týmito skladbami môžu byť obmedzené a je potrebné ich manuálne aktualizovať.

Google vysvetľuje, že pre funkciu Hum to Search využíva modely strojového učenia na premenu zvuku na „číslovú sekvenciu“, ktorá predstavuje melódiu piesne – to, čo hovorí, možno považovať za „odtlačok prsta“."

Užívateľsky prívetivé

Použitie strojového učenia vo funkcii Hum to Search od Googlu v konečnom dôsledku výrazne uľahčuje používanie tohto nástroja v reálnom svete. Pretože Hum to Search sa zhoduje so zahmkanou melódiou hľadajúceho so skutočnou skladbou, nástroj dokáže pracovať s novými skladbami, keď sú vydávané, namiesto databázy, ktorú je potrebné neustále aktualizovať pomocou hučaných verzií každej skladby. Navyše na jej použitie nepotrebujete dokonalú výšku tónu.

„Súčasný systém dosahuje vysokú úroveň presnosti v databáze skladieb, ktorá obsahuje viac ako pol milióna skladieb, ktoré neustále aktualizujeme,“uviedol Google vo svojom oznámení Hum to Search. "Tento piesňový korpus má stále priestor na rast, aby zahŕňal viac z mnohých svetových melódií."

Odporúča: