Google објектив: Видео и гласовна претрага помоћу вештачке интелигенције, како се користи и све његове тајне

Последње ажурирање: КСНУМКС мај, КСНУМКС
  • Претрага видеа помоћу Google Lens-а омогућава контекстуалне одговоре у реалном времену помоћу вештачке интелигенције.
  • Могуће је консултовати се гласом или текстом током снимања видеа, што проширује могућности интеракције.
  • Функција се ослања на Gemini модел за интерпретацију слика, звука и мултимодалног контекста за сваки упит.

Претрага видеа са вештачком интелигенцијом у Google објективу

Гоогле објектив Постао је неопходан Google алат за претрагу информација са вашег мобилног телефона, а сада интегрише револуционарно ажурирање: Претражујте видео записе и гласно постављајте питања захваљујући вештачкој интелигенцији. Ова функција означава корак напред у односу на традиционалну претрагу слика и радикално мења начин на који интерагујемо са светом око нас. Овде ћете открити како функционише, чему служи, како да га користите корак по корак, његове предности, ограничења и све његове тајне, уз детаљна објашњења и корисне савете.

Шта је Google Lens и његова еволуција ка мултимодалној видео претрази?

Од свог лансирања, Гугл објектив се истакао по томе што је омогућио идентификацију предмета, текстова, животиња, биљака, производа или споменика. једноставним усмеравањем мобилне камере. Међу његовим најпопуларнијим карактеристикама су тренутни превод текста, решавање математичких задатака, скенирање QR кодова и упоређивање производа у физичким и онлајн продавницама.

Током времена, Гугл објектив је интегрисао нове технологије као што су препознавање гласа и мултимодална претрага, а могу се користити и у другим апликацијама у Google екосистему као што су Мапе, Фотографије или Chrome. Његова функционалност није ограничена само на слике снимљене у то време, већ укључује и сачуване фотографије, одабране текстове, а сада и видео записе снимљене директно из апликације.

Главни тренутни напредак лежи у Способност анализе кратких видео записа, тумачења сцене и омогућавања постављања питања гласом или текстом, добијајући прецизне и контекстуалне одговоре тренутно.. Ово превазилази главну препреку претраге слика, где једна фотографија није увек довољна да пружи потпун контекст упиту.

Како користити видео и гласовну претрагу у Google објективу корак по корак

  1. Отворите апликацију Google Lens са свог Android или iOS телефона или помоћу иконе лупе у траци за претрагу Google-а.
  2. Изаберите „Претражи помоћу камере“. Усмерите камеру ка објекту, сцени или ситуацији коју желите да прегледате.
  3. Притисните и држите дугме за снимање да бисте снимили кратак видео (обично до 20 секунди). Током снимања, можете наглас поставити питање о ономе што видите. Алтернативно, можете откуцати питање након снимања видеа.
  4. Када заврши, Гуглова вештачка интелигенција ће анализирати и видео и аудио вашег упита, бирајући најрелевантније кадрове и одговорити за неколико секунди.

Током снимања, систем приказује поруку „Говорите сада да бисте питали о овој сцени“. Овај процес чини искуство много природнијим, јер можете сузити оно што желите да знате, откривајући детаље које једна претрага слике или текста није могла да идентификује.

Какви се одговори добијају и напредне практичне примене

La Разноврсност и прецизност одговора далеко превазилазе класичну претрагу слика., јер вештачка интелигенција има приступ већем контексту и може да повеже визуелне и усмене детаље у видеу. Неки примери употребе и значајни практични случајеви:

  • Идентификација покретних објеката и животињаИдеално за снимање активних кућних љубимаца, животиња у њиховом природном окружењу или возила у акцији и проверу врста, марки или карактеристика које би могле остати непримећене на статичној фотографији.
  • Препознавање места и споменикаСнимите панорамски поглед на трг или зграду и питајте о њеној историји, архитектури или занимљивим чињеницама. Вештачка интелигенција може да прати рецензије, историјске информације и кључне податке.
  • Добијање информација о производима у продавницамаДа ли видите нешто занимљиво и желите да знате цену, мишљења или алтернативе? Снимите производ и питајте наглас. Систем пружа линкове за куповину, поређења и искуства других корисника.
  • Упити о видео записима треће странеСнимите екран телевизора, рачунара или таблета да бисте идентификовали песме, глумце, локације, ресторане или било које визуелне или звучне елементе у сцени.
  • Помоћ у образовању и решавању проблемаСнимите експеримент, математичку операцију или рад поквареног кућног апарата и затражите решење, објашњење или упутства корак по корак.
  • Истраживање уметности и природеКонсултујте се о уметничком делу, егзотичној биљци, геолошкој формацији, врсти облака итд., добијајући детаљна објашњења и ресурсе за проширивање информација.
  • Тренутни превод у покретуЗа путнике, омогућава снимање покретних знакова, етикета или титлова и добијање превода без обзира на то да ли је знак ван фокуса или га је тешко снимити на фотографији.
  • Занати и „уради сам“ пројектиМожете снимити материјале и процес, постављајући питања о следећем кораку или тражећи детаљна упутства прилагођена контексту вашег видеа.
  • Кухињски рецептиПриказује састојке или поступак рецепта и пита о припреми, времену кувања или алтернативама састојцима.

Нема потребе за писањем дугих текстова или губитком времена на техничке описе.. Једноставно снимите, прикажите и поставите питања да бисте добили прецизан преглед прилагођен вашем контексту, захваљујући мултимодалној вештачкој интелигенцији компаније Google.

Прегледи Близанаца и вештачке интелигенције: Вештачка интелигенција која стоји иза магије

Мотор који омогућава ову функцију је Џемини, Гуглов напредни модел вештачке интелигенције способан да разуме слике, текст, звук, а сада и целе видео записе.. Како то функционише? Када снимите видео и поставите питање, Gemini анализира снимак кадар по кадар, идентификује кључне визуелне фрагменте и укршта те информације са вашим питањем, било изговореним или написаним.

Резултат се појављује у облику АИ Овервиевс, експериментална функција која обрађује информације доступне на вебу, јасно их сумира и приказује на екрану уређаја за неколико секунди. Ово чини претрагу заиста мултимодалниВештачка интелигенција комбинује слику, глас и контекст, омогућавајући решавање питања која су раније захтевала вишеструке претраге или тешко детаљне описе.

За неке кориснике, посебно тамо где је функција још увек експериментална, можда ће бити потребно да укључе опцију „Претражи лабораторије“ и омогуће „Прегледи вештачке интелигенције и још много тога“ из апликације Google. Иако је увођење почело у регионима где се говори енглески језик, ширење на друге језике и земље брзо напредује.

Примери и демонстрације из стварног живота: Како Google објектив реагује на видео и глас

Практични потенцијал је виђен у тестовима које су забележили стручњаци попут Мишала Рахмана, који је документовао препознавање паметних сатова, тањира са храном или урбаних сцена за неколико секунди. На пример, када је снимао јело од боровница и питао колико их је било, Gemini је вратио тачан број у реалном времену. У другом тесту, снимањем паметног сата и питањем о његовом моделу и оперативном систему, вештачка интелигенција је исправно идентификовала већину детаља, чак и ако се одређени модел може мало разликовати.

У додатним експериментима, било је могуће идентификовати врсте птица у лету, идентификовати возила у покрету, пребројати објекте у сцени и понудити сложена образовна објашњења. Стопа тачности зависи од квалитета и оштрине видеа, али брзина и корисност одговора далеко превазилазе претраге фотографија.

Особа са стезаљком са гоогле сочивом
Повезани чланак:
Све што можете постићи помоћу Google објектива: Комплетан и ажуриран водич

Интеграција са Гугл екосистемом и новим методама претраживања

Еволуција Google објектива не само да побољшава главну апликацију, већ и омогућава нове функције у целом Google екосистему.. Неке од најзначајнијих интеграција и предности укључују:

  • Директна претрага на YouTube-у: Идентификујте елементе у видео записима унутар апликације, као што су места, песме, глумци или производи, једноставним снимањем екрана.
  • Обогаћено искуство у Chrome-уОмогућава вам да одаберете видео записе, слике или фрагменте текста са веб страница и прегледате информације без напуштања прегледача.
  • Превод у покрету: Користите функцију камере и видеа за превођење покретних знакова или титлова током путовања или променљивих ситуација.
  • паметна куповинаСнимањем производа добијате директне везе до продавница, поређење цена, рецензије и доступност у реалном времену, оптимизујући куповину онлајн и офлајн.

Ограничења, захтеви за коришћење и приватност

Функција Још увек је у поступном распоређивању, тако да његова доступност зависи од региона, језика и од тога да ли је експериментисање „AI Overviews“ омогућено на вашем налогу. У неким случајевима, корисник мора да се региструје у Search Labs и активира повезане експерименте из Google апликације додиром на икону у облику бочице.

  • Максимална дужина видеаВидео је обично ограничен на 10-20 секунди како би се осигурала ефикасност вештачке интелигенције.
  • Препоручени квалитетПрепоручује се снимање при добром осветљењу и правилно фокусирање сцене, јер тачност одзива зависи од оштрине, кадрирања и јасноће окружења.
  • приватностПодразумевано, вештачка интелигенција избегава препознавање лица и фокусира анализу на објекте, радње и контексте, а не на људе. Међутим, препоручљиво је избегавати снимање личних података или људи без њиховог пристанка.
  • Непрецизни одговориУ збуњујућим, нејасним или брзим видео записима, вештачка интелигенција може понудити приближне одговоре или предлоге уместо тачних решења. Упркос томе, ниво корисности је, у већини случајева, веома висок.

Захваљујући визуелној видео претрази у Google Lens-у, отвара се хоризонт могућности који трансформише начин на који решавамо питања, учимо, упоређујемо, купујемо и истражујемо свет. Ова функција, заснована на вештачкој интелигенцији, пружа информације прилагођене свакој ситуацији, комбинујући глас, слику, видео и контекст у једном кораку, приближавајући кориснике будућности интелигентног претраживања. Пратите еволуцију Google објектива и не оклевајте да искористите овај напредак, који брише границе између физичке и дигиталне стварности на длану.