Visual Word - Visual Word

Аналогиялық мәтін-сурет

Көрнекі сөздер, ретінде қолданылған кескін іздеу жүйелер,[1] белгілерге байланысты қандай да бір ақпаратты (мысалы, түсі, пішіні немесе құрылымы) немесе өзгерістегі өзгерістерді бейнелейтін кішігірім бөліктерге сілтеме жасау пиксел мысалы, сүзгілеу, төменгі деңгей сипаттамалары (SIFT, СЕРФ, ... және т.б.).

Тарих

Тәсілдері мәтін іздеу жүйе (немесе ақпаратты іздеу IR жүйесі [1]), олар 40 жыл ішінде дамыды кілт сөздер немесе мерзім. Бұл тәсілдердің артықшылығы, әсіресе тиімділігі мен жылдамдығына байланысты. Мәтінді іздеу жүйелері жүздеген немесе миллиондаған құжаттарды тез таба алады (қолдану арқылы) кеңістіктің векторлық моделі [2]). Сонымен қатар, мәтінді іздеу жүйелері үлкен жетістікке жетті, кескіндерді іздеудің стандартты жүйелерінде (түстер, пішіндер бойынша қарапайым іздеу сияқты ...) шектеулер көп. Демек, зерттеушілер оларды қолдану үшін мәтінді іздеу әдістерін пайдалануға тырысады кескін іздеу. Бұл бейнелерді түсінудің жаңа түрі болуы мүмкін мәтіндік құжаттар, бұл көрнекі сөздер тәсілі.[3]

Аналогиялық мәтін-сурет

А-ның ең кіші бөліктері болып табылатын кескіннің пиксельдерін қарастырайық сандық кескіндер (кішілеріне бөлуге болмайды), алфавиттік тілдің әріптері сияқты. Сонымен, суреттегі пиксельдер жиынтығы (патчтар немесе пиксельдер массивтері) сөз болып табылады. Содан кейін әр сөзді морфологиялық жүйеге қайта өңдеп, сол сөзге қатысты термин шығаруға болады. Содан кейін, бірнеше сөздер бірдей мағынаға ие бола алады, әрқайсысы бір терминге сілтеме жасайды (кез-келген тілдегідей). Бір мағынаға ие бірнеше сөз және бір терминге жатады (бірдей ақпаратқа ие). Бұл көзқарас бойынша зерттеушілер мәтінді іздеу әдістерінің көмегімен оларды бейнені іздеу жүйесінде қолдана алады.

Көрнекі анықтамалар

Көрнекі сөздер

Егер біз осы қағиданы суреттерге қолданатын болсақ, онда біздің бейнелерімізде осы сөздер мен терминдердің не болатынын табуымыз керек. Идея - бейнелерді «көрнекі сөздер» жинағы сияқты түсінуге тырысу.

Анықтама 1: Көрнекі сөз: [4] бұл кез-келген мүмкіндік кеңістігінде кез-келген қызықты ақпаратты тасымалдай алатын (түс өзгерістері, текстураның өзгеруі ... т.с.с.) суреттегі шағын патч (пикселдер массиві).

Жалпы алғанда, визуалды сөздер (VW) олардың кеңістігінде көптеген сөздерді, демек үлкен тілді білдіретін үздіксіз мәндер кеңістігінде бар. Кескінді іздеу жүйелерінде табиғи тілдерге тәуелді мәтінді іздеу тәсілдерін қолдану қажет болғандықтан, терминдер мен сөздердің саны шектеулі болғандықтан, көрнекі сөздердің санын азайтудың маңызды қажеттіліктері туындайды.

Бұл мәселені шешу үшін бірқатар шешімдер бар, олардың бірі - ерекшелік кеңістігін диапазондарға бөлу, олардың әрқайсысының жалпы сипаттамалары бар (оларды бір сөз ретінде қарастыруға болады), дегенмен бұл шешім көптеген мәселелерді шешеді, мысалы, бөлу стратегиясы, ерекшеліктер кеңістігіндегі диапазонның мөлшері және т.б. Зерттеушілер ұсынған тағы бір шешім - жалпы мәліметтер бар сөздерді шектеулі санаттарға жіктеу және біріктіру үшін кластерлеу механизмін қолдану.

Анықтама 2: Көрнекі термин: бұл мүмкіндік кеңістігіндегі кластерлеу нәтижесі (кластер орталықтары), бірнеше патч мүмкіндік кеңістігінде жақын ақпаратты бере алады, сондықтан біз оны сол мерзімде қарастыра аламыз.

Мәтіндегі термин (шексіз етістік, зат есімдер, мақалалар ... т.с.с.) көптеген жалпы сөздерге бірдей сипаттамаларға ие болғандықтан, визуалды термин (оның кластерлік нәтижесі ретінде) бірдей ақпаратпен бөліскен барлық жалпы сөздерге сілтеме жасайды кеңістікте.

Егер барлық кескіндер визуалды терминдердің бірдей жиынтығына сілтеме жасаса, онда барлық кескіндер бір тілде сөйлей алады (немесе көрнекі тіл ).

Анықтама 3: Көрнекі тіл: бұл көрнекі сөздер мен көрнекі терминдер жиынтығы, (тек визуалды терминдерді «визуалды лексика» деп санауға болады, ол сілтеме болады, ал іздеу жүйесі суреттерді шығаруға байланысты болады).

Барлық кескіндер осы көрнекі тілмен көрнекі сөздер жиынтығы (VW) түрінде ұсынылатын болады немесе оны не деп атайды көрнекі сөздер сөмкесі

Анықтама 4: Көрнекі сөздер пакеті: [4] бұл кескіннің мағынасы (немесе оның бөліктері) туралы ақпарат бере алатын көрнекі сөздер жиынтығы.

Кескінді ұсынудың осы түріне сүйене отырып, біз сурет іздеу жүйесін жобалау үшін мәтінді іздеу әдістерін қолдана аламыз. Алайда, мәтінді іздеудің барлық жүйелері терминдерге тәуелді болғандықтан, пайдаланушының сұраныстарының суреттері жүйеде визуалды терминдер жиынтығына айналдырылуы керек. Содан кейін, бұл визуалды терминдерді мәліметтер базасындағы барлық визуалды терминдермен салыстырады.

Сондай-ақ қараңыз

Әдебиеттер тізімі

  1. ^ а б BAEZA-YATES, R. A .; RIBEIRO-NETO, B. A. (1999), Қазіргі заманғы ақпаратты іздеу, ACM Press Addison-Wesley
  2. ^ Салтон, Г. (1971), SMART іздеу жүйесі
  3. ^ ДжЮРИ, Ф .; TRIGGS, B. (2005), Көрнекі тану үшін тиімді код кітапшаларын құру
  4. ^ а б Ян, Джун; Цзян, Ю-Ганг; Ю-Ганг, Гауптманн; Нго, Чонг-Вах (2007), Көрнекі-сөздік көріністерді сахналық жіктеуде бағалау, Аугсбург, Бавария, Германия: ACM

Сыртқы сілтемелер